generated at
RAGサーベイ論文
論文情報
タイトル:A Survey on Retrieval-Augmented Text Generation for Large Language Models

発行日:2024年4月
著者:Yizheng Huang, Jimmy Huang
所属:York Univ


論文のポイント
RAGのワークフローは、検索前、検索後、生成 の各段階に分類できる
RAGのコア技術


論文を読んで感じたこと



概要

2.1 RAG の基本的なワークフロー
RAGの基礎的なワークフローは、外部ソースからなるインデックスを作成することから始まります。このインデックスは、特定のクエリに基づくリトリーバモデル を通じて、関連する情報を取得するための基礎となる。 最後のステップは、検索された情報をクエリと結合し て目的の出力を生成するジェネレータモデルを含む。


2.2 RAGパラダイム
RAGパラダイムは、ドメイン内の研究を整理し、LLMのパフォーマンスを向上させるためのシンプルでありながら堅牢なフレームワークを提供します。RAGの中心にあるのは検索メカニズムであり、高品質な結果を生成するために不可欠です。したがって、このパラダイムは、検索の観点から、事前検索、検索、事後検索、生成の4つの主要なフェーズで構成されています。単一ホップと複数ホップの両方の検索アプローチは、反復的な検索生成サイクルを含み、この4フェーズ構造に従います。図3は、RAGのコア技術の分類ツリーです。