検索拡張生成 (RAG)(Retrieval-Augmented Generation)
検索拡張生成(Retrieval-Augmented Generation, RAG)は、LLM の生成プロセスに外部知識ベースの検索結果を統合する手法。
概要
ユーザーの質問に対し、まず関連ドキュメントを検索し、その内容をプロンプトに含めて LLM に渡すことで、学習時点の知識制限や事実誤認(hallucination)を緩和する。
主要構成要素
- Retriever: クエリに応じてベクトル DB / 検索エンジンから関連文書を取得
- Generator: 検索結果と質問を入力に最終的な回答を生成する LLM
- Embeddings: 文書とクエリを同じベクトル空間に写像