【RAG入門】社内データをAIに教える！検索拡張生成の仕組みと実装

はじめに

「ChatGPTに社内の就業規則について質問したい」「新製品のマニュアルに基づいて回答させたい」。このようなニーズを実現する技術がRAG (Retrieval-Augmented Generation / 検索拡張生成) です。

AIモデル自体を再学習（Fine-tuning）させることなく、外部のデータベースから知識を補完して回答させるこの技術は、現在、企業導入の現場で最も注目されています。

なぜRAGが必要なのか

Knowledge Cutoff

LLMの知識は「学習データに含まれていた時点」で止まっています。昨日のニュースや、あなたの会社の非公開情報は知りません。

無理やり答えさせようとすると、AIはもっともらしい嘘（ハルシネーション）をつきます。RAGは、あたかもカンニングペーパーを渡すように、「この資料を読んでから答えてね」と指示することで、正確で最新の回答を引き出します。

RAGのアーキテクチャ

RAGの実装は大きく2つのフェーズに分かれます。

1. indexing（準備）

ドキュメントを読み込み、検索しやすい形（ベクトル）に変換してデータベース（Vector Store）に保存します。

2. Retrieval & Generation（実行）

ユーザーの質問に関連するドキュメントを検索し、プロンプトに埋め込んでLLMに渡します。

シンプルな実装例

LangChainを使えば、わずか数行で実装できます。

from langchain_community.document_loaders import TextLoader
from langchain_chroma import Chroma
from langchain_openai import OpenAIEmbeddings

# 1. データの準備
loader = TextLoader("社内規定.txt")
documents = loader.load()

# 2. ベクトル化して保存
db = Chroma.from_documents(documents, OpenAIEmbeddings())

# 3. 検索して回答
query = "有給休暇の申請期限は？"
docs = db.similarity_search(query)
print(docs[0].page_content) # 関連する規定が表示される

RAGの課題（ハルシネーション対策）

RAGを使えば万能というわけではありません。「検索で見つからなかった場合」にAIが適当に答えてしまうリスクは残ります。

対策として、「提供されたコンテキスト情報のみに基づいて回答してください。分からない場合は『分かりません』と答えてください」といった強い制約をプロンプトに含めることが重要です。

まとめ

RAGは、AIを実用的な「業務アシスタント」に変える魔法の杖です。しかし、その精度は「データの質」と「検索アルゴリズム」に大きく依存します。

次回は、RAGのコアとなる技術「Vector Database（ベクトルデータベース）」の選び方と種類について解説します。

なんでも技術ブログ

このブログを検索