【Self-RAG】「自分の仕事を変だと思えるか」メタ認知を持つAIエンジニアリング

はじめに：伸びる部下、伸びない部下の違い

長年マネージャーをやっているとわかります。伸びる部下は、提出前に「これ、論理飛躍してないか？」と自分でチェックできる（メタ認知が高い）。伸びない部下は、書いたものをそのまま持ってきて「違います」と突っ返される。
AIも同じです。生成した答えをそのまま垂れ流すAIは、もう古い。これからのトレンドは、「自分で自分の回答を採点し、ダメならやり直す」AI、すなわち Self-RAG です。

基礎知識：Self-RAG（自己反省型RAG）の仕組み

通常のRAGは一方通行（Retrieve -> Generate）ですが、Self-RAGはループします。
1. ドキュメントを検索する。
2. そのドキュメントが「質問に関連しているか」を自己評価する。
3. 回答を生成する。
4. 生成した回答が「ドキュメントと矛盾していないか（幻覚ではないか）」を自己評価する。
5. NGなら、検索クエリを変えてやり直す。

この「自己批判プロセス」を組み込むことで、回答精度が劇的に向上します。

実装・設定：LangGraphで「書き直しループ」を作る

これを実装するには、フロー制御が得意な LangGraph が最適です。

# ノード定義（採点者）
grade_documents = RunnableLambda(lambda x: grader_model.invoke(x))

# 条件分岐（エッジ）
def decide_to_generate(state):
    if state["score"] == "yes":
        return "generate"
    else:
        return "rewrite_query" # 検索ワードを変えてやり直し！

workflow.add_conditional_edges("grade", decide_to_generate)

このロジックを入れるだけで、AIは「うーん、この資料じゃ答えられないな、別の言葉で検索してみよう」と、粘り強く答えを探すようになります。

応用テクニック：Hallucination Graderの実装

「回答が事実に即しているか」を判定する専用のプロンプトを用意しましょう。
「以下の回答は、参照ドキュメントの内容のみに基づいていますか？ YES/NO」というシンプルな採点者を一人置いておくだけで、嘘をつく確率を大幅に下げられます。

トラブルシューティング：無限ループという名の残業地獄

注意点として、真面目すぎるAIは「完璧な答えが見つかるまで永遠に検索し続ける」ことがあります。
必ず recursion_limit（最大ループ回数）を設定しましょう。人間と同じで、いつまでも悩み続けるよりは、「現時点ではわかりませんでした」と報告する勇気も必要です。

まとめ：AIに「自律」を教える面白さ

Self-RAGの実装は、まるで新人教育のようです。「提出前に一度読み返してごらん？」と教えるプロセスそのものです。
手のかかる子ほど可愛いと言いますが、自分で考えて修正できるようになったAIを見ると、エンジニアとしての親心が満たされますよ。

なんでも技術ブログ

このブログを検索