コンテンツにスキップ

Agentic RAG surveys: reasoning と retrieval を往復する RAG

Verified license

  • License: CC BY 4.0 for Li et al. 2025 checked here
  • 検証日: 2026-05-24
  • 検証方法: pwsh -NoProfile -File scripts/check-arxiv-license.ps1
  • このページの掲載モード: full-text-allowed

書誌情報

  • Original paper: Towards Agentic RAG with Deep Reasoning: A Survey of RAG-Reasoning Systems in LLMs
  • Authors: Yangning Li, Weizhi Zhang, Yuyao Yang, Wei-Chieh Huang, Yaozu Wu, Junyu Luo, Yuanchen Bei, Henry Peng Zou, Xiao Luo, Yusheng Zhao, Chunkit Chan, Yankai Chen, Zhongfen Deng, Yinghui Li, Hai-Tao Zheng, Dongyuan Li, Renhe Jiang, Ming Zhang, Yangqiu Song, Philip S. Yu
  • arXiv: https://arxiv.org/abs/2507.09477
  • 関連: 2025 年以降、Agentic RAG / reasoning RAG の survey が増えている。このページではまず CC BY 4.0 が確認できた survey を中心に読む。

何の論文か

RAG と reasoning / agentic workflow を統合して整理するサーベイ。単発 retrieval ではなく、LLM が検索、読解、追加検索、検証、回答生成を反復するシステムを扱う。

この流れでは、retrieval は一回の前処理ではなく、推論途中に何度も呼ばれる tool になる。

3つの見方

このサーベイは、RAG と reasoning の関係を大きく次のように整理して読むとよい。

  1. Reasoning-enhanced RAG: retrieval pipeline の各段階を reasoning で改善する
  2. RAG-enhanced reasoning: 推論に必要な前提・証拠を retrieval で補う
  3. Synergized / agentic RAG-reasoning: 検索と推論を反復的に組み合わせる

このプロジェクトで読む理由

このサイトの中心テーマは、セマンティック検索とエージェンティック検索のレイヤー差。

Agentic RAG はまさにその差が見える題材。

  • セマンティック検索: index に対して高速に top-k を返す
  • Agentic RAG: 何を検索するか、いつ追加検索するか、どの証拠を信用するかを LLM が制御する
  • 実用 UX: LLM の推論 latency が支配的になりやすい
  • ただし各 retrieval call の品質は index / retriever に依存する

つまり「検索そのものの高速化」と「検索を使う推論戦略」は別問題だが、実システムでは接続される。

実用システムでの設計論点

1. retrieval call の回数

Agentic RAG は検索を複数回呼ぶため、1 回あたりの latency が小さくても合計で効く。LLM 推論が支配的とはいえ、検索を 10 回呼ぶなら index の遅さは無視できない。

2. query rewriting / decomposition

LLM が元質問を分解し、サブクエリを作る。HyDE のような query expansion とも近いが、agentic では途中結果に応じてクエリが変わる。

3. evidence management

取得文書をただ context に詰めるのではなく、証拠の重複、矛盾、出典、時点を管理する必要がある。

4. stopping condition

いつ検索をやめて回答するかが難しい。検索しすぎると遅い。少なすぎると根拠不足になる。

5. evaluation

単発 retrieval の recall@k だけでは不十分。trajectory 全体、最終回答、根拠の妥当性、コスト、latency を見る必要がある。

インデックスとの関係

Agentic RAG では LLM orchestration が目立つが、下層の retriever は依然として必要。

  • 少量 corpus: Flat search でもよい
  • 大規模 corpus: HNSW / IVF / PQ の選定が必要
  • exact match が重要: BM25 / SPLADE / hybrid が必要
  • multi-hop: recall を高めに取り、rerank / evidence selection で絞ることが多い

「エージェントだから index はどうでもいい」ではなく、UX 上の主ボトルネックが LLM に移る、という理解が正確。

読むときの注意

2025 年以降の Agentic RAG は発展が速く、survey も頻繁に更新される。用語も固定されていない。

  • Agentic RAG
  • Reasoning RAG
  • RAG-reasoning systems
  • multi-hop RAG
  • iterative retrieval
  • tool-using retrieval agents

これらは重なりつつも、論文ごとに射程が違う。

Attribution

  • Original paper: Towards Agentic RAG with Deep Reasoning: A Survey of RAG-Reasoning Systems in LLMs
  • Authors: Yangning Li, Weizhi Zhang, Yuyao Yang, Wei-Chieh Huang, Yaozu Wu, Junyu Luo, Yuanchen Bei, Henry Peng Zou, Xiao Luo, Yusheng Zhao, Chunkit Chan, Yankai Chen, Zhongfen Deng, Yinghui Li, Hai-Tao Zheng, Dongyuan Li, Renhe Jiang, Ming Zhang, Yangqiu Song, Philip S. Yu
  • Source: https://arxiv.org/abs/2507.09477
  • License: CC BY 4.0
  • Changes: Japanese study commentary, system-design notes, summary framing, and formatting were added by the maintainer of this notebook.
  • Disclaimer: This is an unofficial study note. No endorsement by the original authors is implied.