Agentic RAG surveys: reasoning と retrieval を往復する RAG¶
Verified license
- License: CC BY 4.0 for Li et al. 2025 checked here
- 検証日: 2026-05-24
- 検証方法:
pwsh -NoProfile -File scripts/check-arxiv-license.ps1 - このページの掲載モード: full-text-allowed
書誌情報¶
- Original paper: Towards Agentic RAG with Deep Reasoning: A Survey of RAG-Reasoning Systems in LLMs
- Authors: Yangning Li, Weizhi Zhang, Yuyao Yang, Wei-Chieh Huang, Yaozu Wu, Junyu Luo, Yuanchen Bei, Henry Peng Zou, Xiao Luo, Yusheng Zhao, Chunkit Chan, Yankai Chen, Zhongfen Deng, Yinghui Li, Hai-Tao Zheng, Dongyuan Li, Renhe Jiang, Ming Zhang, Yangqiu Song, Philip S. Yu
- arXiv: https://arxiv.org/abs/2507.09477
- 関連: 2025 年以降、Agentic RAG / reasoning RAG の survey が増えている。このページではまず CC BY 4.0 が確認できた survey を中心に読む。
何の論文か¶
RAG と reasoning / agentic workflow を統合して整理するサーベイ。単発 retrieval ではなく、LLM が検索、読解、追加検索、検証、回答生成を反復するシステムを扱う。
この流れでは、retrieval は一回の前処理ではなく、推論途中に何度も呼ばれる tool になる。
3つの見方¶
このサーベイは、RAG と reasoning の関係を大きく次のように整理して読むとよい。
- Reasoning-enhanced RAG: retrieval pipeline の各段階を reasoning で改善する
- RAG-enhanced reasoning: 推論に必要な前提・証拠を retrieval で補う
- Synergized / agentic RAG-reasoning: 検索と推論を反復的に組み合わせる
このプロジェクトで読む理由¶
このサイトの中心テーマは、セマンティック検索とエージェンティック検索のレイヤー差。
Agentic RAG はまさにその差が見える題材。
- セマンティック検索: index に対して高速に top-k を返す
- Agentic RAG: 何を検索するか、いつ追加検索するか、どの証拠を信用するかを LLM が制御する
- 実用 UX: LLM の推論 latency が支配的になりやすい
- ただし各 retrieval call の品質は index / retriever に依存する
つまり「検索そのものの高速化」と「検索を使う推論戦略」は別問題だが、実システムでは接続される。
実用システムでの設計論点¶
1. retrieval call の回数¶
Agentic RAG は検索を複数回呼ぶため、1 回あたりの latency が小さくても合計で効く。LLM 推論が支配的とはいえ、検索を 10 回呼ぶなら index の遅さは無視できない。
2. query rewriting / decomposition¶
LLM が元質問を分解し、サブクエリを作る。HyDE のような query expansion とも近いが、agentic では途中結果に応じてクエリが変わる。
3. evidence management¶
取得文書をただ context に詰めるのではなく、証拠の重複、矛盾、出典、時点を管理する必要がある。
4. stopping condition¶
いつ検索をやめて回答するかが難しい。検索しすぎると遅い。少なすぎると根拠不足になる。
5. evaluation¶
単発 retrieval の recall@k だけでは不十分。trajectory 全体、最終回答、根拠の妥当性、コスト、latency を見る必要がある。
インデックスとの関係¶
Agentic RAG では LLM orchestration が目立つが、下層の retriever は依然として必要。
- 少量 corpus: Flat search でもよい
- 大規模 corpus: HNSW / IVF / PQ の選定が必要
- exact match が重要: BM25 / SPLADE / hybrid が必要
- multi-hop: recall を高めに取り、rerank / evidence selection で絞ることが多い
「エージェントだから index はどうでもいい」ではなく、UX 上の主ボトルネックが LLM に移る、という理解が正確。
読むときの注意¶
2025 年以降の Agentic RAG は発展が速く、survey も頻繁に更新される。用語も固定されていない。
- Agentic RAG
- Reasoning RAG
- RAG-reasoning systems
- multi-hop RAG
- iterative retrieval
- tool-using retrieval agents
これらは重なりつつも、論文ごとに射程が違う。
Attribution¶
- Original paper: Towards Agentic RAG with Deep Reasoning: A Survey of RAG-Reasoning Systems in LLMs
- Authors: Yangning Li, Weizhi Zhang, Yuyao Yang, Wei-Chieh Huang, Yaozu Wu, Junyu Luo, Yuanchen Bei, Henry Peng Zou, Xiao Luo, Yusheng Zhao, Chunkit Chan, Yankai Chen, Zhongfen Deng, Yinghui Li, Hai-Tao Zheng, Dongyuan Li, Renhe Jiang, Ming Zhang, Yangqiu Song, Philip S. Yu
- Source: https://arxiv.org/abs/2507.09477
- License: CC BY 4.0
- Changes: Japanese study commentary, system-design notes, summary framing, and formatting were added by the maintainer of this notebook.
- Disclaimer: This is an unofficial study note. No endorsement by the original authors is implied.