コンテンツにスキップ

Search Paradigm Notes

na-navi の個人学習帳。

テーマ

「RAG」と一言で言っても、その内部には全くレイヤーの異なる2つの検索パラダイムが混在している。

セマンティック検索 エージェンティック検索
レイヤー インデックス層 推論層
UX 上の位置 ユーザーにむき出し LLM の背後に隠れる
速度要求 ミリ秒単位が命 LLM レイテンシが支配的
最適化の主眼 インデックス構造・ベクトル精度 プロンプト設計・ツール選択
コスト感 最適化しないと即ボトルネック フルスキャンでも体感誤差

この違いを区別しないで議論すると「RAG は○○だ」「いや××だ」と噛み合わなくなる。

最終形態は両方のマージ — 高速 LLM が人間の意図を汲み取ってクエリ拡張を行い、検索を代行する形に収束するのは間違いない。だが現時点の技術水準では、ユーザーがその結果をどれだけ待てるかという UX の視点が抜けた議論は不毛である。

コンテンツ