Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks¶

Verified license

書誌情報¶

Authors: Patrick Lewis, Ethan Perez, Aleksandra Piktus, Fabio Petroni, Vladimir Karpukhin, Naman Goyal, Heinrich Küttler, Mike Lewis, Wen-tau Yih, Tim Rocktäschel, Sebastian Riedel, Douwe Kiela
Venue: NeurIPS 2020
arXiv: https://arxiv.org/abs/2005.11401

RAG の原論文。生成モデルのパラメータ内知識だけに頼るのではなく、外部コーパスを dense vector index として持ち、検索された文書を条件に生成する枠組みを示した。

この論文で重要なのは、RAG を単なる「検索してプロンプトに貼る」実装パターンではなく、parametric memory と non-parametric memory を組み合わせるモデル設計として定式化した点。

RAG には、取得文書の扱い方によって複数の変種がある。大づかみに言うと、同じ文書集合を使って一貫して生成するか、生成トークンごとに文書の寄与を混ぜるか、という違いがある。

このサイトの主張では、セマンティック検索とエージェンティック検索はレイヤーが違う。RAG 原論文は、その混同をほどく起点になる。

RAG という言葉が広がった結果、「検索」「DB」「プロンプト」「エージェント」が一語に畳まれがちだが、原論文に戻ると memory architecture としての構造が見えやすい。

現在の RAG 実装では、論文中の dense vector index に相当する部分が、FAISS / Milvus / Weaviate / Qdrant / pgvector / Elasticsearch などの検索基盤に置き換わる。

このとき DB 選定に効くのは以下。

つまり RAG は LLM アプリの話であると同時に、検索システムの話でもある。

Original paper: Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
Authors: Patrick Lewis, Ethan Perez, Aleksandra Piktus, Fabio Petroni, Vladimir Karpukhin, Naman Goyal, Heinrich Küttler, Mike Lewis, Wen-tau Yih, Tim Rocktäschel, Sebastian Riedel, Douwe Kiela
Source (read here): https://arxiv.org/abs/2005.11401 · https://ar5iv.labs.arxiv.org/html/2005.11401 · https://arxiv.org/pdf/2005.11401
License: arXiv non-exclusive (第三者再配布の許諾なし)
このページに含まれるもの: 自分の要約・解説、AIとの対話メモ、4要件を満たす短い引用のみ。
このページに含まれないもの: 原文全文、原文の段落単位コピー、全文翻訳、図表転載。
Disclaimer: This is an unofficial study note. No endorsement by the original authors is implied.