RAG関連記事まとめ:基礎からOllama×ChromaDB実装、LangChain整理まで

RAG関連記事10本を、役割ごとに整理し、最短で理解と実装に到達できる導線をまとめました。

まず押さえるべきRAGの全体像

RAGとは何か:LLM単体の限界を超えて「自分のデータ」で答えさせる方法

RAGの「Retrieve→Augment→Generate」を最短で整理し、LLM単体の限界と、外部知識を参照して精度を上げる発想をつかむための記事です。

パレイド
RAGとは何か:LLM単体の限界を超えて「自分のデータ」で答えさせる方法
RAG(Retrieval Augmented Generation)は、LLMの外に知識ベースを置き、必要な情報を検索してから回答させる仕組みです。LLM単体の弱点(知識が固定…

知識ベース側を固める(Vector DBとチャンク設計)

Chroma DBとは?Python定番ベクトルDBを試す

RAGの土台になるVector DBの役割を、Chroma DBを例に理解する記事です。RAGの前段で何を準備しているのかが腹落ちします。

パレイド
Chroma DBとは?Python定番ベクトルDBを試す
RAGでは、ユーザーからの質問に答える際に、まず知識ベースから関連情報を「検索(Retrieval)」し、その情報を基にLLMが「生成(Generation)」…

MarkdownをRAGで扱う知識ベースとして活用する方法

Markdownを知識ベースにする際の、構造を壊さないチャンク分割と扱い方を整理しています。自サイト記事やメモ(Obsidian等)をRAG化したい人に直結します。

パレイド
MarkdownをRAG(検索拡張生成)で扱う知識ベースとして活用する方法
MarkdownコンテンツをRAGシステムで効率よく検索・生成に使うためのチャンク分割と構造保持のベストプラクティスを、最新情報に基づいて解説します。

書籍データをRAG検索の題材とする実例:青空文庫より『遠野物語』

実装の前に、題材テキストを「RAGで検索しやすい形」に整える考え方を示した記事です。以降の“語り部RAG”シリーズの前提にもなっています。

パレイド
青空文庫『遠野物語』をRAG検索の題材とする実例
青空文庫『遠野物語』を題材に、RAGで使いやすいテキスト構造へ整形する前処理を解説します。

まず動く最小実装(Ollama×ChromaDB)

PythonでRAGを実装:Ollama(llama3.1)+Chroma DBで“検索して答える”

PythonからRAGを試す最短ルートとして、OllamaとChroma DBで「検索して答える」最小構成に到達する記事です。まず動かして挙動を掴みたい場合に最適です。

パレイド
PythonでRAGを実装:Ollama(llama3.1)+Chroma DBで“検索して答える”
PythonからRAGを試す最短ルートとして、Ollamaのllama3.1とChroma DBで「ユーザー側検索→LLM生成」を実装します。動く最小コードと、つまずきやすいA…

OllamaのEmbeddingモデルを使う方法(Python + Chroma DB)

Embeddingを自前で用意し、Chroma DBに載せて検索する流れを丁寧に分解しています。RAGが「なぜベクトル化するのか」を実装から理解できます。

パレイド
OllamaのEmbeddingモデルを使う方法(Python + Chroma DB)
OllamaのEmbeddingモデルをPythonで実装し、Chroma DBで検索・RAGに利用する手順をわかりやすく解説します。

function callingで「検索判断」と「検索実行」を分ける

OllamaのFunction CallingでRAGを実装する方法(Python+Chroma DB)

function callingを使い、LLMに「検索するか/何で検索するか」を判断させる考え方を整理した記事です。検索の入口をLLMに任せる設計の基本を押さえられます。

パレイド
OllamaのFunction CallingでRAGを実装する方法(Python+Chroma DB)
OllamaのEmbedding+ChromaDB構成を土台に、Function Callingを使ったRAG実装の考え方と最小構成を解説します。

llama3.1 と gpt-oss で役割分離したRAG実装 ─ function calling と生成を分ける

function callingは軽量モデル、生成は重いモデル、という役割分離の実例です。特に「重い生成モデルを別マシンのOllamaで回す」設計の出発点になります。

パレイド
llama3.1 と gpt-oss で役割分離したRAG実装 ─ function calling と生成を分ける
function calling を llama3.1:8b、文章生成を gpt-oss:20b に分担する RAG 実装と、その設計意図を解説します。

RAGの回答品質を上げる実装パターン(“語り部”)

RAGにより物語をAIに語らせる実装ポイント

RAG結果の最上位だけで終わらせず、題目(theme)に属する関連チャンクも追加して文脈を厚くする工夫を解説しています。単なるQ&Aより「流れ」を重視したいときに効きます。

パレイド
Ollama×ChromaDBで「語り部」を作る:RAGにより「遠野物語」をAIに語らせる実装ポイント
Ollamaの埋め込みとChromaDB検索で遠野物語を「語り部」として回答させつつ、最上位結果の題目(theme)に属するチャンクも追加して文脈を厚くする実…

LangChainで整理して拡張しやすくする

RAG実装をLangChainでリファクタリングする方法とポイント

前段の「検索判断(LLM)/検索実行(アプリ)/生成(Chain)」という意味を変えずに、LangChainで構造を整理する記事です。今後の拡張や差し替えに備えて、実装の見通しを良くしたい場合の到達点になります。

パレイド
RAG実装をLangChainでリファクタリングする方法とポイント
既存のRAG実装を拡張しやすくするために、LangChainを使った実装方法と注意点を解説します。

まとめ

まず「RAGの全体像」を掴み、次に「Chromaとチャンク設計」で土台を作り、その後に「最小実装→function calling→役割分離→語り部→LangChain整理」と進むのがスムーズです。

迷ったら、最初は「RAGとは何か」と「PythonでRAGを実装」を読み、動く状態を作ってから残りを戻るのがおすすめです。

パレイド
OllamaでローカルVLを試す|無料LLMで画像認識とAPI自動化の可能性
前回試したOCR機能ではテキストの抽出は可能ですが、画像そのものを理解することはできません。 ChatGPTのようなクラウド型AIに画像を見せれば認識し…
パレイド
VSCodeでOllamaを呼び出す:拡張機能Cotinueを利用する方法
導入:ローカルAIで開発効率を高める クラウドに頼らず、手元のマシンで大規模言語モデル(LLM)を動かせる環境として注目されているのが Ollama で…
パレイド
Stable Diffusion WebUI Forgeを手動で導入する手順 Windows/Mac
Stability Matrixに頼らず、Stable Diffusion ForgeをWindowsとMacに手動インストールする手順を、環境準備から更新方法・トラブルシュートまでまと…
[NEXT] TECH · 其の4250
Stable Audio 3 Medium を RTX 4070 + ComfyUI で動かす|380 秒生成と VRAM 崖の現在地
[NEXT] TECH · 其の4203
Anima Base v1.0 と Turbo LoRA を比べる — M5 Air で 7-8 倍、ただし同 seed でも別の画が出る