<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>RAG on Jizuiba`s Blog</title><link>https://jizuiba.netlify.app/categories/rag/</link><description>Recent content in RAG on Jizuiba`s Blog</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sat, 28 Mar 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://jizuiba.netlify.app/categories/rag/index.xml" rel="self" type="application/rss+xml"/><item><title>RAG 检索优化</title><link>https://jizuiba.netlify.app/posts/rag-%E6%A3%80%E7%B4%A2%E4%BC%98%E5%8C%96/</link><pubDate>Sat, 28 Mar 2026 00:00:00 +0000</pubDate><guid>https://jizuiba.netlify.app/posts/rag-%E6%A3%80%E7%B4%A2%E4%BC%98%E5%8C%96/</guid><description>&lt;h2 id="检索优化是在干啥"&gt;检索优化是在干啥？&lt;/h2&gt;
&lt;p&gt;基础的 RAG 调用：&lt;/p&gt;
&lt;figure class="article-codeblock article-codeblock--text" data-code-language="text" style="--code-max-height: 32rem;"&gt;&lt;figcaption class="article-codeblock__header" aria-label="Code block tools"&gt;&lt;button
 type="button"
 class="article-codeblock__copy"
 data-copy-default="复制"
 data-copy-success="已复制"
 data-copy-error="失败"
 aria-label="复制"&gt;
 &lt;svg class="article-codeblock__copy-icon" width="14" height="14" viewBox="0 0 24 24" aria-hidden="true"&gt;
 &lt;rect x="9" y="9" width="13" height="13" rx="2" ry="2"&gt;&lt;/rect&gt;
 &lt;path d="M5 15H4a2 2 0 0 1-2-2V4a2 2 0 0 1 2-2h9a2 2 0 0 1 2 2v1"&gt;&lt;/path&gt;
 &lt;/svg&gt;
 &lt;span class="article-codeblock__copy-text"&gt;复制&lt;/span&gt;
 &lt;/button&gt;&lt;span class="article-codeblock__language" aria-label="Code language"&gt;text&lt;/span&gt;&lt;/figcaption&gt;&lt;div class="article-codeblock__body"&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;用户问题 → embedding → 向量检索 → top-k → 给 LLM&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;/div&gt;
 &lt;/figure&gt;&lt;p&gt;可能存在的问题：&lt;/p&gt;</description></item><item><title>RAG 相关的知识名词</title><link>https://jizuiba.netlify.app/posts/rag-%E7%9B%B8%E5%85%B3%E7%9A%84%E7%9F%A5%E8%AF%86%E5%90%8D%E8%AF%8D/</link><pubDate>Fri, 27 Mar 2026 00:00:00 +0000</pubDate><guid>https://jizuiba.netlify.app/posts/rag-%E7%9B%B8%E5%85%B3%E7%9A%84%E7%9F%A5%E8%AF%86%E5%90%8D%E8%AF%8D/</guid><description>&lt;h2 id="chunk分块"&gt;Chunk（分块）&lt;/h2&gt;
&lt;p&gt;&lt;strong&gt;是什么&lt;/strong&gt;：&lt;/p&gt;
&lt;p&gt;把长文档切一小段一小段，再做向量化存储。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;为什么需要它&lt;/strong&gt;&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;LLM 的上下文限制&lt;/li&gt;
&lt;li&gt;检索时需要“精准命中片段”而不是一整片文章&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;&lt;strong&gt;例如&lt;/strong&gt;：&lt;/p&gt;
&lt;p&gt;一篇10000字的文章 -&amp;gt; 切成：&lt;/p&gt;</description></item></channel></rss>