RAG 系统的工作原理以及它如何解决上述幻觉：

arzina221 · Post by **arzina221** » Sun Jan 26, 2025 4:07 am

假设有客户询问我们的名称服务器是什么。LLM 的知识库中没有这些确切的信息，但它知道名称服务器的默认形式，因此它会自信地回答：“正确的 Hostinger 名称服务器是 ns1.hostinger.com、ns2.hostinger.com、ns3.hostinger.com 和 ns4.hostinger.com。请在注册域名的平台的域名管理部分中更新这些内容。”

同时，我们的名称服务器是 ns1.dns-parking.com 和 ns2.dns-parking.com。

我们有一个RAG 系统来控制幻觉。它根据相似性从矢量数据库中提取文档，并将其交给助手作为参考，以指导助手生成响应。

温度控制通过管理人工智能的创造力来减少不准确性：设置越接近 1，响应就越有创意；越接近零，响应就越确定。换句话说，如果你将温度设置为接近 1，由于概率分布，即使是相同的问题，答案也几乎永远不会匹配。

尽管在某些情况下可能会有益，但将温度设置为接近 1 会增加不准确的可能性。

RAG系统架构。
该方案说明了整个过程，将其分解为系统的、相互关联的组成部分，这些组成部分共同作用以提供丰富的、符合情境的响应。

该过程从我们的数据来源开始，其中包括各种数据存储库、数据库甚至网站数据。嵌入过程将这些原始数据转换为密集的矢量表示，从而捕获内容的语义含义。
然后，将数据嵌入到向量（数据的数字语义摘要）和元数据（即上下文信息，例如来源、时间戳或类别）中。
我们将向量和元数据存储在向量数据库中，该数据妈妈电话号码数据库旨在处理大规模复杂数据。我们使用 Milvus。索引过程包括：
元数据索引——为元数据创建可搜索的索引。
向量索引—— 创建索引以快速找到相似的向量。
当收到查询时，无论是元数据还是文本，系统都会将其转换为矢量格式。这样可以轻松进行比较。
然后，矢量数据库使用近似最近邻 (ANN) 搜索等技术来快速找到最相似的矢量及其相关元数据。
这些检索到的相关文档和信息为LLM提供了背景，并通过精确、上下文丰富的信息增强了其响应。
此过程可确保 LLM 提供更具信息性、最新性和情境感知性的答案，从而提高整体交互质量。
利用法学硕士学位改进人工智能助手
数据分析在提高 AI 聊天助手的质量方面发挥着关键作用。通过详细分析日志和 LLM 响应，我们可以准确了解哪里出了问题以及需要改进的地方。我们手动和使用 LLM 自动完成此操作。

我们将对话分为不同主题，以便团队可以评估客户最常问的问题，确定 Kodee 能回答好哪些问题，以及确定哪些问题需要改进。

我们还聘请 LLM 来评估 Kodee 的答案及其准确性、完整性、语气和参考资料。借助 GPT 比较功能，我们评估 Kodee 的答案，并根据我们的标准将其与现场代理提供的答案进行比较。我们还添加了其他步骤来验证参考资料。