Tag: vector storage

See all tags.

检索增强生成（RAG）是一种为 LLM 提供外部知识源的技术。它通过访问模型训练数据之外的信息，帮助提升 AI 回答的准确性。 SillyTavern 提供了一组工具，可以从多种来源构建多用途的知识库，并将收集到的数据用于 LLM 提示词。

扩展

聊天向量化

聊天向量化会在当前聊天记录中搜索与你最近消息看似相关的消息。它会临时将这些最相关的消息移动到聊天记录的开头或结尾。此操作发生在生成模型对你上一条消息的回复时。聊天记录开头和结尾的消息通常对模型的回复影响最大。因此，将相关消息移动到这些位置，有助于模型在回复时聚焦于相关信息。尤其是，聊天向量化能够找到那些在消息历史中位置过于靠后、无法放入请求上下文的相关消息。将这些消息移入上下文，可以为模型提供原本无法获取的信息。聊天向量化是一种检索增强生成（RAG）。检索增强生成通过在提示词中提供额外的相关信息，来提升模型生成回复的质量。