SillyTavern Documentation
  • GitHub
  • Discord
  • Reddit
Powered by

Tag: vector storage

See all tags.

用法 • 角色
数据银行 (RAG)

检索增强生成(RAG)是一种为 LLM 提供外部知识源的技术。它通过访问模型训练数据之外的信息,帮助提升 AI 回答的准确性。 SillyTavern 提供了一组工具,可以从多种来源构建多用途的知识库,并将收集到的数据用于 LLM 提示词。

扩展
聊天向量化

聊天向量化会在当前聊天记录中搜索与你最近消息看似相关的消息。它会临时将这些最相关的消息移动到聊天记录的开头或结尾。此操作发生在生成模型对你上一条消息的回复时。 聊天记录开头和结尾的消息通常对模型的回复影响最大。因此,将相关消息移动到这些位置,有助于模型在回复时聚焦于相关信息。 尤其是,聊天向量化能够找到那些在消息历史中位置过于靠后、无法放入请求上下文的相关消息。将这些消息移入上下文,可以为模型提供原本无法获取的信息。 聊天向量化是一种检索增强生成(RAG)。检索增强生成通过在提示词中提供额外的相关信息,来提升模型生成回复的质量。

© Copyright 2026. All rights reserved.