AllTalk TTS V2

AllTalk 是一款基于 Coqui XTTS、F5-TTS、VITS、Piper 及其它 TTS 模型引擎的语音克隆系统,旨在生成高质量的语音复刻(零样本语音克隆或内置语音)。在 AllTalk V2 中,多项重大更新增强了功能性与易用性,包括支持多种 TTS 引擎、更丰富的自定义选项以及性能优化。如需完整的功能列表,请参阅AllTalk Wiki


🟩 AllTalk V2 的主要功能

  • 多引擎支持:可在 Coqui XTTS、VITS、Piper、Parler、F5 及自定义引擎之间轻松切换。
  • 语音转换(RVC):增强的基于检索的语音克隆流水线。
  • 可自定义设置:可针对各引擎调整设置并保存启动配置。
  • 旁白功能:可为旁白和角色分别指定不同的语音。
  • 独立使用与集成使用:与 SillyTavern 无缝集成。
  • DeepSpeed 与低显存模式:为资源受限环境提供性能优化。
  • 截图:请参见 AllTalk V2 的界面此处

🟨 安装与设置选项

AllTalk 提供独立安装和集成安装两种方式。最快的安装方式是使用所提供的快速安装选项之一,相关脚本会自动完成大部分流程。

🟩 自动安装

此方法仅适用于 Windows 用户。 对于希望快速完成设置的新用户,自动安装使用 SillyTavern-Launcher。 注意:此方法假定你已安装 SillyTavern-Launcher。若尚未安装,请访问 https://github.com/SillyTavern/SillyTavern-Launcher 并按照 readme.md 文件中的说明进行安装。 安装好 SillyTavern-Launcher 后:

  1. 运行 Launcher.bat
  2. 进入:Home > Toolbox > App Installer > Voice Generation
  3. 选择标记为 Install AllTalk V2 的选项

🟩 手动安装

对于需要精细控制的高级用户,请按照手动安装指南在 Windows、Linux 或 Mac(未测试)上进行分步设置。

🟩 Google Colab 安装

对于不希望在本地安装的用户,可通过 Google Colab 安装在云端环境中运行 AllTalk。


🟨 在 SillyTavern 中使用 AllTalk

AllTalk 加载完成后,在 SillyTavern 的 TTS 页面中将其选中,并确保在设置中选择了正确的 AllTalk 服务器版本。

  • 设置管理:AllTalk 可能会根据你选择的配置启用或禁用某些特定设置。
  • 加载顺序:如果 SillyTavern 在 AllTalk 之前加载,请重新加载 TTS 扩展页面。
  • 性能优化:根据系统资源有选择性地启用 DeepSpeed 和低显存模式以提升性能。
  • 旁白功能:旁白功能的详细说明可在 AllTalk Wiki 上查阅。

SillyTavern AllTalk 扩展的完整详情将在 AllTalk 的 SillyTavern Wiki 页面上更新。

使用 TGWUI 版 AllTalk 扩展的 TGWUI 用户需要在 TGWUI 聊天界面中禁用 Enable TGWUI TTS,否则会生成重复的 TTS 音频。


🟨 故障排查

如果你遇到认为是 SillyTavern 中 AllTalk 特有的问题,请参阅 AllTalk 的 SillyTavern Wiki 页面获取最新信息。


🟪 支持、帮助与功能请求

如需进一步的帮助: