我要投稿

363 Star！开箱即用的增强版 ChatTTS 一键整合包

发布日期：2024-08-14 08:48:46 浏览次数： 3145

作者：三金得鑫

微信搜一搜，关注“三金得鑫”

上一篇玩儿了一下 AI 语音大模型 ChatTTS，从部署到使用再到接入 Dify（虽然能接入，但是只能展示生成的文件路径）整个过程都很顺畅。

不过在部署上，前置准备工作还是有一些多的，要安装各种依赖、拉取项目源代码以及创建并激活虚拟环境等等。为了方便部署，就有大佬开发了一款 ChatTTS 本地离线整合包并开源到了 Github 上——ChatTTS-Enhanced。

Github 地址：https://github.com/CCmahua/ChatTTS-Enhanced

在 ChatTTS-Enhanced 项目中提供了不同系统（Windows 和 MacOS）的安装包，只要傻瓜式进行安装即可。

安装后双击打开，就可以快速启动增强版的 ChatTTS 了～～

目前已经更新到了 V3 版本，这个版本中的亮点如下：

音质增强/降噪解决Chat-TTS生成时的噪音问题。
支持多TXT、SRT文件批量处理。
支持长文本处理，支持中英混读。可自定义切割长度。
支持导出srt文件。
支持调节语速、停顿、笑声、口语化程度等参数。
支持导入ChatTTS Speaker音色。详情看帮助。
支持储存音色配置与选项配置。方便管理。

那长文本效果具体如何呢？我们一起来听一下：

【重磅】一键接入扣子、Dify，FastGPT等开发平台

企业内部AI 先行者已通过扣子、Dify 等智能体开发平台积极探索 "人 + AI" 的效率革新。这些应用大多局限于小范围应用，基于此，我们打造一款开箱即用的 AI 门户-53AI Hub，让企业实现从 "场景级效率优化" 到 "企业级生产力重构" 的跨越....

有一些杂音，这是因为没有开启音质增强，开启之后杂音基本就没有了。

关于音色来说，如果我们想指定一个音色进行生成，可以先到音色库（https://modelscope.cn/studios/ttwwwaa/ChatTTS_Speaker）中找一个比较中意的，然后下载对应的 pt 文件：

将下载好的文件在这里进行上传即可：

这一版本的整合包需要以下配置才可以运行：

Windows: 需要 Win10/11，支持 CPU 和 GPU
MacOS:不管是 M 芯片还是 Intel 芯片，系统版本必须在 10.13 以上

显存在不开启音频增强的情况下需要最低 4G 的配置，对于 Mac 来说，作者目前只做了 CPU 的适配，因为显存这块说是还有些问题。

如果自身及其配置比较低，作者还贴心的提供了云端一键部署的功能，感兴趣的朋友可以在 B 站搜索「嘟嘟实验室」，除了语音整合包之外，还有其他很多好玩儿的整合包。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-05-27

盘点 Azure AI Foundry 的10大重要更新

2025-05-27

50个AI基础常识问答（看完理解整个AI行业）

2025-05-27

AI时代下的软件升级：大模型如何让考勤系统听懂人话？

2025-05-27

美团要开放AI编程能力，将推出新产品NoCode｜智能涌现独家

2025-05-26

万字长文！AI智能体全面爆发前夜：一文讲透技术架构与行业机会

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

大家都在问

AI时代下的软件升级：大模型如何让考勤系统听懂人话？

2025-05-27

AI搜索+DeepResearch=？

2025-05-26

大模型 Agent 就是文字艺术吗？

2025-05-23

今天的Agent，就是十年前的小程序？

2025-05-23

从Agent到Agentic AI：大语言模型真的在向"智能体"进化吗？

2025-05-23

震惊，大模型推理的两个阶段，速度竟然相差140倍！一个实验告诉你为什么大模型推理时需要PD分离？

2025-05-18

推理大模型与普通大模型的区别是什么？

2025-05-18

2025AI 圈的 “新物种”：MCP、Fellou、Manus、Browser等都是啥？和纯AI大模型有何区别？如何选？

2025-05-17

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部