在用手机看小说或长文时,我们通常面临两个痛点:一是系统自带的 TTS(文字转语音)发音机械、没有感情;二是优秀的 AI 语音往往依赖云端服务,不仅需要时刻保持联网,还存在隐私泄露的风险和高昂的 API 调用成本。
今天介绍的开源项目 CloneTTS(由开发者 sipeter 在 GitHub 开源),就是为了彻底解决这些痛点而生的。它是一款完全运行在安卓本地的轻量级 TTS 引擎,让“万物皆可发声”变得触手可及。

核心优势:为什么选择 CloneTTS?
CloneTTS 之所以能在众多 TTS 工具中脱颖而出,核心在于它将复杂的 AI 大模型推理塞进了手机本地,并提供了极高的自由度。
1. 极致的本地化与隐私保护
与市面上绝大多数依赖云端服务器的克隆工具不同,CloneTTS 的所有文本解析和语音合成计算全部在设备本地完成。这意味着:
- 断网可用: 在地铁、飞机等无信号场景下依然能流畅听书。
- 绝对隐私: 你的文本和音频数据不会被收集、存储或上传至任何服务器。
2. 3 秒极速语音克隆
你不再需要去录音棚录制几个小时的干音。只需提供 1 到 3 秒的干净语音片段,CloneTTS 就能在手机本地提取声纹,创建一个专属的自定义音色。无论是克隆你喜欢的配音演员,还是用你自己的声音给孩子读睡前故事,都能轻松实现。
3. 专业级发音规则定制
遇到多音字或特殊人名总是读错?CloneTTS 提供了底层干预能力。你可以通过添加纯文本或 正则表达式(Regex) 替换规则,精准纠正错音,这对于网文读者来说是极大的体验提升。
听书神器:如何接入“开源阅读(Legado)”
CloneTTS 最基础也是最强大的用法,就是作为系统级 TTS 引擎,无缝接管手机里的第三方阅读软件。
- 设置默认引擎: 在安卓手机的“设置”中搜索“TTS 设置”(或文字转语音输出),将首选引擎更改为 CloneTTS。
- 首次初始化: 第一次启动 CloneTTS 客户端时,App 会在后台解压 AI 模型数据,只需耐心等待几秒钟。
- 添加音色: 在 CloneTTS 的“Voices”标签页,点击右上角菜单选择“Add Voice”,录入或导入你想克隆的声音。
- 开始听书: 打开“开源阅读(Legado)”或“静读天下(Moon+ Reader)”,点击朗读。CloneTTS 支持 0.5x 到 2.0x 的无级变速,以及 0% 到 200% 的音量增强。
极客进阶:本地 HTTP API 调用
如果你不仅是一个读者,还是一个喜欢折腾代码、写自动化脚本或开发博客插件的开发者,CloneTTS 同样提供了强大的可玩性。
CloneTTS 内置了稳定的 本地 HTTP API 服务,支持 GET 和 POST 请求(支持 application/x-www-form-urlencoded 和 application/json),完美对接外部工具。
API 核心能力:
- 角色扮演(Role-Based TTS): 你可以为不同的音色设置唯一的
Alias(别名)。通过 API 调用时,只需传入对应的别名,就能让外部应用动态切换音色,实现类似广播剧的多角色配音效果。 - 默认通道: 在 v0.6.0 及以上版本中,调用
/api/legado/default接口,可以始终跟随 App 内当前选中的默认音色进行合成,免去频繁修改配置的烦恼。 - 性能监控: 对于需要评估设备算力的开发者,CloneTTS 提供了实时 RTF(Real-Time Factor)监控控制台。开启日志后,你可以精确查看每一个音频块的推理延迟,帮助你优化前端调用逻辑。
结语
无论是为了追求极致听书体验的普通用户,还是需要稳定、免费本地语音接口的开发者,CloneTTS 都交出了一份令人满意的答卷。它将前沿的语音克隆技术真正下放到了每个人的口袋里。
资源下载
GitHub:https://github.com/sipeter/CloneTTS/releases/
Google Play:https://play.google.com/store/apps/details?id=com.sipeter.clonetts