小米最新开源！覆盖600+语种方言声音克隆TTS，只需3-10秒声音，可控一键合成声音，超40倍速 OmniVoice-汇课新知资源网

小米最新开源！覆盖600+语种方言声音克隆TTS，只需3-10秒声音，可控一键合成声音，超40倍速 OmniVoice

544字 3分钟 2026-04-10 站长发布 6918 该作者已发布74044篇文章

小米最新开源！覆盖600+语种方言声音克隆TTS，只需3-10秒声音，可控一键合成声音，超40倍速 OmniVoice

OmniVoice 是一款最先进的大规模多语言零样本文本到语音（TTS）模型，支持超过 600 种语言。该模型基于一种新颖的扩散语言模型架构，能够以卓越的推理速度生成高质量语音，并支持语音克隆和声音设计。

软件特点

超广语言覆盖：支持600+ 语言，零样本 TTS 中覆盖最广。
零样本语音克隆：仅需3–10 秒参考音频，无需训练即可复刻音色，质量顶尖。
自由语音设计：用文本指令控制性别、年龄、音高、口音 / 方言、耳语等，无需参考音。
极速推理：RTF 低至0.025，比实时快40 倍，适合批量与实时场景。
精细发音控制：支持笑声 / 叹气等非语言标记，支持拼音 / 音标强制纠音。
架构简洁高效：扩散语言模型结构，兼顾音质、速度与扩展性。
易用部署：一键启动 Web UI，已经制作好了离线整合包给大家使用，大家有需要的可以试试。
完全开源：GitHub 开源，可本地部署（已经可以本地离线运行了）、二次开发与商用友好。

软件截图

------本页内容已结束，喜欢请分享------

感谢您的来访，获取更多精彩文章请收藏本站。

版权声明 1本网站名称：汇课新知资源网
2本站永久网址：https://www.hkxz688.cn
3本站文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系客服微信：cr20085555 进行删除处理。
4本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向客服举报
6本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。