小米最新开源!覆盖600+语种方言声音克隆TTS,只需3-10秒声音,可控一键合成声音,超40倍速 OmniVoice

小米最新开源!覆盖600+语种方言声音克隆TTS,只需3-10秒声音,可控一键合成声音,超40倍速 OmniVoice-汇课新知资源网
小米最新开源!覆盖600+语种方言声音克隆TTS,只需3-10秒声音,可控一键合成声音,超40倍速 OmniVoice
此内容为付费资源,请付费后查看
R币9.9R币9.99
立即购买
您当前未登录!建议登陆后购买,可保存购买订单
付费资源
已售 999

小米最新开源!覆盖600+语种方言声音克隆TTS,只需3-10秒声音,可控一键合成声音,超40倍速 OmniVoice

OmniVoice 是一款最先进的大规模多语言零样本文本到语音(TTS)模型,支持超过 600 种语言。该模型基于一种新颖的扩散语言模型架构,能够以卓越的推理速度生成高质量语音,并支持语音克隆和声音设计。

图片[1]-小米最新开源!覆盖600+语种方言声音克隆TTS,只需3-10秒声音,可控一键合成声音,超40倍速 OmniVoice-启创网

软件特点

  • 超广语言覆盖:支持600+ 语言,零样本 TTS 中覆盖最广。
  • 零样本语音克隆:仅需3–10 秒参考音频,无需训练即可复刻音色,质量顶尖。
  • 自由语音设计:用文本指令控制性别、年龄、音高、口音 / 方言、耳语等,无需参考音。
  • 极速推理:RTF 低至0.025,比实时快40 倍,适合批量与实时场景。
  • 精细发音控制:支持笑声 / 叹气等非语言标记,支持拼音 / 音标强制纠音。
  • 架构简洁高效:扩散语言模型结构,兼顾音质、速度与扩展性。
  • 易用部署:一键启动 Web UI,已经制作好了离线整合包给大家使用,大家有需要的可以试试。
  • 完全开源:GitHub 开源,可本地部署(已经可以本地离线运行了)、二次开发与商用友好。

软件截图

图片[2]-小米最新开源!覆盖600+语种方言声音克隆TTS,只需3-10秒声音,可控一键合成声音,超40倍速 OmniVoice-启创网

图片[3]-小米最新开源!覆盖600+语种方言声音克隆TTS,只需3-10秒声音,可控一键合成声音,超40倍速 OmniVoice-启创网

------本页内容已结束,喜欢请分享------

感谢您的来访,获取更多精彩文章请收藏本站。

© 版权声明

THE END
喜欢就支持一下吧
点赞436 分享