<汇港通讯> 小米集团(01810)AI实验室宣布,旗下Kaldi团队发布基於Flow Matching架构的ZipVoice系列语音合成(TTS)模型,包括ZipVoice(零样本单说话人语音合成模型)及ZipVoice-Dialog(零样本对话语音合成模型)。
据介绍,作为zipformer在语音生成任务上的应用和探索,ZipVoice解决了现有零样本语音合成模型的参数量大、合成速度慢的痛点,在轻量化建模和推理加速上取得了重要突破。
ZipVoice-Dialog则解决现有对话语音合成模型在稳定性和推理速度上的瓶颈,实现又快又稳又自然的语音对话合成。
此外,小米表示,未来团队将持续对ZipVoice系列模型进行优化,致力於让每一个人都能享受到低成本高质量的语音合成技术。 (JJ)
新闻来源 (不包括新闻图片): 汇港资讯