Nari Labs 刚刚发布了一个开源TTS(文本到语音)模型 Dia-1.6B。这个模型最厉害的地方是增加了一些自然人声,比如笑声、咳嗽、清喉咙声音等,我给大家录得这个视频就是官方的演示。未分类 / 作者: macdown.net 目前这个模型还没有量化版本,大概需要10G显存。 repo 地址:http://github.com/nari-labs/dia 模型地址:http://huggingface.co/nari-labs/Dia-1.6B