macdown.net

Nari Labs 刚刚发布了一个开源TTS(文本到语音)模型 Dia-1.6B。这个模型最厉害的地方是增加了一些自然人声,比如笑声、咳嗽、清喉咙声音等,我给大家录得这个视频就是官方的演示。

目前这个模型还没有量化版本,大概需要10G显存。 repo 地址:http://github.com/nari …

Nari Labs 刚刚发布了一个开源TTS(文本到语音)模型 Dia-1.6B。这个模型最厉害的地方是增加了一些自然人声,比如笑声、咳嗽、清喉咙声音等,我给大家录得这个视频就是官方的演示。 查看全文 »