一个具有实时对话能力的多模态大语言模型：Mini-Omni。

AI / 作者： macdown.net

具有特点：
– 实时语音对话能力，无需额外的 ASR 和 TTS 模型。
– 实现 “边听边思考”，生成文本时同时输出语音。
– 支持流媒体音频输出，实时输出语音。
– 支持批量处理。
GitHub：https://github.com/gpt-omni/mini-omni
模型下载：https://huggingface.co/gpt-omni/mini-omni

文章导航

← 前一篇文章

后一篇文章 →

搜索

近期文章

微PE WEPE 支持 KVM virtio 磁盘
KolibriOS 只有 1.4 MB？这可能是世界上最小的完整系统
千问刚刚发布了4个新模型!
docker官方部署龙虾的教程
RTX3090 24GVRam 运行 Qwen3.5-35B-A3B：本地 AI 从 demo 走向生产的分水岭

近期评论

[PyQt] PySide2 教程 #1: Python GUI开发，简介和环境安装 – 麦当发表在 [PyQt]PySide2教程 #2:用 Python建立GUI吧!
macdown.net 发表在半月湾VPS#联通AS9929#测评
辣鸡发表在半月湾VPS#联通AS9929#测评

归档

2026 年 3 月
2026 年 2 月
2026 年 1 月
2025 年 12 月
2025 年 11 月
2025 年 10 月
2025 年 9 月
2025 年 8 月
2025 年 7 月
2025 年 6 月
2025 年 5 月
2025 年 4 月
2025 年 3 月
2025 年 2 月
2025 年 1 月
2024 年 12 月
2024 年 11 月
2024 年 10 月
2024 年 9 月
2024 年 8 月
2024 年 7 月
2024 年 6 月
2024 年 5 月
2024 年 4 月
2024 年 3 月
2024 年 2 月
2024 年 1 月
2023 年 12 月
2022 年 10 月
2022 年 6 月
2022 年 5 月
2022 年 4 月