手把手教你从零开始训练一个多模态视觉模型：MiniMind-V。

提供了详细的训练流程，包括数据处理、预训练、指令微调以及相关的工具集，只需 1 小时时间和 1.3 元成本。
GitHub：http://github.com/jingyaogong/minimind-v
即可训练出一个 26M 参数的小型多模态视觉模型，支持单图和多图输入，同时具备识图和对话能力。
可以作为大家想实现视觉语言模型的入门教程学习。

文章导航

← 前一篇文章

后一篇文章 →

搜索

近期文章

微PE WEPE 支持 KVM virtio 磁盘
KolibriOS 只有 1.4 MB？这可能是世界上最小的完整系统
千问刚刚发布了4个新模型!
docker官方部署龙虾的教程
RTX3090 24GVRam 运行 Qwen3.5-35B-A3B：本地 AI 从 demo 走向生产的分水岭

近期评论

[PyQt] PySide2 教程 #1: Python GUI开发，简介和环境安装 – 麦当发表在 [PyQt]PySide2教程 #2:用 Python建立GUI吧!
macdown.net 发表在半月湾VPS#联通AS9929#测评
辣鸡发表在半月湾VPS#联通AS9929#测评

归档

2026 年 3 月
2026 年 2 月
2026 年 1 月
2025 年 12 月
2025 年 11 月
2025 年 10 月
2025 年 9 月
2025 年 8 月
2025 年 7 月
2025 年 6 月
2025 年 5 月
2025 年 4 月
2025 年 3 月
2025 年 2 月
2025 年 1 月
2024 年 12 月
2024 年 11 月
2024 年 10 月
2024 年 9 月
2024 年 8 月
2024 年 7 月
2024 年 6 月
2024 年 5 月
2024 年 4 月
2024 年 3 月
2024 年 2 月
2024 年 1 月
2023 年 12 月
2022 年 10 月
2022 年 6 月
2022 年 5 月
2022 年 4 月