有人放出了 DeepSeek-R1 各个蒸馏版本的 MMLU-Pro 得分。情况如图。
目前来看 DeepSeek-R1-Distill-Qwen-32B 仍然是最具性价比的,量化后单卡就能装得下。 …
目前来看 DeepSeek-R1-Distill-Qwen-32B 仍然是最具性价比的,量化后单卡就能装得下。 …
概述:Unsloth 团队通过创新性技术降低了 AI 模型训练门槛,让开发者只需 7GB 显存就能训练具备自主 …
支持保留标题、列表、粗体、斜体、颜色、超链接、图片、表格以及合并单元格等 PPT 内容格式。 GitHub:h …
它可以查看股票表现,画出股票价格的历史走势; 查找特定信息,比如某只股票的某个具体信息; 收集某只股票的相关新 …
1. Kokoro TTS生成音频。 2. Pixverse 上传图片创建人物角色 3. Pixverse 选 …
概述:仅需 8B 参数就能达到 GPT-4o 级别的轻量级多模态模型,集成了视觉、语音和文本处理能力,可以在手 …
现在AI真是方便,老婆要做个PPT,把活儿甩给了我。我问了几句思路,喂给 GPT o1-pro 修改成 PPT …
告别繁琐的 CLI!以直观界面简化 Docker Compose 栈管理,多机支持及友好的文件结构。与 Por …
这给比如电影特效制作、游戏画面渲染、虚拟现实创作提供了更多的便利性 github:https://github …
Adobe和香港科大开源的一款可以生成透明视频的项目:TransPixar,它可以生成包含烟雾、反射、水滴等透明元素的视频,看起来非常真实、更自然 查看全文 »
简单来讲这是个RAG框架,针对用户提问它会检索本地Wiki(没错把wikipedia塞到了向量数据库中)。然后 …