Unsloth 量化版 Qwen3-30B-A3B-Instruct-2507-GGUF 也发布了!神速!

我直接给大家截图了 128G MAC 的内存占用情况。8bit最高只需要36G,4bit最高19.2G,相当可用了!
另外这次的新 Qwen3-30B-A3B 数学成绩跟 DeepSeek-V3-0324 不相上下。用于日常任务应该是足够的。编程的话 LiveCodeBench v6 和 MultiPL-E 差距就1-2分,但是 Aider 差距比较大。考虑到我觉得Aider还是相当准的,所以不太建议用这个模型写复杂代码。
量化版本地址:http://huggingface.co/unsloth/Qwen3-30B-A3B-Instruct-2507-GGUF