网传厦门某国企研发部门要求每日考察后端 400 行,前端 1000 行代码量,如属实,这个考核合理吗?
JetBrains 放弃 AppCode 是否是一个错误决定?
Chrome 浏览器设计的神细节有哪些?
为什么供应链桃子只有小米雷军可以摘,其他人只能干瞪眼?
如果让你设计攻打台湾地区,你会有什么好的想法和打法?
异性同办公室久了会不会日久生情?

为什么Qwen模型总给我一种又土又low的感觉?

发布日期:2025-06-26 18:30:16 浏览次数:0

本来用下来对Qwen3印象不太好,但30B A3B这个惊呆了,台式机265k用cpu跑都有30多的速度,得益于Moe架构,每次只激活3b参数,压力很低,可用度非常高。

虽然经常吐槽qwen模型思考链又臭又长来刷分,但也是对比deepseek 671b版来说的,但只看开源小模型,32b模型它家之前qwq 包括这次的qwen3 32b和30b没啥好挑的了。

为什么Qwen模型总给我一种又土又low的感觉?