模型变小，能力不减：新浪VibeThinker-3B 开源，AI 推理迎来“轻量化”新思路

逝水年华 · 发表于昨天 17:58

马上注册，免费下载更多dz插件网资源。

您需要登录才可以下载或查看，没有账号？立即注册

×

人工智能模型的参数量是否一定要“越大越好”?近日，新浪开源的 VibeThinker-3B 模型给出了一份极具启发性的答卷。尽管该模型仅拥有30亿参数，但在数学、编程等高难度基准测试中，它竟然展现出了足以媲美主流百倍规模大模型的强悍性能，甚至在部分竞赛级任务中超越了多款行业顶尖产品。
VibeThinker-3B 的优异表现并非偶然，而是得益于其独特的训练策略。该模型以阿里 Qwen2.5-Coder-3B 为基底，通过多阶段的精细化“后训练”——涵盖了监督微调、强化学习、自蒸馏及指令微调等环节，将大模型的逻辑推理能力深度浓缩进了3B 的轻量化架构中。测试显示，在 LeetCode 竞赛题目中，它能高效完成128道题中的123道，这一成绩已超过了 GPT-5.2等行业标杆。
模型变小，能力不减：新浪VibeThinker-3B 开源，AI 推理迎来“轻量化”新思路模型,VibeThinker-3B,任务,开源,AI

模型变小，能力不减：新浪VibeThinker-3B 开源，AI 推理迎来“轻量化”新思路模型,VibeThinker-3B,任务,开源,AI

此次发布最引人深思的，是研发团队提出的“参数压缩-覆盖假说”。研究发现，AI 的能力并非“铁板一块”:像逻辑推理、编程运算这种结构清晰的任务，通过特定模式的训练，可以被极高密度地压缩;而广泛的世界知识储备，则依然依赖庞大的参数量来支撑。这意味着，未来在推理任务中，我们未必一定要调用成本昂贵的超大模型。
模型变小，能力不减：新浪VibeThinker-3B 开源，AI 推理迎来“轻量化”新思路模型,VibeThinker-3B,任务,开源,AI

目前，VibeThinker-3B 已在Hugging Face和GitHub正式开源。这一动作不仅为开发者提供了一个轻量且高效的工具选择，也为 AI 行业提供了一种全新的优化范式:在特定任务领域，通过精耕细作的后训练，或许能以极低的算力成本，换取堪比“行业巨头”的推理体验。

©DZ插件网所发布的一切资源仅限用于学习和研究目的；不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。
本站内容为站长个人技术研究记录或网络，不提供用户交互功能，所有内容版权归原作者所有。您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。如果您喜欢该程序，请支持正版软件，得到更好的正版服务。
您在本站任何的赞助购买、下载、查阅、回复等行为等均表示接受并同意签订《DZ插件网免责声明协议》。
如有侵权请邮件与我们联系处理: discuzaddons@vip.qq.com 并出示相关证明以便删除。敬请谅解！