·设为首页收藏本站📧邮箱修改🎁免费下载专区📒收藏夹📱AI全功能
返回列表 发布新帖

模型变小,能力不减:新浪VibeThinker-3B 开源,AI 推理迎来“轻量化”新思路

72 0
发表于 昨天 17:58 | 查看全部 阅读模式

马上注册,免费下载更多dz插件网资源。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
人工智能模型的参数量是否一定要“越大越好”?近日,新浪开源的 VibeThinker-3B 模型给出了一份极具启发性的答卷。尽管该模型仅拥有30亿参数,但在数学、编程等高难度基准测试中,它竟然展现出了足以媲美主流百倍规模大模型的强悍性能,甚至在部分竞赛级任务中超越了多款行业顶尖产品。
VibeThinker-3B 的优异表现并非偶然,而是得益于其独特的训练策略。该模型以阿里 Qwen2.5-Coder-3B 为基底,通过多阶段的精细化“后训练”——涵盖了监督微调、强化学习、自蒸馏及指令微调等环节,将大模型的逻辑推理能力深度浓缩进了3B 的轻量化架构中。测试显示,在 LeetCode 竞赛题目中,它能高效完成128道题中的123道,这一成绩已超过了 GPT-5.2等行业标杆。
模型变小,能力不减:新浪VibeThinker-3B 开源,AI 推理迎来“轻量化”新思路 模型,VibeThinker-3B,任务,开源,AI


此次发布最引人深思的,是研发团队提出的“参数压缩-覆盖假说”。研究发现,AI 的能力并非“铁板一块”:像逻辑推理、编程运算这种结构清晰的任务,通过特定模式的训练,可以被极高密度地压缩;而广泛的世界知识储备,则依然依赖庞大的参数量来支撑。这意味着,未来在推理任务中,我们未必一定要调用成本昂贵的超大模型。
模型变小,能力不减:新浪VibeThinker-3B 开源,AI 推理迎来“轻量化”新思路 模型,VibeThinker-3B,任务,开源,AI


目前,VibeThinker-3B 已在Hugging Face和GitHub正式开源。这一动作不仅为开发者提供了一个轻量且高效的工具选择,也为 AI 行业提供了一种全新的优化范式:在特定任务领域,通过精耕细作的后训练,或许能以极低的算力成本,换取堪比“行业巨头”的推理体验。
我要说一句 收起回复

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

最新热评 加载中...
AI智能体
投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图 知道创宇云防御

您的IP:216.73.217.52,GMT+8, 2026-6-30 03:12 , Processed in 3.023332 second(s), 73 queries , Gzip On, Redis On.

Powered by Discuz! X5.1 Licensed

© 2001-2026 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表