·设为首页收藏本站📧邮箱修改🎁免费下载专区📒收藏夹📱AI全功能
返回列表 发布新帖

微博开源Vibe Thinker:15亿参数击败DeepSeek R1,后训练成本仅7800美元

71 1
发表于 1 小时前 | 查看全部 阅读模式

马上注册,免费下载更多dz插件网资源。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
微博正式发布自研开源大模型Vibe Thinker,凭借 15 亿参数在国际顶级数学竞赛基准测试中击败 6710 亿参数的DeepSeek R1,准确率领先且单次“后训练”成本仅 7800 美元,比DeepSeek-R1 和MiniMax-M1 等模型低数十倍。

Vibe Thinker采用轻量化MoE架构与多轮知识蒸馏,官方称在5GB以下数学语料上即可完成高效微调,支持Hugging Face一键下载及商用许可。微博技术团队透露,模型在AIME 2025、HMMT等竞赛题库中平均得分较R1 提升3.4%,推理延迟降低42%,适用于教育、金融等实时场景。

开源版本提供PyTorch与GGUF格式,最低可在单张RTX4090 运行。微博同步开放训练脚本与数据配比方案,计划 12 月推出Vibe Thinker-Math专用数学增强版,并联合高校举办“轻量级数学挑战赛”,推动低成本高精度AI普及。
我要说一句 收起回复

评论1

浅生Lv.8 发表于 1 小时前 | 查看全部
不明觉厉
我要说一句 收起回复
回复 支持 反对

使用道具 举报

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

最新热评 加载中...
AI智能体
投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图 知道创宇云防御

您的IP:216.73.216.83,GMT+8, 2025-11-18 21:25 , Processed in 2.624534 second(s), 80 queries , Gzip On, Redis On.

Powered by Discuz! X5.1 Licensed

© 2001-2026 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表