·设为首页收藏本站📧邮箱修改🎁免费下载专区📒收藏夹👽聊天室📱AI智能体
返回列表 发布新帖

“问小白”发布第四代开源大模型 XBai o4

68 0
发表于 2025-8-4 22:59:26 | 查看全部 阅读模式

马上注册,免费下载更多dz插件网资源。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
开源大模型领域迎来新突破。“问小白”正式发布其第四代开源模型 XBai o4,该模型在复杂推理能力上表现卓越,其 Medium 模式已全面超越 OpenAI o3-mini,并在部分基准测试中优于 Anthropic Claude Opus。


XBai o4引入了创新的“反思型生成范式”,通过结合 Long-CoT 强化学习和过程评分学习,实现了深度推理和高效推理链路筛选,同时显著降低了推理成本。
“问小白”发布第四代开源大模型 XBai o4 推理,模型,XBaio4,开源,测试 技术突破:独创“反思型生成范式”
XBai o4的核心创新在于其独有的“反思型生成范式”(reflective generative form)。这一范式将 Long-CoT 强化学习与过程评分学习(Process Reward Learning)相结合,使得单个模型能够同时完成两个关键任务:
1、深度推理: 像人类一样进行多步骤的复杂思考。
2、高质量推理链路筛选: 能够评估和选择最优的推理路径。
更值得关注的是,XBai o4通过共享过程评分模型(PRMs)和策略模型的主干网络,将 过程评分的推理耗时降低了99%。这一优化大幅提升了模型的运行效率,为实际应用提供了坚实基础。


性能卓越:多基准测试领先
XBai o4模型提供了三种模式(low、medium、high),以适应不同复杂度的任务需求。在多项关键基准测试中,其强大性能得到了充分验证:
在 Medium 模式下,XBai o4全面超越了 OpenAI 的 o3-mini 模型。
在部分基准测试中,其表现甚至优于 Anthropic 的 Claude Opus。
该模型在 AIME24、AIME25、LiveCodeBench v5、C-EVAL 等多个测试中均展现出卓越的推理能力。
“问小白”已在 GitHub 上开源了相关的训练和评估代码,这不仅为 AI 研究社区提供了宝贵的资源,也预示着开源大模型在复杂推理领域的竞争力正在迅速增强。


地址:https://github.com/MetaStone-AI/XBai-o4
我要说一句 收起回复

回复

 懒得打字嘛,点击右侧快捷回复【查看最新发布】   【应用商城享更多资源】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

最新热评 加载中...
AI智能体
投诉/建议联系

discuzaddons@vip.qq.com

未经授权禁止转载,复制和建立镜像,
如有违反,按照公告处理!!!
  • 联系QQ客服
  • 添加微信客服

联系DZ插件网微信客服|最近更新|Archiver|手机版|小黑屋|DZ插件网! ( 鄂ICP备20010621号-1 )|网站地图 知道创宇云防御

您的IP:216.73.216.122, 27.155.113.99,GMT+8, 2025-9-14 03:38 , Processed in 0.310598 second(s), 76 queries , Gzip On, Redis On.

Powered by Discuz! X5.0 Licensed

© 2001-2025 Discuz! Team.

关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表