“问小白”发布第四代开源大模型 XBai o4

婷姐 · 发表于 2025-8-4 22:59:26

马上注册，免费下载更多dz插件网资源。

您需要登录才可以下载或查看，没有账号？立即注册

×

开源大模型领域迎来新突破。“问小白”正式发布其第四代开源模型 XBai o4，该模型在复杂推理能力上表现卓越，其 Medium 模式已全面超越 OpenAI o3-mini，并在部分基准测试中优于 Anthropic Claude Opus。

XBai o4引入了创新的“反思型生成范式”，通过结合 Long-CoT 强化学习和过程评分学习，实现了深度推理和高效推理链路筛选，同时显著降低了推理成本。
“问小白”发布第四代开源大模型 XBai o4 推理,模型,XBaio4,开源,测试

“问小白”发布第四代开源大模型 XBai o4 推理,模型,XBaio4,开源,测试

技术突破:独创“反思型生成范式”
XBai o4的核心创新在于其独有的“反思型生成范式”（reflective generative form）。这一范式将 Long-CoT 强化学习与过程评分学习（Process Reward Learning）相结合，使得单个模型能够同时完成两个关键任务:
1、深度推理: 像人类一样进行多步骤的复杂思考。
2、高质量推理链路筛选: 能够评估和选择最优的推理路径。
更值得关注的是，XBai o4通过共享过程评分模型（PRMs）和策略模型的主干网络，将过程评分的推理耗时降低了99%。这一优化大幅提升了模型的运行效率，为实际应用提供了坚实基础。

性能卓越:多基准测试领先
XBai o4模型提供了三种模式（low、medium、high），以适应不同复杂度的任务需求。在多项关键基准测试中，其强大性能得到了充分验证:
在 Medium 模式下，XBai o4全面超越了 OpenAI 的 o3-mini 模型。
在部分基准测试中，其表现甚至优于 Anthropic 的 Claude Opus。
该模型在 AIME24、AIME25、LiveCodeBench v5、C-EVAL 等多个测试中均展现出卓越的推理能力。
“问小白”已在 GitHub 上开源了相关的训练和评估代码，这不仅为 AI 研究社区提供了宝贵的资源，也预示着开源大模型在复杂推理领域的竞争力正在迅速增强。

地址:https://github.com/MetaStone-AI/XBai-o4

©DZ插件网所发布的一切资源仅限用于学习和研究目的；不得将上述内容用于商业或者非法用途，否则，一切后果请用户自负。
本站内容为站长个人技术研究记录或网络，不提供用户交互功能，所有内容版权归原作者所有。您必须在下载后的24个小时之内，从您的电脑中彻底删除上述内容。如果您喜欢该程序，请支持正版软件，得到更好的正版服务。
您在本站任何的赞助购买、下载、查阅、回复等行为等均表示接受并同意签订《DZ插件网免责声明协议》。
如有侵权请邮件与我们联系处理: discuzaddons@vip.qq.com 并出示相关证明以便删除。敬请谅解！