allen_ai(@chrmanning)：这里是Tülu 3 405B 🐫，我们的开源后训练模型，超越了DeepSeek-V3的性能！Tülu 3家族的最后一员展示了我们的配方，其中包括来自可验证奖励的强化学习（RVLR），可以扩展到405B规模，性能与GPT-4o相当，并超过了之前相同规模的开源后训练模型，包括Llama 3.1。

allen_ai(@chrmanning)：这里是Tülu 3 405B 🐫，我们的开源后训练模型，超越了DeepSeek-V3的性能！Tülu 3家族的最后一员展示了我们的配方，其中包括来自可验证奖励的强化学习（RVLR），可以扩展到405B规模，性能与GPT-4o相当，并超过了之前相同规模的开源后训练模型，包括Llama 3.1。

齐思GPT 2025-01-31 00:00:00 156

在克里斯托弗·曼宁最近的一条推文中，他转发了艾伦人工智能研究所关于他们最新开发的AI模型Tülu 3 405B的公告。这款新的开源后训练模型之所以引人注目，是因为它在超越其前身DeepSeek-V3的性能方面取得了成就。对于那些对AI技术的进展特别是在模型训练和性能领域感兴趣的人来说，这一更新标志着一大步前进，值得进一步探索。

上一篇：MistralAI(@b_roziere)：MistralAI介绍了Small 3，我们迄今为止最高效和多功能的模型！这是一个预先训练和指导版本，采用Apache 2.0许可，具有24B参数，81%的MMLU，每秒处理150个tokens。没有使用合成数据，因此非常适合进行任何推理任务

下一篇：如何掌握机器学习和人工智能，并真正构建一个大型语言模型？

上一篇：MistralAI(@b_roziere)：MistralAI介绍了Small 3，我们迄今为止最高效和多功能的模型！这是一个预先训练和指导版本，采用Apache 2.0许可，具有24B参数，81%的MMLU，每秒处理150个tokens。没有使用合成数据，因此非常适合进行任何推理任务下一篇：如何掌握机器学习和人工智能，并真正构建一个大型语言模型？