victormustar(@cognitivecompai)：转发 @victormustar：NVIDIA发布了Nemotron-Super后训练数据集，包含了超过3000万个训练样本，2000万个数学示例，950万个代码示例，以及SFT和RL数据。

victormustar(@cognitivecompai)：转发 @victormustar：NVIDIA发布了Nemotron-Super后训练数据集，包含了超过3000万个训练样本，2000万个数学示例，950万个代码示例，以及SFT和RL数据。

齐思GPT 2025-03-20 00:00:00 224

NVIDIA发布了Nemotron-Super后训练数据集，为人工智能和机器学习社区做出了重大贡献。该数据集包含超过3000万个训练样本，其中包括2000万个数学示例和950万个代码示例。发布如此庞大且多样化的数据集值得关注，因为它可以极大地促进人工智能模型的开发和完善，特别是在数学和编码领域。对于人工智能领域的研究人员、开发人员和爱好者来说，探索这一数据集可能提供宝贵的见解，并有助于推动机器学习技术的进步。

登录后可评论

上一篇：现在可以在Unsloth中使用Gemma 3进行GRPO，并且进行了一些bug修复。

下一篇：Andrew Ng(@AndrewYNg)：新的短期课程：使用LangGraph进行长期代理记忆。在这门课程中，与@LangChainAI合作开发，由其联合创始人兼首席执行官@hwchase17教授如何构建一个具有长期记忆的代理人！个人辅助和提高生产力的任务变得越来越重要。

上一篇：现在可以在Unsloth中使用Gemma 3进行GRPO，并且进行了一些bug修复。下一篇：Andrew Ng(@AndrewYNg)：新的短期课程：使用LangGraph进行长期代理记忆。在这门课程中，与@LangChainAI合作开发，由其联合创始人兼首席执行官@hwchase17教授如何构建一个具有长期记忆的代理人！个人辅助和提高生产力的任务变得越来越重要。