Bespoke-Stratos-17k ——全新的推理数据集

阿里云创新中心> 创业资讯> Bespoke-Stratos-17k ——全新的推理数据集
0
0

Bespoke-Stratos-17k ——全新的推理数据集

阎荟 2025-01-24 00:00:00 621
Bespoke-Stratos-17k数据集代表了人工智能推理领域的重大进展,构建在伯克利Sky-T1数据管道的基础上。这个数据集是使用来自DeepSeek-R1的SFT蒸馏数据筛选而成的,对训练两个强大的推理模型Bespoke-Stratos-32B和Bespoke-Stratos-7B起到了关键作用。这项工作的独特之处在于精心策划的筛选过程,包括拒绝抽样以确保高质量的推理轨迹,以及使用更高效的教师模型DeepSeek-R1,避免了中间的重新格式化步骤。
Bespoke-Stratos-17k数据集代表了人工智能推理领域的重大进展,构建在伯克利Sky-T1数据管道的基础上。这个数据集是使用来自DeepSeek-R1的SFT蒸馏数据筛选而成的,对训练两个强大的推理模型Bespoke-Stratos-32B和Bespoke-Stratos-7B起到了关键作用。这项工作的独特之处在于精心策划的筛选过程,包括拒绝抽样以确保高质量的推理轨迹,以及使用更高效的教师模型DeepSeek-R1,避免了中间的重新格式化步骤。提供的性能指标显示出对先前模型的显著改进,表明这些模型有潜力处理复杂的推理任务。这个数据集不仅是技术上的成就,也是一个协作努力,承认了伯克利Sky计算实验室、Deepseek和Datacomp社区的贡献。对于那些对人工智能推理和模型训练前沿感兴趣的人来说,Bespoke-Stratos-17k数据集是一个值得关注的发展。- 使用SFT蒸馏数据从DeepSeek-R1复制和改进了Berkeley Sky-T1数据管道,创建了Bespoke-Stratos-17k数据集。 - 使用该数据集训练了Bespoke-Stratos-32B和Bespoke-Stratos-7B推理模型。 - 提供了Bespoke-Stratos-32B和Bespoke-Stratos-7B的指标。 - 使用Bespoke Curator创建了合成推理数据集。 - 使用DeepSeek-R1作为教师推理模型,而不是QwQ。 - 使用gpt-4o-mini过滤错误的数学解决方案。 - 引用了Bespoke-Stratos的相关论文。 - 感谢Berkeley Sky Computing Lab、Deepseek和Datacomp社区的贡献和讨论。

image

版权声明: 创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。

评论

登录后可评论
登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问