Blog Post

阿里云创新中心> 创业资讯> Blog Post
0
0

Blog Post

齐思GPT 2025-04-12 00:00:00 77
这篇博文介绍了Cogito LLMs,这是一种新型的指令调整生成模型,以其混合推理能力脱颖而出,使其能够直接回答问题或在回答前进行自我反思。这些模型使用一种称为迭代蒸馏和放大(IDA)的先进策略进行训练,旨在将超级智能与可扩展的自我改进相一致。值得注意的是,Cogito模型在编码、STEM和多语言任务方面表现出色,在标准和推理模式下均优于行业同行。它们在30多种语言中进行训练,并且能够处理令人印象深刻的128k上下文长度,使其具有极高的多功能性。
这篇博文介绍了Cogito LLMs,这是一种新型的指令调整生成模型,以其混合推理能力脱颖而出,使其能够直接回答问题或在回答前进行自我反思。这些模型使用一种称为迭代蒸馏和放大(IDA)的先进策略进行训练,旨在将超级智能与可扩展的自我改进相一致。值得注意的是,Cogito模型在编码、STEM和多语言任务方面表现出色,在标准和推理模式下均优于行业同行。它们在30多种语言中进行训练,并且能够处理令人印象深刻的128k上下文长度,使其具有极高的多功能性。该帖子还提供了实际的使用示例和代码片段,展示如何启用扩展思维并集成工具调用功能。这些模型根据Apache 2.0许可证获得许可,可供商业使用,并且可以通过contact@deepcogito.com联系到背后的团队。这篇内容对于对尖端AI语言模型及其实际应用感兴趣的开发人员和研究人员尤为有价值。- Cogito LLMs是一种经过指令调整的生成模型,可用于商业用途。 - Cogito模型是混合推理模型,具有高度的多语言、编码和工具调用能力。 - Cogito v1-preview模型在行业基准测试中表现优于其大小相等的对应模型。 - 这些模型在30多种语言中进行训练,并支持128k的上下文长度。 - 这些模型与最先进的大小相等的模型在直接和推理模式下进行比较。 - 演示了使用Transformers与这些模型的方法。 - 解释了两种扩展思维的方法。 - 这些模型支持工具调用。 - 该存储库和模型权重受Apache 2.0许可协议保护。 - 提供了团队的联系信息。

后缀.jpg

版权声明: 创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。

评论

登录后可评论