Blog Post

齐思GPT 2025-04-12 00:00:00 77

这篇博文介绍了Cogito LLMs，这是一种新型的指令调整生成模型，以其混合推理能力脱颖而出，使其能够直接回答问题或在回答前进行自我反思。这些模型使用一种称为迭代蒸馏和放大（IDA）的先进策略进行训练，旨在将超级智能与可扩展的自我改进相一致。值得注意的是，Cogito模型在编码、STEM和多语言任务方面表现出色，在标准和推理模式下均优于行业同行。它们在30多种语言中进行训练，并且能够处理令人印象深刻的128k上下文长度，使其具有极高的多功能性。该帖子还提供了实际的使用示例和代码片段，展示如何启用扩展思维并集成工具调用功能。这些模型根据Apache 2.0许可证获得许可，可供商业使用，并且可以通过contact@deepcogito.com联系到背后的团队。这篇内容对于对尖端AI语言模型及其实际应用感兴趣的开发人员和研究人员尤为有价值。- Cogito LLMs是一种经过指令调整的生成模型，可用于商业用途。 - Cogito模型是混合推理模型，具有高度的多语言、编码和工具调用能力。 - Cogito v1-preview模型在行业基准测试中表现优于其大小相等的对应模型。 - 这些模型在30多种语言中进行训练，并支持128k的上下文长度。 - 这些模型与最先进的大小相等的模型在直接和推理模式下进行比较。 - 演示了使用Transformers与这些模型的方法。 - 解释了两种扩展思维的方法。 - 这些模型支持工具调用。 - 该存储库和模型权重受Apache 2.0许可协议保护。 - 提供了团队的联系信息。

登录后可评论

上一篇：认识一下HIGGS - 一种由Yandex和领先的科技大学研究人员开发的新LLM压缩方法。

下一篇：继续反制，中国对美所有商品加征 125% 关税；小米汽车回应 SU7 湛江事故；GPT-4 将退役

上一篇：认识一下HIGGS - 一种由Yandex和领先的科技大学研究人员开发的新LLM压缩方法。下一篇：继续反制，中国对美所有商品加征 125% 关税；小米汽车回应 SU7 湛江事故；GPT-4 将退役