MiniMax-01开源：新架构开启Agent时代

阎荟 2025-01-15 00:00:00 264

MiniMax通过发布和开源MiniMax-01系列模型迈出了人工智能技术的重要一步，其中包括先进的MiniMax-Text-01和MiniMax-VL-01。这些模型拥有创新的架构，可与GPT-4o媲美，并能处理前所未有的400万标记，为人工智能系统的上下文长度设立了新标准。这一发展有望在2025年加速代理系统的演进，为更复杂和高效的人工智能代理奠定基础。此外，MiniMax通过负担得起的API服务提供这些尖端功能，使其适用于各种应用。模型权重在GitHub上的开源可用性进一步突显了MiniMax在促进长上下文人工智能应用领域的研究和创新方面的承诺。- MiniMax发布并开源了MiniMax-01全新系列模型，包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。 - MiniMax-01系列模型采用了大规模实现线性注意力机制的创新架构，参数量高达4560亿。 - MiniMax-01能够高效处理全球最长400万token的上下文，是GPT-4o的32倍，Claude-3.5-Sonnet的20倍。 - MiniMax-01系列模型是开启Agent时代的第一步，能够建立复杂Agent所需的基础能力。 - MiniMax提供极致性价比的API，标准定价是输入token 1元/百万token，输出token 8元/百万token。 - MiniMax-01系列模型在大多数任务上追平了海外公认最先进的两个模型，GPT-4o-1120以及Claude-3.5-Sonnet-1022。 - MiniMax-Text-01在处理长文任务上性能衰减最慢，优于Google Gemini。 - MiniMax-01系列模型使用了线性注意力机制，结构中每8层中有7个是基于Lightning Attention的线性注意力。 - MiniMax-01系列模型在学术集上取得了比肩海外第一梯队的结果。 - MiniMax-Text-01在400万的Needle-In-A-Haystack检索任务上表现显著领先。 - MiniMax-VL-01在多模态理解的测试集中表现领先。 - MiniMax开源了两个模型的完整权重，以促进更多长上下文的研究和应用。 - MiniMax提供极高性价比的API，可在海螺AI和海外网站上使用。

登录后可评论

上一篇：在《无人在乎》中，作者发泄了对普遍社会冷漠的不满，通过生活中的生动例子说明缺乏关心和努力导致了低劣的体验和环境

下一篇：中信建投 | AI终端系列报告三：端侧AI渐起，硬件迎来升级

上一篇：在《无人在乎》中，作者发泄了对普遍社会冷漠的不满，通过生活中的生动例子说明缺乏关心和努力导致了低劣的体验和环境下一篇：中信建投 | AI终端系列报告三：端侧AI渐起，硬件迎来升级