MiniMax-01开源:新架构开启Agent时代
阎荟
2025-01-15 00:00:00
168
MiniMax通过发布和开源MiniMax-01系列模型迈出了人工智能技术的重要一步,其中包括先进的MiniMax-Text-01和MiniMax-VL-01。这些模型拥有创新的架构,可与GPT-4o媲美,并能处理前所未有的400万标记,为人工智能系统的上下文长度设立了新标准。这一发展有望在2025年加速代理系统的演进,为更复杂和高效的人工智能代理奠定基础。此外,MiniMax通过负担得起的API服务提供这些尖端功能,使其适用于各种应用。
MiniMax通过发布和开源MiniMax-01系列模型迈出了人工智能技术的重要一步,其中包括先进的MiniMax-Text-01和MiniMax-VL-01。这些模型拥有创新的架构,可与GPT-4o媲美,并能处理前所未有的400万标记,为人工智能系统的上下文长度设立了新标准。这一发展有望在2025年加速代理系统的演进,为更复杂和高效的人工智能代理奠定基础。此外,MiniMax通过负担得起的API服务提供这些尖端功能,使其适用于各种应用。模型权重在GitHub上的开源可用性进一步突显了MiniMax在促进长上下文人工智能应用领域的研究和创新方面的承诺。- MiniMax发布并开源了MiniMax-01全新系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。
- MiniMax-01系列模型采用了大规模实现线性注意力机制的创新架构,参数量高达4560亿。
- MiniMax-01能够高效处理全球最长400万token的上下文,是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。
- MiniMax-01系列模型是开启Agent时代的第一步,能够建立复杂Agent所需的基础能力。
- MiniMax提供极致性价比的API,标准定价是输入token 1元/百万token,输出token 8元/百万token。
- MiniMax-01系列模型在大多数任务上追平了海外公认最先进的两个模型,GPT-4o-1120以及Claude-3.5-Sonnet-1022。
- MiniMax-Text-01在处理长文任务上性能衰减最慢,优于Google Gemini。
- MiniMax-01系列模型使用了线性注意力机制,结构中每8层中有7个是基于Lightning Attention的线性注意力。
- MiniMax-01系列模型在学术集上取得了比肩海外第一梯队的结果。
- MiniMax-Text-01在400万的Needle-In-A-Haystack检索任务上表现显著领先。
- MiniMax-VL-01在多模态理解的测试集中表现领先。
- MiniMax开源了两个模型的完整权重,以促进更多长上下文的研究和应用。
- MiniMax提供极高性价比的API,可在海螺AI和海外网站上使用。

版权声明:
创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写
「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。
评论