苹果开源7B大模型，训练过程数据集一口气全给了，网友：开放得不像苹果

阎荟 2024-07-23 00:00:00 335

苹果公司以发布一款7B参数模型的方式进入开源人工智能模型领域，这一举动不仅在性能上与Llama 3 8B相媲美，还公开了其训练过程和数据集的全部信息。

苹果公司以发布一款7B参数模型的方式进入开源人工智能模型领域，这一举动不仅在性能上与Llama 3 8B相媲美，还公开了其训练过程和数据集的全部信息。这种开放程度对于苹果来说并不常见，引起了人工智能社区的关注，包括自然语言处理科学家和科技爱好者。这款模型是在主要使用英语的2.5T令牌数据集上训练的，展示了在MMLU等基准测试中令人印象深刻的结果，与其他类似规模的模型相匹敌甚至超越。苹果的举措可能对那些有兴趣从头开始训练或微调模型的人提供重要贡献，提供了一个透明且易于获取的资源，满足了其他“开源”人工智能模型常常缺乏的真正科学研究需求。如果你对人工智能发展和朝着更小、成本效益更高的模型而不牺牲功能的趋势感兴趣，那么这一来自苹果的发布值得探索。- 苹果开源了7B大模型，效果与Llama 3 8B相当。 - 苹果一次性开源了全部训练过程和资源。 - 苹果的开源举动受到了网友的赞赏和调侃。 - 苹果的小模型DCLM-7B在多项基准测试中表现出色，与Mistral-7B和Llama 3 8B相媲美。 - 小模型成为了最近的趋势，因为它们在能力相近的情况下降低了成本。 - 小模型家族包括HuggingFace的SmolLM和Mistral AI的Mistral NeMo。 - 小模型整体比大模型价格更低。

奇绩创坛

>>>了解更多创新创业资讯

登录后可评论

上一篇：Maestro: Netflix的工作流编排器

下一篇：中国的人工智能模型制造商之间爆发了价格战。

上一篇：Maestro: Netflix的工作流编排器下一篇：中国的人工智能模型制造商之间爆发了价格战。