苹果开源7B大模型,训练过程数据集一口气全给了,网友:开放得不像苹果
阎荟
2024-07-23 00:00:00
335
苹果公司以发布一款7B参数模型的方式进入开源人工智能模型领域,这一举动不仅在性能上与Llama 3 8B相媲美,还公开了其训练过程和数据集的全部信息。
苹果公司以发布一款7B参数模型的方式进入开源人工智能模型领域,这一举动不仅在性能上与Llama 3 8B相媲美,还公开了其训练过程和数据集的全部信息。这种开放程度对于苹果来说并不常见,引起了人工智能社区的关注,包括自然语言处理科学家和科技爱好者。这款模型是在主要使用英语的2.5T令牌数据集上训练的,展示了在MMLU等基准测试中令人印象深刻的结果,与其他类似规模的模型相匹敌甚至超越。苹果的举措可能对那些有兴趣从头开始训练或微调模型的人提供重要贡献,提供了一个透明且易于获取的资源,满足了其他“开源”人工智能模型常常缺乏的真正科学研究需求。如果你对人工智能发展和朝着更小、成本效益更高的模型而不牺牲功能的趋势感兴趣,那么这一来自苹果的发布值得探索。- 苹果开源了7B大模型,效果与Llama 3 8B相当。
- 苹果一次性开源了全部训练过程和资源。
- 苹果的开源举动受到了网友的赞赏和调侃。
- 苹果的小模型DCLM-7B在多项基准测试中表现出色,与Mistral-7B和Llama 3 8B相媲美。
- 小模型成为了最近的趋势,因为它们在能力相近的情况下降低了成本。
- 小模型家族包括HuggingFace的SmolLM和Mistral AI的Mistral NeMo。
- 小模型整体比大模型价格更低。
版权声明:
创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写
「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。
评论