斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库

阿里云创新中心> 创业资讯> 斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库
0
0

斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库

阎荟 2024-06-03 00:00:00 312
这是针对内容的指南:[在此处插入中文翻译的指南]。

这是针对内容的指南:[在此处插入中文翻译的指南]。- 斯坦福的研究团队发布了Llama3-V,号称是一个小100倍但效果相当的多模态模型。 - 有人指出Llama3-V抄袭了清华大学与面壁智能合作开发的MiniCPM-Llama3-V 2.5。 - Llama3-V的作者承认使用了MiniCPM-Llama3-V 2.5的预训练tokenizer,并解释说是在MiniCPM-Llama3-V 2.5发布前就开始了这项工作。 - 有网友发现Llama3-V与MiniCPM-Llama3-V 2.5具有相同的模型结构和配置文件,Llama3-V的代码几乎完全照抄MiniCPM-Llama3-V 2.5。 - Llama3-V的作者删除了质疑帖,并回应称Llama3-V在架构上参考的是LLaVA-UHD,并列出了与MiniCPM-Llama3-V 2.5的差异。 - 有网友测试发现Llama3-V与MiniCPM-Llama3-V 2.5之间的重叠高达87%,识别错误的结果也有182个重合。 - Llama3-V的作者删除了推特内容流和HuggingFace的仓库,并将模型设为私密,称是为了修复推理功能。 - 有网友发现将Llama3-V模型权重中的变量名更改为MiniCPM-Llama3-V 2.5后,能成功运行,并得到与Llama3-V相似的模型。 - 作者之一道歉,称抄袭源于对队友的盲信。

版权声明: 创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。

评论

登录后可评论
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等