徐国伟Twitter上的Kevin_GuoweiXu,宣布推出了突破性的视觉语言模型LLaVA-o1
阎荟
2024-11-18 00:00:00
185
徐国伟,即Twitter上的@Kevin_GuoweiXu,宣布推出了突破性的视觉语言模型LLaVA-o1。这个模型以其能够进行自发和系统化推理的能力脱颖而出,这一特点与文本GPT-o1模型相似。拥有庞大的110亿参数,LLaVA-o1据报道超越了其他知名模型,如Gemini-1.5-pro、GPT-4o-mini和Llama-3.2-90B-Vision-Instruct。LLaVA-o1的成功归因于其在结构化数据上的训练和新推理方法的实施。这一发展对从事人工智能和机器学习,特别是在视觉语言处理领域的人。
徐国伟,即Twitter上的@Kevin_GuoweiXu,宣布推出了突破性的视觉语言模型LLaVA-o1。这个模型以其能够进行自发和系统化推理的能力脱颖而出,这一特点与文本GPT-o1模型相似。拥有庞大的110亿参数,LLaVA-o1据报道超越了其他知名模型,如Gemini-1.5-pro、GPT-4o-mini和Llama-3.2-90B-Vision-Instruct。LLaVA-o1的成功归因于其在结构化数据上的训练和新推理方法的实施。这一发展对从事人工智能和机器学习,特别是在视觉语言处理领域的人士可能具有重要意义。- LLaVA-o1是第一个具有自发、系统推理能力的视觉语言模型,类似于GPT-o1。
- 11B模型在结构化数据和新颖推理的训练下,胜过了Gemini-1.5-pro、GPT-4o-mini和Llama-3.2-90B-Vision-Instruct。
版权声明:
创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写
「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。
评论