Andrej Karpathy(karpathy):我要说,我并不满意地直觉地理解为什么视频生成模型表现得*太好*(复杂、高分辨率的纹理,持续几秒钟,反射等等),而相对而言,LLMs在处理几百字的文本时会出现问题
齐思GPT
2024-12-17 00:00:00
208
安德烈·卡帕西(Andrej Karpathy)在Twitter上提出了一个关于视频生成模型与语言模型性能差异的有趣问题。视频模型在生成复杂、高分辨率的纹理和反射方面表现出色,而语言模型在生成连贯文本方面却常常挣扎,尤其是在几百字的长篇幅中。这一发现挑战了我们对人工智能能力的现有理解,并提示我们需要更深入地探讨这种差距的原因。对于对人工智能模型性能差异感兴趣的人来说,卡帕西的推文可能提供了一个引人深思的视角。
安德烈·卡帕西(Andrej Karpathy)在Twitter上提出了一个关于视频生成模型与语言模型性能差异的有趣问题。视频模型在生成复杂、高分辨率的纹理和反射方面表现出色,而语言模型在生成连贯文本方面却常常挣扎,尤其是在几百字的长篇幅中。这一发现挑战了我们对人工智能能力的现有理解,并提示我们需要更深入地探讨这种差距的原因。对于对人工智能模型性能差异感兴趣的人来说,卡帕西的推文可能提供了一个引人深思的视角。- 视频生成模型能够生成复杂的、高分辨率的纹理,包括反射,持续数秒。
- 语言模型在生成几百字的连贯文本方面存在困难。
版权声明:
创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写
「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。