Andrej Karpathy(karpathy)：我要说，我并不满意地直觉地理解为什么视频生成模型表现得*太好*（复杂、高分辨率的纹理，持续几秒钟，反射等等），而相对而言，LLMs在处理几百字的文本时会出现问题

Andrej Karpathy(karpathy)：我要说，我并不满意地直觉地理解为什么视频生成模型表现得太好（复杂、高分辨率的纹理，持续几秒钟，反射等等），而相对而言，LLMs在处理几百字的文本时会出现问题

齐思GPT 2024-12-17 00:00:00 208

安德烈·卡帕西（Andrej Karpathy）在Twitter上提出了一个关于视频生成模型与语言模型性能差异的有趣问题。视频模型在生成复杂、高分辨率的纹理和反射方面表现出色，而语言模型在生成连贯文本方面却常常挣扎，尤其是在几百字的长篇幅中。这一发现挑战了我们对人工智能能力的现有理解，并提示我们需要更深入地探讨这种差距的原因。对于对人工智能模型性能差异感兴趣的人来说，卡帕西的推文可能提供了一个引人深思的视角。

上一篇：jxnlco(jxnlco)：哇！OpenAI的解决方案工程团队刚刚报名参加了RAG课程

下一篇：OpenAI的12天活动：第8天主题讨论帖

上一篇：jxnlco(jxnlco)：哇！OpenAI的解决方案工程团队刚刚报名参加了RAG课程下一篇：OpenAI的12天活动：第8天主题讨论帖