物理测试暴击AI圈,DeepSeek R1稳超o1、Claude,我们已进入RL黄金时代
Micheli · 奇绩创坛
物理测试暴击AI圈,DeepSeek R1稳超o1、Claude,我们已进入RL黄金时代。DeepSeek R1是一款中国人工智能模型,在物理模拟基准测试中超越了其他知名模型,如OpenAI的o1。这款模型基于纯强化学习,展现出在准确模拟物理规律方面的卓越能力。DeepSeek R1的重要性在于其有望挑战美国人工智能技术的主导地位,标志着人工智能行业的一个关键时刻。该模型的成功归因于利用大量的GPU,并培养来自中国大学的本土人才,这一策略与依赖美国培养的博士生的常规做法有所不同。
45