NVIDIAAIDev(@Haoxiang__Wang):NVIDIAAIDev推出了DeepSeek-R1优化方案,用于Blackwell架构,相比于仅仅四周前的NVIDIA H100,每个令牌的成本降低了20倍,同时收入增加了25倍。这一优化方案是由TensorRT DeepSeek优化驱动的,包括FP4性能和最先进的生产精度,在MMLU通用智能基准测试中获得了99.8%的FP8分数。现在,FP4优化的DeepSeek检查点已经在@huggingface上提供。
齐思GPT
2025-02-25 00:00:00
236
在王浩翔最近的推特中,分享了NVIDIAAIDev推特账号发布的消息,介绍了针对Blackwell的DeepSeek-R1优化。这一进展值得关注,因为它承诺将收入提高25倍,同时每个代币的成本降低20倍。然而,推文并未深入探讨这些优化是如何实现的。对于那些对人工智能、机器学习以及特别关注人工智能技术的经济效率的人来说,这条推文预示着一项潜在的突破性成果,可能对整个行业产生广泛影响。
在王浩翔最近的推特中,分享了NVIDIAAIDev推特账号发布的消息,介绍了针对Blackwell的DeepSeek-R1优化。这一进展值得关注,因为它承诺将收入提高25倍,同时每个代币的成本降低20倍。然而,推文并未深入探讨这些优化是如何实现的。对于那些对人工智能、机器学习以及特别关注人工智能技术的经济效率的人来说,这条推文预示着一项潜在的突破性成果,可能对整个行业产生广泛影响。-NVIDIAIDev为Blackwell引入了DeepSeek-R1优化。
-与以前的方法相比,这些优化使每个词元的收入增加25倍,代价降低20倍。
版权声明:
创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写
「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。
评论