Deepseek新模型意外曝光！编程跑分一举超越Claude 3.5 Sonnet

Micheli 2024-12-27 00:00:00 334

Deepseek新模型意外曝光！编程跑分一举超越Claude 3.5 Sonnet。Deepseek-v3模型在编程基准测试中超越了Claude 3.5 Sonnet，它使用了685B参数的MoE架构，在LiveBench评估中被评为最强大的开源LLM。与前代模型相比，Deepseek-v3在模型结构上进行了重大改进，包括使用Sigmoid门控函数和新的Top-k选择方法。Deepseek-v3的开源权重目前可以在Hugging Face上找到。对于对机器学习模型及其性能基准感兴趣的人来说，这是一篇非常值得关注的内容。- Deepseek-v3已发布在API和网页上，跑分超越Claude 3.5 Sonnet - Deepseek-v3在Aider多语言编程测试排行榜中排名第一 - Deepseek-v3在LiveBench测评中是最强开源LLM之一 - Deepseek-v3相比前代v2、v2.5有了极大提升，包括参数配置和模型结构的变化 - Deepseek-v3使用了MoE架构，包含256个专家，支持64K上下文 - Deepseek-v3引入了新的Top-k选择方法noaux_tc，不需要辅助损失 - Deepseek-v3增加了一个新参数e_score_correction_bias，用于调整专家评分 - Deepseek-v3超越了v2.5的配置，包括更多的专家数量和更大的中间层尺寸 - Deepseek-v3已在LiveBench坐上最强开源LLM宝座

登录后可评论

上一篇：60分钟干货实录｜端侧 AI 落地挑战有多大？手机、PC、汽车、具身机器人有话说

下一篇：EXO Labs最近分享了他们广泛的基准测试工作的更新，对各种消费者设备进行了1000多次LLM（大型语言模型）基准测试

上一篇：60分钟干货实录｜端侧 AI 落地挑战有多大？手机、PC、汽车、具身机器人有话说下一篇：EXO Labs最近分享了他们广泛的基准测试工作的更新，对各种消费者设备进行了1000多次LLM（大型语言模型）基准测试