在最近的更新中,Awni Hannun展示了Qwen 1.5B模型的能力,这是DeepSeek R1的精简版本,在iPhone 16上运行
Micheli
2025-01-24 00:00:00
172
在最近的更新中,Awni Hannun展示了Qwen 1.5B模型的能力,这是DeepSeek R1的精简版本,在iPhone 16上运行。这个模型利用MLX swift,在设备上展示了令人印象深刻的推理能力,处理速度接近每秒60个标记。重点是一个4位模型版本可以在智能手机上执行复杂任务,显示了移动机器学习技术的重大进展。这一发展可能会改变AI在移动设备上的可访问性和性能。如果你对人工智能和移动技术的前沿感兴趣,这篇内容值得一读。
在最近的更新中,Awni Hannun展示了Qwen 1.5B模型的能力,这是DeepSeek R1的精简版本,在iPhone 16上运行。这个模型利用MLX swift,在设备上展示了令人印象深刻的推理能力,处理速度接近每秒60个标记。重点是一个4位模型版本可以在智能手机上执行复杂任务,显示了移动机器学习技术的重大进展。这一发展可能会改变AI在移动设备上的可访问性和性能。如果你对人工智能和移动技术的前沿感兴趣,这篇内容值得一读。-Awni Hannun成功地在iPhone 16上使用MLX swift将DeepSeek R1蒸馏为Qwen 1.5B。
-模型可以在设备上以每秒近60个代币的速度推理。
版权声明:
创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写
「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。
评论