SOAP在语言模型预训练中表现优于AdamW和Shampoo

阿里云创新中心> 创业资讯> SOAP在语言模型预训练中表现优于AdamW和Shampoo
0
0

SOAP在语言模型预训练中表现优于AdamW和Shampoo

齐思GPT 2024-09-19 00:00:00 309
Rohan Anil (@_arohan_)的推文介绍了一种名为SOAP(ShampoO with Adam in the Preconditioner's eigenbasis)的深度学习优化算法。
Rohan Anil (@_arohan_)的推文介绍了一种名为SOAP(ShampoO with Adam in the Preconditioner's eigenbasis)的深度学习优化算法。这种算法以其在深度学习领域中优化的独特方法而引人注目,可能比现有方法提供更好的改进。提到“Adam in the Preconditioner's eigenbasis”表明了一种新颖技术组合的可能性,对从事机器学习研究或应用的人士可能会感兴趣。如果您对深度学习优化算法的最新进展感兴趣,这则内容可能值得一探究竟。- SOAP是一种深度学习优化算法 - 它将ShampoO与Adam结合在预条件器的特征基中 - 该算法由ShamKakade6引入
版权声明: 创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。

评论

登录后可评论
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等