Bio2标记:任何生物分子结构与Mamba的全原子词元化

阿里云创新中心> 创业资讯> Bio2标记:任何生物分子结构与Mamba的全原子词元化
0

Bio2标记:任何生物分子结构与Mamba的全原子词元化

Micheli 2024-10-30 00:00:00 184
Bio2Token通过使用量化自动编码器进行全原子标记,引入了一种突破性的生物分子结构表示方法。这种方法允许在原子水平上高度准确地重建蛋白质、RNA和小分子,精度可达1埃以下。采用Mamba状态空间模型架构使Bio2Token脱颖而出,因为它需要更少的训练数据、更少的参数和更少的计算能力,同时仍能扩展到几乎有10万个原子的系统。这一进展可能会在未来彻底改变全原子语言模型的输入过程,潜在地影响生物分子设计和药物发现。由Olivia Viessmann撰写的这项研究是传统方法的重大飞跃,传统方法通常依赖于粗粒
Bio2Token通过使用量化自动编码器进行全原子标记,引入了一种突破性的生物分子结构表示方法。这种方法允许在原子水平上高度准确地重建蛋白质、RNA和小分子,精度可达1埃以下。采用Mamba状态空间模型架构使Bio2Token脱颖而出,因为它需要更少的训练数据、更少的参数和更少的计算能力,同时仍能扩展到几乎有10万个原子的系统。这一进展可能会在未来彻底改变全原子语言模型的输入过程,潜在地影响生物分子设计和药物发现。由Olivia Viessmann撰写的这项研究是传统方法的重大飞跃,传统方法通常依赖于粗粒化近似或局限于较小的系统。对于任何对生物分子建模的前沿和在蛋白质设计中应用人工智能感兴趣的人来说,Bio2Token的新颖方法是必读的。- 编码和表示大型三维分子结构对于生物分子设计应用至关重要。 - 许多表示学习方法限制自己对较小系统的建模,或者使用粗粒化的系统近似。 - 量化的自编码器可以学习完整蛋白质、RNA和小分子结构的原子级标记。 - Mamba状态空间模型架构高效且准确,只需要少量训练数据和计算。 - 学习结构标记可能成为未来全原子语言模型的输入。

后缀.jpg

版权声明: 创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等