大模型日报（9月30日学术篇）

LLM SPACE LLM SPACE 2024年10月03日 12:10

我们希望能够搭建一个AI学习社群，让大家能够学习到最前沿的知识，大家共建一个更好的社区生态。

「奇绩大模型日报」知识库现已登陆飞书官方社区：

https://www.feishu.cn/community/article/wiki?id=7355065047338450972

点击「订阅社区精选」，即可在飞书每日收到《大模型日报》每日最新推送

如果想和我们空间站日报读者和创作团队有更多交流，欢迎扫码。

欢迎大家一起交流！

论文

Discovering the Gems in Early Layers: Accelerating Long-Context LLMs with 1000x Input Token Reduction

大型语言模型 (LLM) 在处理长上下文输入方面表现出了卓越的能力，但这是以增加计算资源和延迟为代价的。我们的研究为解决长上下文瓶颈引入了一种新方法，以加速 LLM 推理并减少 GPU 内存消耗。我们的研究表明，LLM 可以在生成查询答案之前识别早期层中的相关标记。利用这一见解，我们提出了一种算法，该算法使用 LLM 的早期层作为过滤器来选择和压缩输入标记，从而显著减少后续处理的上下文长度。与标准注意和 SnapKV/H2O 等现有技术相比，我们的方法 GemFilter 在速度和内存效率方面都有了显著的提升。值得注意的是，它实现了 2.4×。

https://www.arxiv.org/abs/2409.17422

登录后可评论

上一篇：大模型日报（9月30日资讯篇）

下一篇：开泰银行，开了上海办公室

上一篇：大模型日报（9月30日资讯篇）下一篇：开泰银行，开了上海办公室

大模型日报（9月30日 学术篇）