Andi Marafioti推出了SmolDocling,这是一款创新的256M视觉语言模型,专为高效快速的文档OCR(光学字符识别)而设计

阿里云创新中心> 创业资讯> Andi Marafioti推出了SmolDocling,这是一款创新的256M视觉语言模型,专为高效快速的文档OCR(光学字符识别)而设计
0
0

Andi Marafioti推出了SmolDocling,这是一款创新的256M视觉语言模型,专为高效快速的文档OCR(光学字符识别)而设计

齐思GPT 2025-03-18 00:00:00 285
Andi Marafioti推出了SmolDocling,这是一款创新的256M视觉语言模型,专为高效快速的文档OCR(光学字符识别)而设计。这个开源工具在文档转换方面具有颠覆性意义,能够在使用消费级GPU的情况下,在不到500MB的VRAM的情况下,仅需0.35秒处理一页页面。令人惊讶的是,SmolDocling在文档转换方面的表现超越了许多更大的竞争模型,有些甚至是其27倍,为该领域树立了新的技术标杆。这篇内容对于对文档处理技术、OCR进展和人工智能效率感兴趣的人尤为重要。
Andi Marafioti推出了SmolDocling,这是一款创新的256M视觉语言模型,专为高效快速的文档OCR(光学字符识别)而设计。这个开源工具在文档转换方面具有颠覆性意义,能够在使用消费级GPU的情况下,在不到500MB的VRAM的情况下,仅需0.35秒处理一页页面。令人惊讶的是,SmolDocling在文档转换方面的表现超越了许多更大的竞争模型,有些甚至是其27倍,为该领域树立了新的技术标杆。这篇内容对于对文档处理技术、OCR进展和人工智能效率感兴趣的人尤为重要。- SmolDocling是一个256M的开源视觉语言模型,用于完整文档OCR。 - 它可以在消费级GPU上以0.35秒的速度处理一页,使用的VRAM不超过500MB。 - SmolDocling在文档转换方面是最先进的,比其他更大的竞争模型表现出多达27倍的优势。

image

版权声明: 创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。

评论

登录后可评论
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等

登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问