Omar Sanseviero(osanseviero):OmniAudio发布啦!超快的本地语音LLM,拥有2.6B个参数,支持文本和音频的多模态输入,统一了Gemma和Whisper

阿里云创新中心> 创业资讯> Omar Sanseviero(osanseviero):OmniAudio发布啦!超快的本地语音LLM,拥有2.6B个参数,支持文本和音频的多模态输入,统一了Gemma和Whisper
0

Omar Sanseviero(osanseviero):OmniAudio发布啦!超快的本地语音LLM,拥有2.6B个参数,支持文本和音频的多模态输入,统一了Gemma和Whisper

齐思GPT 2024-12-18 00:00:00 234
Omar Sanseviero宣布推出了OmniAudio,这是一款以其出色的速度而闻名的尖端本地语音语言模型。拥有26亿个参数,这个模型的独特之处在于它能够处理多模态输入,即可以处理文本和音频数据。OmniAudio之所以引人注目,是因为它集成了统一Gemma和Whisper的功能,可能为语音和语言处理任务提供更多样化和强大的工具。对于那些对技术细节感兴趣或想要看到模型实际运行的人,Sanseviero提供了一篇博客文章和一个演示链接。
Omar Sanseviero宣布推出了OmniAudio,这是一款以其出色的速度而闻名的尖端本地语音语言模型。拥有26亿个参数,这个模型的独特之处在于它能够处理多模态输入,即可以处理文本和音频数据。OmniAudio之所以引人注目,是因为它集成了统一Gemma和Whisper的功能,可能为语音和语言处理任务提供更多样化和强大的工具。对于那些对技术细节感兴趣或想要看到模型实际运行的人,Sanseviero提供了一篇博客文章和一个演示链接。这对于对先进的语音识别和处理技术感兴趣的开发人员和研究人员可能是一个重要的发展。- OmniAudio是一种超快的本地语音LLM - 参数为2.6B - 支持多模态输入:文本和音频 - 统一了Gemma和Whisper - 提供博客和演示链接

后缀.jpg

版权声明: 创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。
AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等