创新中心
个人中心
创新中心
个人中心

灵积&魔搭陈颖达:通过一站式的开源模型服务,人人都能打造自己的AI智能体

阿里云创新中心> 创业资讯> 灵积&魔搭陈颖达:通过一站式的开源模型服务,人人都能打造自己的AI智能体

灵积&魔搭陈颖达:通过一站式的开源模型服务,人人都能打造自己的AI智能体

阿里云创新中心 2023-11-24 18:38:46 6481
阿里云希望在MaaS层为各位AI开发者和创业者提供更全方位的服务。

在阿里云Creat@AI创客松在2023云栖大会的开幕式上,灵积模型服务及魔搭社区技术负责人陈颖达带来《MaaS:让大模型能力触手可及》主题演讲,现场分享了ModelScope如何构建开源的模型社区,为超过280万AI开发者提供模型探索体验、推理、训练、部署和应用的一站式服务。

image 灵积模型服务&魔搭社区技术负责人陈颖达

(以下为本次演讲精选,仅供学习与交流。) 阿里云以促进中国大模型生态的繁荣为首要目标,为中国大模型的发展提供基础云资源及模型服务支持。

在2022年云栖大会上,阿里云正式提出了Model Software的概念,并建立开源模型社区ModelScope。在过去的一年里,ModelScope已经成为中国最受欢迎的开源模型社区,并实现了第一个小目标——超过了1亿次的模型下载量。今天,有超过280万的活跃用户在ModelScope平台上使用各种各样的模型。

ModelScope的核心理念是打造开源模型社区。我们联合了国内外超过30家顶尖人工智能机构进行社区共建,同时推出众多联合运营活动及推广活动,将更多优秀的模型开源到ModelScope上。一方面,我们希望能够让更多开发者使用模型;另一方面,也希望能够进一步扩大这些模型的影响力,让更多优秀的开源模型能够在最短时间内被认识、被使用。今天,中国大部分的头部开源模型都会选择在ModelScope完成模型的首发,包括百川模型和更多最新的开源模型。ModelScope也会提供相应的微调训练和推理教程,帮助用户快速掌握如何使用这些模型。

一直以来,ModelScope都在鼓励技术创新。不仅提供丰富的开源数据集来加速模型开发和训练,同时提出了一个全新的概念——创空间。通过创空间,AI开发者可以将自己的模型应用与其他用户分享,并能实时得到反馈。今天,越来越多的模型团队首选通过创空间进行初步推广。创空间正成为一个模型商业化的入口。

image

对于模型的使用者来说,除了模型本身,还关注如何快速获取计算资源,以及如何在有限的计算资源中将大模型真正地应用起来。ModelScope本质上是提供一个统一的模型接口,为模型贡献者和模型使用者搭建沟通的桥梁

ModelScope与阿里云连通,通过云计算的加持为用户提供更好的模型服务。在ModelScope里,各种阿里云服务开箱即用,开发者可以一键连通阿里云上的免费CPU和GPU资源。基于阿里云提供的海量云算力,开发者通过几行代码就能直接对各种模态的模型做推理和训练,大大降低部署和使用成本,实现高效快捷的模型应用开发。

我们也看到,今天越来越多AI领域的创业者选择在大模型的基础上进行“小模型”的开发。当中需要对模型进行微调或全量训练。在资源有限的情况下,对模型进行微调或全量训练是一件比较困难的事情。针对这种情况,ModelScope开发了轻量化训练微调框架ModelScope-SWIFT,不仅支持Stable Diffusion 等在内的主流大模型,还能基于LoRA包等方式进行轻量化的微调。

就在过去的不久,ModelScope与北大美院合作,基于ModelScope-SWIFT框架,学生们可以利用ModelScope的工具对模型进行快速微调并产出风格化的效果。我们希望这一框架可以进一步降低模型的开发门槛,并满足广大开发者对模型定制化和场景化的需求,使AI应用更加贴近实际应用场景,更加灵活高效。

image

在模型技术和数据集的基础上,ModelScope社区孵化出很多AI应用。以FaceChain为例,该项目在开源三天内就冲上了Github趋势排行榜第一名。FaceChain将各个独立的技术模型融合,实现人脸生成推理的自动化。该项目不仅使用了基础模型 Stable Diffusion,还借助ModelScope提供的工具,将人脸进入、旋转、检测、美化、美肤等单点模型能力实现完美融合。从微调基础模型到最终生成推理的调整,Facechain打通了从技术模型到生产的链路,实现了N2N能力,并使用多种模型调整生成图片的效果。

今天的大模型已经具备了较好理解人类语言交互的能力,并朝着多模态的方向发展。这也是当下业界正热烈讨论的“AI Agent”概念。在这个趋势下,ModelScope也在积极探索如何在开源模型生态中实现大小模型的协同,带来可拓展的Agent解决方案Inside & Beyond ModelScopeGPT。

如果要生成一个包含画面、声音、字幕等内容的视频,中间需要调动大语言模型、文声视频模型、翻译模型以及语言模型,最后通过多模型能力组合来实现生成。ModelScope上拥有各种模态的模型。我们选择从单点切入,先训练一个中枢控制模型,其核心能力是理解不同的指令并进行多任务规划调度,与其他模型共同完成命令执行。我们希望将构建AI Agent的流程形成一套完整的链路和机制,满足用户定制化的需求。我们的核心是通过构建ModelScope GPT大小模型协同智能助手,依托LLM,结合ModelScope的模型生态,提供全新模型使用体验。

基于底层的通用大模型,开发者只需通过微调和API调用,能够使其更好地理解多元指令和任务需求。这样一来,用户可以轻松替换不同的模型,并实现高效的自定义化需求。值得一提的是,微调所使用的数据集已在ModelScope上开源,用户只需进入线上数据库去调用。通过这个数据库,任何领域都可以进行定制一个AI Agent,实现指令规划、执行和结果生成。

image

今天,验证是创新的第一步。ModelScope以模型服务为切入点,提供灵活易用的自助式服务,降低模型的使用门槛。但开发者仍需承担一定的计算和推理成本,我们希望通过能力上云来进一步来降低门槛。以云为基础,以模型为核心,完善模型即服务生态,阿里云推出模型服务灵积DashScope。

灵积通过灵活、易用的模型API服务,让各种模态模型的能力,更方便地为AI开发者所用。平台上提供了品类丰富、数量众多的模型选择,开发者不仅可以直接集成大模型的强大能力,还可以对模型进行训练微调,实现模型定制化。开发者可指定某个模型,还有各种参数选项可选,可适应不同的任务需求。

除此以外,灵积平台上还提供了文本向量模型、语音模型等的API调用方式。对于没有本地资源的开发者,他们可以指定基础模型,即可通过API访问其专有的模型数据。

image

今天这个模型的时代,我们希望把模型真正地服务化起来。通过开源的模型社区以及开源的SDK,让AI开发者可以直接加载模型;也可以通过API的方式,让各位开发者根据自己不同的创业阶段来选择。

阿里云希望在MaaS这个层面为各位AI开发者和创业者提供更全方位的服务。

更多创客松精彩活动回顾,点击查看:https://startup.aliyun.com/special/aihackathon2

版权声明: 创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余文章均来自所标注的来源,版权归原作者或来源方所有,且已获得相关授权,创新中心「创业资讯」平台不拥有其著作权,亦不承担相应法律责任。如果您发现本平台中有涉嫌侵权的内容,可填写「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。