创新中心
个人中心
创新中心
个人中心

杨元庆:大模型的算力需求正在向边缘侧和端侧下沉

阿里云创新中心> 创业资讯> 杨元庆:大模型的算力需求正在向边缘侧和端侧下沉

杨元庆:大模型的算力需求正在向边缘侧和端侧下沉

投资界综合 2023-11-24 17:48:00 2352
技术创新总是激动人心的,因为它能够切切实实的提升社会的生产效率,让我们的生活和工作都更加便捷。

11月22日,由《财经》杂志、财经网、《财经智库》联合主办的“《财经》年会2024:预测与战略”在北京举行。 联想集团董事长兼首席执行官杨元庆在会上精彩发言。

以下为部分发言实录,投资界(ID:pedaily2012)整理:

2023年已经临近尾声,如果要给今年的科技行业总结一个关键词的话,我想非人工智能莫属。今年以来以ChatGPT为代表的生成式大模型的热潮成为人工智能应用普及的加速器,提速了各行各业的智能化转型。我们可以真切地感受到人工智能变得比以往任何时候都更加真实,与我们每个人、每家企业都越来越息息相关。我们也深刻认识到所有的行业、场景都可能被人工智能重塑,这让我们对未来有了更多的憧憬和期待。

人工智能诞生至今已经有70多年的历史了,现在大热的大模型只是人工智能技术的一个分支,大模型技术的创新突破让众多公共大模型如雨后春笋般的涌现。无论是作为平台型的应用还是嵌入各个行业的场景应用,都给我们带来了很多的高效与便利,让我们真正感受到了智能的意义。这里也存在一个现实问题,那就是要想让公共大模型跟你对话的时候能够提供你最想要的正确的恰当的内容,你就必须告诉它你自己真实的想法,提供你自己最真实的信息、数据。这样你的个人数据甚至是隐私还有企业的商业机密,就变成了公众信息的一部分。人们寄希望拥有跟大模型交互所带来的高效便利,又希望自己的数据只留存在自己的设备上或者只是在自己的企业内部流动。

能否做到这样的既要也要呢?我认为通过公共大模型和私有大模型包括个人的大模型和企业级的大模型的混合的并用可以实现。所谓的个人大模型是指部署在个人智能设备或者家庭的服务器上面,使用存储在本地的个人数据进行推理和学习的人工智能的技术模型,它不仅仅可以像公共大模型那样通过对话提供答案创作内容,而且更符合你的胃口,更加精准贴切,甚至根据你的思维模式预测任务并且自主的寻求解决方案。除非用户授权,否则你的个人数据不会被共享或者发送到公有云上,从而确保了个人的隐私和数据的安全。企业级的大模型是指使用企业内部的智能设备、智能边缘所提取的这些数据或者存储在私有云上面的数据或者知识库进行推理、学习并训练优化的人工智能的技术模型。它能够根据企业的业务场景和应用的需求归纳整合出判断和结论,从而提出决策建议。它部署在企业内部,能够确保相关信息的私密和安全。我认为未来的人工智能大模型将会是个人、企业和公共大模型共存的混合式的人工智能,跟公有云、私有云、混合云的概念是一脉相通的。

我可以举个例子来体现企业级大模型和公共大模型如何协同作用。台风即将来临的时候企业可以通过公共大模型得到台风的准确位置、风级的预测,但是如果涉及到具体哪些客户的订单交付可能受到影响,就是企业级大模型大显身手的时候,它能够告诉我们客户A的订单尚未生产,可能受到工厂暂时关闭的影响;客户B的订单尚未运输,可能受到路运中断的影响;客户C的订单尚未排产,可能受到物料延误的影响。有了这些信息,模型才能进一步给出优化运输方式、调整订单排序等建议,从而保证按照客户的优先级出货交付。这样行业智能化解决方案对于企业供应链的高效管理非常有意义。混合式的人工智能要如何实现呢?这一点离不开我们经常讲的基于端边云网智新IT架构的支撑。大模型的构建需要对海量的数据进行训练推理,所以它的计算量是爆发式的增长,对计算力提出了极高的要求,高文院士提到我们正在建立算力网络,很大程度上都是可以支持人工智能的计算的要求。

同时随着人工智能应用的深入,训练和推理的计算复合比重也将发生重大的变化,从而对计算的配置提出新的要求,目前大模型的用户规模还是比较小,大多数大模型都部署在公有云上,借助更强大的算力资源,它的计算负载主要还是用于模型的训练,未来随着每个人都要使用大模型,用户规模会不断扩大,从而用于推理的计算负载它的需求将会迅速提升,可能很快会超过训练的计算负载。那个时候在公有云上完成所有的训练和推理任务就会让效率低成本高的问题日益凸显,因此无论是出于数据安全和隐私保护的考虑,还是从更高效率、更低成本响应用户需求考虑,大模型的计算负载将逐渐由云端向边缘侧和端侧下沉。越来越多的人工智能的推理任务将会在边缘和设备端进行,从而使得个人大模型和企业大模型的运行更加成为必要和可能。

所以要构建和优化大模型,支持更多生成式人工智能的应用,我们不仅需要提升云端的算力,在边缘和端侧也需要更加强大算力的配合,从而形成端边云混合的计算架构,实现更加平衡的算力分配。

早在六年前联想就已经预见了人工智能将会带来的时代的机遇,从而开始推进我们的智能化转型。从智能物联网终端、智能基础设施和行业智能三个维度入手,围绕着端边云网智新IT基础架构加大了投资在技术创新上,加快了以解决方案和服务为导向的业务转型,致力于成为各行各业智能化转型的引领者和赋能者。现在联想的智能化转型开始步入收获期,我们形成了包括人工智能导向、人工智能优化、人工智能赋能的终端基础设施方案和服务在内的全景式的人工智能业务生态。在智能终端方面,我们拥有个人电脑、手机、平板、AR/VR、工作站等各类智能设备,并且在不断提升它们的智能计算能力。

在10月份,在前不久联想创新科技大会上,我们展示了明年即将发布的AI PC人工智能电脑,相较于今天的电脑,AI PC能够运行经过压缩和性能优化的个人大模型,它将实现下面这几个战斗力突破性的升级,*是更强的算力,它能够支持多达40个tops也就是每秒40万亿次运算的包括了CPU、GPU、NPU在内的异构计算。第二是更大的存储,能够容纳更多的个人全生命周期的数据,并且形成个人的知识库,为个人大模型的学习训练推理优化提供燃料。第三更加顺畅的自然语言的交互,我们可以用语音、手势跟人工智能的电脑交互。第四更可靠的安全和隐私保护,未来的人工智能电脑既能够作为公共大模型的入口,又能够独立运行个性化的私有的大模型,只有它能够最全面的掌握个人的数据和信息,又能严守你的秘密,只有你能够唤醒它使用它,同时也只有它能最懂你,远胜于任何公共的大模型。

举个例子,如果你想做个旅行的计划,你在飞机上在不联网的状态下也可以跟你的电脑对话,甚至你不需要告知你的需求和偏好,电脑也会为你推荐你心仪的航班、酒店、路线、餐厅等等,所以未来你的电脑你的手机亦或是你的汽车就像是你个人的数字的延伸、数字的镜像,成为你个人人工智能的双胞胎,从而大大提升你的生活品质和工作效率。

在智能基础设施方面,目前联想也是全球第三大人工智能基础设施和服务器的供应商,我们也是第三大存储厂商,在全球最快的500套高性能计算机中,联想连续多年保持1/3左右的上榜总数,稳居全球*。我们的算力基础设施产品包括服务器、存储、网络、软件等等,全面覆盖数据中心、私有云、公有云、边缘计算等各类计算的场景,能够为人工智能的大模型的训练推理这些需求提供强有力的支持。此外还搭建了联想混合云的平台,能够实现云原生、智能运维、私有云和多云管理的目标。我们的服务品牌真帅能够为客户提供按需付费可订阅的算力服务。

在行业智能解决方案,联想自身就是智能化转型的一个先行者,通过资源技术建立起了覆盖研发、生产、供应、销售、服务全价值链的智能化管理体系,现在我们正在把自身的转型经验提炼出来,形成积木式的通用的解决方案,包括数字化办公空间解决方案、混合云的解决方案、人工智能导向的边缘计算平台等等,并把它们嵌入到垂直行业的智能化整体解决方案中,比如智能制造、智慧教育、智慧政务、智慧金融、智慧医疗等等,现在我们已经为包括三一重工、吉利汽车、蔚来汽车、宁德时代等近千家大型企业提供了智能化转型的方案。我们混合式的人工智能解决方案和专业服务也致力于打造企业人工智能的双胞胎,将为混合式的基础设施与人工智能在企业的落地和应用提供有力的支持。

技术创新总是激动人心的,因为它能够切切实实的提升社会的生产效率,让我们的生活和工作都更加便捷。在中国经济转型升级实现高质量发展的进程中,生成式人工智能大模型在各行各业的落地,人工智能和实体经济场景的融合应用,也就是数实融合正在成为经济增长的新动能和新引擎。自我们创立以来,计算一直是联想的基因和底色,近几年我们把人工智能和计算作为联想的两个技术锚点,围绕新IT持续投资技术创新,致力于让人工智能更加易得,更加具有包容性,让人工智能惠及每一家企业、每一个个人。当然人工智能离不开百花齐放的产业生态和应用场景,我们愿意与各行各业的企业携手合作,共同提速千行百业的智能化转型,助力经济实现高质量发展,为智能化社会的美好未来贡献我们的力量,谢谢大家!

【本文经授权发布,不代表投资界立场。本平台仅提供信息存储服务。】如有任何疑问题,请联系(editor@zero2ipo.com.cn)投资界处理。
版权声明: 创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余文章均来自所标注的来源,版权归原作者或来源方所有,且已获得相关授权,创新中心「创业资讯」平台不拥有其著作权,亦不承担相应法律责任。如果您发现本平台中有涉嫌侵权的内容,可填写「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。