ChatGPT 一经发布,5 天达成百万用户,2 个月月活用户达 1 亿,成为历史上用户增长最快的应用。 ChatGPT 的爆火,使得大模型受到了空前的关注。各大厂争相发布自己的大模型,比如阿里云的通义千问;国内外科技大佬和技术大牛也纷纷下场创业。
不过,大模型动辄千亿规模的参数量,极大的算力需求以及强大的算法能力要求,使得训练大模型往往成本高昂且对技术要求极高。 以 1750 亿参数的 GPT-3 为例,训练一天需要的算力是 3640PFlops,使用 1024 块 NVIDIA A100 GPU,不间断的计算也要一个月的时间才能完成训练。同时还要根据模型特点,对训练平台的动态内存分配、通信效率和计算利用率等进行针对性的优化,使训练平台的计算性能达到最优,从而提升大模型的训练速度。
那么,在大模型时代,企业如何应对大算力挑战?如何高效搭建大模型开发环境?如何训练自己的专属大模型呢?
为此,智东西公开课联合阿里云弹性计算团队共同出品「阿里云弹性计算技术公开课」,阿里云弹性计算产品线异构计算产品专家张新涛、阿里云高级开发工程师吕倪祺、阿里云高级开发工程师于子淇三位技术专家将先后进行直播讲解。
张新涛:现负责阿里云异构计算软件及解决方案、产品管理与上市以及产品经营工作,曾主导设计异构 GPU 产品、弹性加速实例产品、弹性云桌面产品等重要产品。