近日,中国科技产业智库“甲子光年”主办“致追风赶月的你”2023甲子引力年终盛典,其中,在“AI如何变革机器人”主题圆桌中,源码资本执行董事陈润泽围绕“机器人行业新变化、AI变革机器人新苗头、投资新转向”等话题展开了分享讨论。
他认为新的AI技术、特别是大模型,正在改变机器人的特性。现在,机器人在感知和理解能力方面的显著进步,这对机器人领域和自动驾驶都是重大的变革。人机交互的进展也非常大,这是大语言模型最直接发挥作用的领域。在与物理世界的交互方面,数据和模型scaling的方法论也展现出很好的潜力,但需要谨慎评估技术的成熟度。
在投资方面,他建议两个可能思路,一是关注下游行业的资本投入的周期机遇,二是通用型机器人在能力和成本上的持续进展。
新变化:通用智能机器人
成为今年热点新话题
但到了2022年底,出现了几件推动行业变化的事情:第一件是Tesla的人形机器人,第二件是谷歌等团队陆续展示出很多好的大模型+机器人相关Demo。这推动了行业的“叙事升级”。进入2023年,随着通用智能机器人关注度的提高,越来越多的人开始关注到强化学习、大模型、扩散模型等技术都在机器人展现出很好的潜力,于是市场温度和情绪持续上升。但我们应当注意这其中可能存在一些不理性的成分。
复盘看过去几年的机器人项目,主要的技术变量是定位导航和机器视觉。很多移动类的机器人都是已经比较成熟的品类,AI应用也主要集中在物体识别、检测以及定位导航这些方面。很多创业公司基本上都是围绕这些技术在具体场景中找PMF。但我们不妨再拓宽一些视野,回顾过去10年整个自动化行业发展起来的优秀公司,不能仅仅关注供给端的变化,还要看下游的变化。一些比较好的、比较大的公司已经在A股上市,其实这些公司都有很强的行业属性,在行业里面有需求,刚好有一些机器人技术能够解决这些需求,这种机会反而是最好的。
新苗头:AI开始变革机器人
我们与许多机器人创业者、研究者和工程师有过交流,我们很明显的感觉到视觉-语言模型的近期发展让机器人的感知理解能力有了质的进步,这种进步在机器人领域和自动驾驶领域都将带来快速的变化。当我们将机器人放置在一个开放的世界环境中时,机器人可以理解世界的语义,这与过去做机器人的方式非常不同。过去,机器对世界的理解依赖于对特定物体的识别。比如自动驾驶,过去感知模块用到的白名单非常短,但今天语义分割和理解能力则极大增强,这对后续做规划影响很大。再比如说巡检场景,过去需要非常详细的标注,但今天巡检场景的交付成本可能会大幅下降。
关于机器人与物理世界交互的问题,我们已经比过去任何时候更接近找到一条可规模化、可泛化的机器人学习方法。针对一些特定领域的特定任务,我们认为技术已经进入到工程化阶段。但通用的操作能力至少在短期内还是一个很奢侈的期待。不得不说,近期在学术层面,机器人操作能力有很多很好的研究,我们看到在实验室中机器人已经可以很好的处理刚性物体,甚至也能操作衣服、塑料袋等可变形物体。但这些技术从实验室走出来需要时间,需要工业界的力量来推动飞轮向前滚动。
相比物理世界交互,人机交互更直接受益于语言大模型的发展,很快我们就会看到商业落地的机会。但还需要强调,一旦涉及到与物理世界的交互,需要谨慎判断技术是否已经成熟,商业是否能顺利落地。
机器人的自主决策能力也是通用机器人的关键一环。我们认为语言大模型已经为此提供了很好的基础,但技术的成熟度还有待观察。
投资新转向:关注技术研发能否落地
你好,我是AI助理
可以解答问题、推荐解决方案等
评论