在六月底正式结束的阿里云Create@AI创客松第五季决赛现场,我们见证了To B AI应用王者的诞生,本季赛事的冠军集思科技Johnsmith.ai凭借一款名为销销帮你Sell Show的产品博得头筹。它的卖点不只是一键开播,而是一键带货。集思科技在已经卷出天际的虚拟主播赛道为何还能脱颖而出?在大模型的加持下,虚拟主播赛道又发生了怎样的新变化?
本期云谷创新谈就邀请了集思科技的CEO李世尊来聊一聊关于虚拟主播的故事。
李世尊 集思科技CEO、联合创始人
曾在Lazard、中金公司、腾讯游戏、沄柏资本从事投行投资业务
“Johnsmith.ai集思科技是一家数智化B2C销售解决方案,是AI数字带货主播的创造者,致力于通过AI赋能商家,为全球品牌提供数智化销售解决方案,目前服务赫莲娜、海蓝之谜等大型品牌超过300家,电商数字人直播市场占有率稳居第一,是LVMH集团、欧莱雅集团等的首批AIGC供应商。公司于2023年获得工信部颁发的《2023年度消费品行业数字化转型先进示范案例》,是由中国工程院院士丁文华牵头的中国首个《中国数字人发展报告》蓝皮书的参编单位。”
(以下内容由阿里云整理,仅供学习与参考)
银超:前段时间京东创始人刘强东上线了数字人直播,近1小时观看量超2000万,刷屏了大家的朋友圈,李佳琦所在公司美腕也在618期间启用数字人直播,并搭建了AI智能客服。头部大IP的入场向我们释放出了什么信号?行业发生了哪些变化?
李世尊:数字人行业从我们发布产品到今天已有近两年的时间,东哥在618期间推出了自己的数字人形象,大家印象都很深刻,他一直在捻自己的手,内部大家都在说他的手要被捻破了,此番举动效果很好,平台也给予了非常多的流量加持,从市场和流量角度来讲有很大的意义,李佳琦“所有女生”直播间也引入了数字人女主播,这正说明目前数字人直播技术愈发成熟,我们也希望有更多的大IP公司、工作室和MCN愿意尝试这样的新鲜技术来帮助自己降本增效。
银超:数字人直播历史已久,据我了解,此前出现过一些2D卡通人和3D的动漫形象,目前为止我们看到的刘强东数字人背后则是有真人存在的,所以你能帮我们梳理一下数字人的发展过程吗?
李世尊:数字人其实不是一个特别新的概念。最早在16年,搜狗就已经推出了新闻播报的数字人主持人,大家都觉得很新奇,后来短视频数字人等形式也陆续产生。到了大概18年,大型电商平台开始用一些3D建模卡通人来直播。但是这些建模的形象对于品牌来说很难接受,我们也是注意到了这些弊端,于是我们在2021年底问了一个问题,“为什么数字人不能变成真人形态和大家互动呢?”品牌都希望能拥有24小时不间断激情带货的真人主播,于是我们在2022年2月推出了这款产品。直到今天,数字人电商直播已经不新奇了,可集思科技的渗透率仍未达到20%,更别说60%了。所以数字人行业还是一个非常蓝海的市场,虽然最近的头部大IP像东哥和李佳琦开始尝试数字人直播带货,但其实在过去两年里面已经有大量的品牌在做了,我相信未来会有更多现象级的事件出现。
银超:集思科技成立于2022年,你刚cue到的先行者16年已经开始进行尝试,坦白说你们进入行业较晚。所以你们为什么选择在那个时间点进入这个行业?站在一个创业者的角度去考虑,作为后发者你认为你们拥有哪些优势?你们当时是如何制定的这个决策?
李世尊:其实我们集思科技分为两个阶段,第一个阶段我们三位创始人都还在各自原本的岗位上,2021年年底拿着一个PPT,机缘巧合下找到京东平台,展示了我们的“元宇宙”数字人概念。2021年其实Facebook刚刚改名为Meta,元宇宙概念火得不行,国内来看淘宝也做了自己的淘宝人生,京东也希望在平台植入元宇宙元素,虽然我们被相中了,可那时我们还并未掌握相应的技术,相当于我们是带着需求去寻找技术,此时我们仨仍处于“兼职”阶段。而在2022年的38女神节我们的产品推出后,像赫莲娜、olay、兰蔻等品牌都参与了进来并且反响不错,带了大概七八百万的货,在那个年代38女神节还是非常OK的。随后韩束3月31号就成为了我们第一个正式的SaaS版本客户,这时我们才开始思考这是不是能变成我们自己的事业?直到22年六月份,我因为在投资机构工作,有幸和Sam Altman有过一次1个小时的会议,他给我们展示了GPT3的playground,这玩意把我的脑子都给炸了,因为它和我们原来理解的AI完全不一样,因为我们当时的基金正好跟旷世有一个AI的基金,我们看了国内非常多AI的企业,在那个人工智能还是人工智障的年代,通过一个页面和几个对话,它就能够完全理解你的语义,那这项技术放到数字人身上将相当炸裂,太厉害了。所以我们才萌生了正式把这家公司做大的想法。于是我在九月份正式辞职,随后我们团队便成立了。
银超:这很有意思,你们2022年成立时处于GPT爆发的前夜。你们发现用GPT跟数字人的结合,可以创造新的东西,行业也由此迎来了一个新的拐点。
李世尊:是的,包括此次创客松参赛,我们的产品完全采用了通义千问模型,技术路线上做了更加先进的突破。我们的主营业务是为大品牌提供数字人带货主播直播间,大品牌认为你讲出来的东西可以没有功劳,但绝不能犯错,比如赫莲娜他们对于产品成分等话术要求非常精确严谨,如果用AI去实时生成的话,有时候会有一些幻觉,即使用现在市面上最流行的方式去做,也不能保证0失误,所以在大品牌方面我们做了一些阉割。但我们意识到国内外有一些白牌、中小商家、夫妻老婆店也想尝试做直播,如何去选品,话术怎么写,互动怎么做,对于他们来说都是头疼的问题,我们便通过Multi-agent为他们制作智能的主播agent、选品agent等等,来帮他们打造一个完整的直播间,就像刚才提到的不止一键开播,更能实现一键带货的初衷,因为直播是一个非常长的链路,它相较于所有的内容来说都是最复杂的一件事。
银超:其实你们并不单纯只是专注在虚拟主播的塑造上面,你们有前链路和后链路。
李世尊:是的,您提到的非常符合我们的理念。我们从第一天就认为我们不单单是打造一个数字主播。因为数字主播未来大厂一定会做,那我作为一个创业者,肯定要考虑自己的壁垒到底在哪里,大厂希望自己能够覆盖的用户足够多,所以在最初的蓝海市场下,我们想做得垂一点,为某一类客户打造数字主播概念,所以说我们就打造了像智能弹袋,包括二景的切换,他能够单场直播手上持多品,讲VSOP的时候手持VSOP,讲到XO的时候手持XO,这些都是我们在这个行业里面率先发布的产品化的一些功能,让我们能存活到今天这个阶段。
银超:你刚才说的这些功能还是蛮重要的,如果今天一个数字人讲给我听但没有互动的话,还是比较难受的。如果一个真人主播来讲,他可能会突然之间胳膊动一下,或者突然间眨个眼,那你们这些功能的实现,背后采用的是什么技术?
李世尊:我觉得技术虽然是产品的底层,但我们团队内部一直坚持说要讲究TPF和PMF。我们永远都是先看到真人直播间长什么样子、真人直播间的最佳时间是怎样的,再反推我的产品。产品为了实现真人主播直播间的一些功能,要做100件事情,我们就再倒推,如果技术只能实现其中的80个,那我们就做这80个。我们先看可能市场上需要120个,然后产品能做100个,然后技术去做80个,最终才创造出这个产品形态。我们现在的技术路径针对大牌就是一个异步的实现方式,异步怎么理解呢?我们有一些提前预设好的东西,这次我们参加创客松的for SMB中小品牌的全部都是实时的,相当于你一键选择一个主播之后,他就能根据你主播的一些提前做好的知识库,推荐相应的品,品的文案也都是实时被大模型生成之后再实时推到直播间的。所以说这完全是两条技术路径,因为一个要求极其可控,一个讲究效率但是没有那么严谨。
银超:今天如果我进入你们的直播间,我在下面评论,你给我看一下你手上拿的那个化妆品的细节,成分是什么,它是可以实现直接拿起来开始讲的,是吗?
李世尊:是的,但这里面有很多都已经是我们从产品化和工程化的角度做了很多工作的,而不是说我们在算法上做了非常大量的事情。这个我也坦言,因为我认为我们不是一家技术公司,我们是一家产品公司。虽然底层技术我们也做了大量的研发,但我们一直标榜自己是一个产品公司的概念。现在直播间里我们分为两种展示产品的方式,第一种就是主播还在讲,他能把这个产品拿出来给你看,然后这个时候主播也在整个全景里面,这个是一种算法的方式。如果说突然切到近景,比如说用户问主播我能不能看一下这个产品的质地是怎么的?那这个时候二景就已经像我们直播间的导播台一样,切到另外一个场景里面,就是另外一个人在涂抹产品向你展示质地。
银超:我觉得你们的特殊之处在于,你们先拿到商机,然后组建团队,再解决技术问题。现在很多AI公司都是拿着锤子找钉子,但你们先寻找不同需求的“洞”。再打磨钉子把它敲进去。
李世尊:是的,您说的特别对。之前做投资时我们也发现一些估值颇高的公司,刚开始上来都是手上有技术再想这项技术能解决什么问题。但有可能在短期之内,这个问题没有暴露在你的面前,那需求就没有暴露在你面前。我们从第一天就坚信一定要找到需求再去投入开发,如今我们也面临着同样的问题,我们也想找第二曲线,我们正在思考海外的需求是什么,但也不敢妄下定论。所以下半年也会实地考察海外品牌,对比他们和中国客户的需求差异,再根据需求研发新产品。
银超:所以我想focus在需求上面多讲一讲。其实很多听这个节目的人,他也在这个领域,他也想找一些解决方案,你刚才提到的两类客户,一类是大型品牌客户,还有一个是SMB的客户,他们在直播这件事情上面,目前面临的痛点分别是什么呢?
李世尊:对于大品牌来说,产品卖点、视觉、话术是固定的,直播间只能沿用固有体系进行展示。而SMB甚至压根儿连品都没有,但他仍想根据自己的性格或者粉丝画像一键开播,例如他是机车相关的账号,他只有一万粉丝,那他就只需将性格输入我们的系统便可以筛选出适合他推荐的产品,其实SMB的痛点就是:关于带货他一无所知。
银超:卖货跟做内容还是不一样。
李世尊:完全不一样。很多人都很热爱做内容,但是带货的时候就变成商业行为了。所以说我们就尝试怎么能这帮SMB小客户实现,帮他选好品了,然后他也可以随便再调品,希望可以帮他减少很多像我们原来打dota的时候说的这个前摇动作,让他提高效率。
银超:你们怎么去评估一个数字人主播的好与坏呢?
李世尊:第一形象一定要漂亮,让C端用户进入直播间觉得赏心悦目他才会愿意留下来;第二主播的表达要自然不机械,回答用户问题体现出一定的专业内涵;第三则是所谓的效益。效益就是,我们的目的是帮品牌去实现指标,不管是转化率的要求、客单价的要求还是商品点击率的要求,这些最后都会落到数据层面来讲,今天讲一套话术明天讲一套话术,AB两种话术哪个效果好,可能他做的都不是AB test,甚至是ABC test,最后得到结论哪个话术更吸引人,找到适宜的话术节奏比如憋单憋多久、产品讲解之后是不是就立马跟着痛点或者卖点、痛点和卖点哪个前哪个后。比如高端品牌适合讲的更多的是产品讲解,而不是促销信息。低端产品讲的更多可能就是在促单信息,这是完全两套会在直播中实现的不同逻辑。
银超:一个虚拟主播和一个真人主播的成本差异能有多大?头部品牌降本增效的诉求强烈吗?
李世尊:非常大,一个大品牌的真人主播在杭州大概要两三百块钱1小时。场地、场控、运营、文案、设计、培训等等成本汇总起来价格极高,但我们基本上1小时只需二三十块钱,成本差异将近百倍。去年开始品牌几乎都在降本,我们很多客户真人直播从原来的十几个小时下降到个位数,从原来每天开播下降到一周播三天,还有很多品牌甚至放弃渠道直接关店,所以今年的主话题主旋律应该也是如此。
银超:直播间除了售卖商品也提供一定的情绪价值,尤其是一些具有个性与人设的达人主播,但这正是虚拟主播无法做到的,所以真人主播跟虚拟主播在品牌的直播间里如何分工呢?
李世尊:我们专注于做大品牌的店播。但是品牌还有一块很重要的来源是达播(达人直播),目前我们CV的灵活性比较适合于做工具化标准化的店播(店铺直播),达播场景短时间之内只能做一些极为头部的品牌化MCN,像所有女生和交个朋友。我们目前也在尝试与这样的头部IP接触。22年品牌都还抱着比较迟疑的态度说你这个AI到底有没有用?很多其实都是内部的人只是画个PPT向上汇报一下,做一个噱头,但随着时间的推移,直播数据得到了验证,在流量较小的1点到7点钟,由我们的虚拟主播帮品牌承接流量,目前很多品牌虚拟主播的GMV已经超过了真人直播的GMV,真人主播跟虚拟主播在平台上基本已经平分秋色。
银超:虚拟主播的形象是一个完全虚拟创造的人,还是基于品牌自身主播形象产生的复刻版本?
李世尊:最初我们认为每一个品牌都不想依赖于任何IP,我举个例子,比如说两年前YSL又有一个非常火的主播,长得非常漂亮但她播了几年之后自己就去当网红了。所以我们要做完全虚拟的人,打造一个品牌的专属IP形象。但去年年底开始,平台监管严格主播需要报备,因此便转化成了现在的根据品牌本身的真人主播形象进行克隆,还能添加语气,人物在录制模型时更加自然灵活一些就很难看出来。
银超:在法律的伦理下大家也会去讨论一些问题,如果你复刻了一个真人的主播,那被复刻的真人主播会怎么想?双方会面临哪些冲突?
李世尊:首先,品牌接受我们的服务后,真人主播的收入就势必会减少,但这对于品牌来说是省钱的。对于真人直播代运营机构而言,我们参与到其中一起提升品牌GMV,真人直播代运营机构收入上涨,我们也占据了一定的市场份额。第二点,我们尝试过为达人KOL制作分身,一晚上一个直播间可能只付你2000块钱,可你分身多,就和孙猴子一样,你耐不住10万个分身,但是这个事大多都遭到了拒绝,他们怕分身抢了自己本来的饭碗。我们始终认为情感是特别重要的节点,AI再厉害,也还是不具有真实的情感,就像我来的路上,我还接了2个AI外呼的电话,我挂了电话也只会说做的好真,但是AI听不出我在犹豫,AI就是一个“死”的东西,它听不出你的语速、情感和你实时的感受变化。这些敏感的细节我觉得是非常难的,真人还是会在关键的时刻出现,但是他可以利用自己的数据分身,在互联网世界里为他创造价值。我觉得在未来的两三年,对于数字人一定会出现各种各样的法律、道德相关的讨论和争议。
银超:在法律伦理之外,平台之间的博弈也始终存在,比如视频号会将虚拟主播产出的内容判为低质内容,关于这一点你们会如何做出平衡呢?
李世尊:我们对接的平台分为两种,一种是兴趣电商像抖音、快手,另一种则是货架电商像淘宝、京东。在货架电商,我们秉承的理念是数字人是一个工具项的东西。即使随着技术的发展,产品的迭代,它可以更倾向于产出内容,但直到今天我们认为它的一切还比较偏标准化。 对一些兴趣点上来说,可能会比较有争议。但我认为我们应该拥抱AI内容,在符合法律的情况下,数字人也可以正常的讲解、互动、交互。在抖音等平台,某种程度上非常专业化的AI内容是可以被接受的,但是如果一看就是非常低质的内容,的确应该下掉。这应该有一个中间地带,而不是一刀切封杀。
银超:刚刚我们聊到了你们目前面临的挑战点,然后回过头来我就比较容易理解你们的商业模式设计。你们其实不是一个数字人公司,你们深入到细分的电商赛道,为品牌提供解决方案。那你们的这种商业模式是怎么设计出来的呢?
李世尊:是的,你其实问到了我们最核心的点,所有人都是认为我们是一家数字人公司,或者觉得我们是一家数字人电商带货公司。但本质上我们对自己的定义是数字化B2C销售产品公司。这其实源于我自己的一点坚持,我最终想做的是取代全世界所有的to c销售。当你在杭州最有名的商场购买产品时,你不会记得柜姐的名字,你买包包是奔着LV的包包去买的,买完之后离开了你也记不住她叫Jessica,叫Jenny,还是叫其他的名字。所有的品牌都希望自己的C端销售具备同样的综合素质,我们认为to c销售一定是一个收敛的过程,任何一个品牌都希望自己的销售是销冠的样子, 我们希望能把销冠复刻到整个互联网世界。在现实生活中这很难实现,但在互联网虚拟世界打造自己的分身是非常容易的。我们坚信当AI到达某一阶层,就足以以假乱真。希望不管是在虚拟世界,还是在线下的场景里,都能够将我们的知识库植入进品牌。to b的公司已经有很多了,并且已经在做大量的销售赋能,但to b销售一定是小于to c销售的,所以我们想实现to c销售环节提效。
银超:从你22年创业到现在两年不到的时间内,公司发展速度很快。目前已经有三百多个大的SKA客户,这个成绩非常难得,那你觉得你现在的创业处在什么样阶段?
李世尊:我非常诚实的讲,在这个市场中,我们已经找到了PMF并做出了一个非常契合的东西。当然我们认为它是一个SLG的过程,用销售来驱动增长。我们海外的同行HeyGen,从100万美金蹦到3500万美金ARR,花了八个月的时间,这个故事像一个咒语一样驱动着我的脑子,这几个月以来,我一直都在琢磨怎么能让我们的产品迭代得更好。我们主营业务每年有150%的增长,每个月基本上也能保持20%-30%的增长,总体来说还是很不错的,但是为人外有人,天外有天,我们仍旧贪婪且不知足,想让公司变得更好,让我们的产品在其他的场景下也能发挥大用处,将数字人嵌到任何一个网页上。任何一行代码就能把我的API嵌进去并匹配相应的知识库,甚至可以将他已有的客服系统,通过数字人的方式,为用户进行讲解和互动。
银超:我还有最后一个问题,你们的组队起步方式非常神奇,先有商机再组团队。那在你创业两年不到的的过程当中,你有什么takeaway可以给大家分享一下。
李世尊:我自己最大的takeaway就是一个公司在售卖自己产品的时候,营销特别重要。甚至有的时候如果我们在技术上投入一块钱,那么我们在营销上也应该投入一块钱。但我们原来在营销上特别抠,这就导致了在今天的市场上没有太多属于我们的声音,我们只在一个大客户的群体里面通过转介绍被熟知。我们没有销售,甚至市场部也刚刚组建。我觉得古人说的话还是非常对的,做事一定要高调。我们的竞争对手在PR方面做得十分出色,市场上也在做大量的投放,这些都是值得我们去学习的,营销对于即将出海的我们来说至关重要。还有第二点我觉得在组织架构上我们仍有不足,这也是我们管理层的一个缺陷,没有花更多的时间招募更优秀的人才。我们最近也在鞭策自己,要多动动脑子,而不是使蛮力,要在这个市场中获得更大的声量。
不同于寻常直播间与来往用户亲切交流的真人主播,虚拟主播公式化的口播内容与略显生硬的肢体语言可能会令普通用户感到迷惑,但低廉的成本和标准化的场景设置,也让越来越多的品牌和IP,愿意尝试了解虚拟主播这一依托于AI存在的新鲜事物,数字人行业目前仍是一个非常蓝海的市场,虚拟人畅行互联网世界的同时,未来也会有更多现象级的事件出现。
完整访谈内容欢迎访问小宇宙APP 「云谷创新谈」。
我们关注国内外最热的创新创业动态,提供一站式的资讯服务,实时传递行业热点新闻、深度评测以及前瞻观点,帮助各位创业者掌握新兴技术趋势及行业变革,洞察未来科技走向。