合成数据服务商「卓印智能」获天使轮融资

阿里云创新中心> 创业资讯> 合成数据服务商「卓印智能」获天使轮融资
0
0

合成数据服务商「卓印智能」获天使轮融资

融资大事件 2024-05-31 13:27:00 454
本轮融资后,卓印智能将着重投入到以Simulaix为核心的交付能力提升,以及自研世界模型“Terra-1”的商业落地验证上。

投资界(ID:pedaily2012)5月31日消息,「 卓印智能 」获得千万级天使轮融资,由 天使湾 创投独家投资。

如今,随着通用大模型规模的迅速扩大,数据短缺已经成为一个更现实而迫切的问题。早在2022年11月,就有MIT等研究人员发布相关论文,指机器学习数据集可能会在2026年之前耗尽所有“高质量数据”。

AI模型需要大量高质量的训练数据,才能生成准确、多样、无偏见的输出,但获取这种数据的成本和难度都很高——因此,合成数据成为一个有效解决手段。现在,包括微软、OpenAI、Cohere在内的公司都已经开始使用合成数据来训练AI模型。

Gartner表示,在2021年,所有人工智能训练数据中只有1%是合成数据,但到2024年底,合成数据可能会达到60%。而据plug and play预测,到2030年全球合成数据市场将会达到千亿美元。

「卓印智能」(Join AI)正是基于这样的背景,于2022年成立。团队先从自动驾驶赛道切入,为客户提供高质量的合成数据服务。截至2024年5月,团队已经获得自动驾驶、机器人领域多个头部客户超2000万的订单。

和传统的训练数据获取方式相比,卓印智能选择了“全自动”路线——端到端地生成训练数据。2023年,卓印智能基于自研扩散模型和世界模型技术路线,推出了AI训练数据生成模型“Simulaix”。

Simulaix可以生成媲美真实采集效果的生成数据,并可以在生成图像过程中直接根据生成逻辑自动提取同步生成标注区域,供企业客户直接使用。截至2023年Q4,Simulaix已经成功帮助企业客户提升了 10%以上的模型效果。

创始人俞开文博士 有多年AI算法、技术架构经验,曾经历任蚂蚁、百度等大厂中的资深AI架构师,有丰富的大型To B项目落地经验。他表示,从数据角度,优质数据的短缺一直是困扰AI赛道的难题。

“在各式各样的AI算法研究上,训练数据的获取都需要大量时间和金钱成本,AI工程师总是为数据所困。在很多项目里甚至会用超过一半的时间来处理训练数据。”俞开文博士表示。 但他认为生成式AI技术的出现会为这个行业带来质的飞跃。

【本文根据公开消息发布,如有异议,请联系(editor@zero2ipo.com.cn)投资界处理。】
版权声明: 创新中心创新赋能平台中,除来源为“创新中心”的文章外,其余转载文章均来自所标注的来源方,版权归原作者或来源方所有,且已获得相关授权,若作者版权声明的或文章从其它站转载而附带有原所有站的版权声明者,其版权归属以附带声明为准。其他任何单位或个人转载本网站发表及转载的文章,均需经原作者同意。如果您发现本平台中有涉嫌侵权的内容,可填写「投诉表单」进行举报,一经查实,本平台将立刻删除涉嫌侵权内容。

评论

登录后可评论
AI助理
登录插画

登录以查看您的控制台资源

管理云资源
状态一览
快捷访问

你好,我是AI助理

可以解答问题、推荐解决方案等