随着数字化转型与人工智能技术高速发展,企业正积极探索如何将业务数据与前沿大模型相结合,以前所未有的方式实现数据价值的深度挖掘与高效利用,从而助力企业解决复杂业务问题中的应用场景。
北京数据项素智能科技有限公司(下面简写为“数据项素”)在2022年崭露头角,致力于大模型应用落地、非结构化数据的价值挖掘、信息处理自动化与数据即服务。创始团队拥有强大的产品、技术及市场基因,具备全栈自主研发能力及商业化落地能力。
AIGS(Artificial Intelligence Generative Skill)是统一架构的多源开放的Agent开发平台,数据项素自研领先的企业级开源大模型应用开发平台文擎毕昇,为大模型应用提供高价值数据要素供给与技能为中心的LLM开发工具链,帮助用户快速构建大模型通用应用及个性化端到端解决方案,赋能和加速大模型数智应用开发落地。
数据项素的CEO蔡斯扬指出,大模型从模式识别、机器学习逐步进化至今天的认知智能时代,每一阶段都催生出新的技术和商业可能。特别是在GPT时代,大模型已经超越了简单的程序代码形态,为社会生产力带来了革命性改变。他认为,在未来的发展中,“应用”将是决定大模型能否真正成为社会生产力变革的关键因素,只有将其融入具体应用场景,才能实现价值。
数据项素的产品矩阵围绕大模型技术展开,构建了三大核心板块:首先,自研国内首个商业化落地的多模态通用信息提取大模型文擎励心及检索增强算法优化,为大模型提供数据预处理,大幅提高模型输出的准确率;其次,开发了一套极致高效的大模型应用开发工具链平台文擎毕昇,构建低代码、可复制搭建的企业级技能应用,降低开发者门槛,提高应用构建效率;最后,针对各行业细分市场,深入业务价值精心打造了一系列具有针对性的大模型通用应用及个性化端到端解决方案。
在实际操作中,数据项素不仅致力于解决大模型在复杂业务场景下的适应性问题,还通过引入传统技术和规则来提升其稳定性,并注重优化成本投入,确保客户获得最优的投资回报率。
面对大模型带来的广阔市场机会,数据项素积极布局,聚焦于提供高质量数据和知识增强服务,创新采用灵活的合作模式和易用的开发工具,鼓励更多的程序员和最终用户参与到大模型的共建之中。
数据项素的大语言模型(LLMs)应用开发平台可快速自定义个性化技能与应用,洞察海量非结构化数据价值,立即从文档中精准捕获信息并提升处理效率。该平台允许用户灵活选择开源和商业化的大语言模型进行设计、测试和部署,并可以创建各种应用程序,如聊天机器人、工作助手和文档处理等。通过文擎毕昇平台,用户可以连接企业内部网盘、即时通讯应用、办公电脑等数据源。
此外,该平台还提供了丰富的工具和工作流程,以提高大模型应用开发的效率,并支持多种模式的云端和私有化部署。文擎毕昇平台的多模态信息处理能力和易用性,可以实现人力节省和业务效率的提升。
蔡斯扬说到:“开源的大模型应用开发平台,降低了参与门槛,提升了用户体验,吸引了大量的社区关注和积极参与。仅数月时间,我们在GitHub上的开源项目便获得了近5K个star,微信活跃用户群也突破了2000人规模。”
尽管创业路途坎坷,但蔡斯扬表示公司日益壮大、团队凝聚力增强以及客户给予的认可与信任,这些都成为他们坚定前行的强大力量。
“初创公司在资源匮乏的情况下,阿⾥云扮演了关键的支持角色。”蔡斯扬表示,“阿⾥云对有想法的中国创业者的关注和支持是极为重要的。阿⾥云为创业者提供了丰富的资源与支持网络,帮助初创企业拓宽市场触达范围,进行有效的推广宣传。通义千问作为中文大模型的开源项目,在该领域内备受关注和追捧。我们将借力阿里云资源专注大模型应用开发,为金融、央国企等市场提供更多优质的产品和服务。”
数据项素加入阿⾥云的创业者计划,通过云计算平台提供的友好合作环境应对高昂计算硬件设备所带来的成本压力,租赁高性能GPU进行模型微调,满足训练所需的大量计算资源需求。同时,他们通过共享更多模型成果到开源社区,让更多开发者和最终用户有机会体验和利用大模型带来的技术革新。
蔡斯扬用两个关键词概括阿里云创业者计划,即开放和发展。一方面,阿⾥云提供开放源码社区,向广大开发者提供优质的开源基座,助力开源大模型技术生态系统的成长。另一方面,阿⾥云凭借深厚经验和庞大资源积累,引领初创企业稳健成长,实现目标。
在大模型与企业应用深度融合的领域中,数据项素作为积极的创新者角色,凭借其深厚的技术背景和专业团队助力大模型应用发展。与此同时,阿里云所推出的创业者计划也将在这一进程中发挥助推作用,为数据项素这样的创新型企业发展提供强有力的支持。
2023年9月21日,阿里云正式推出阿里云创业者计划,联合知名投资机构、加速器、创服机构以及大企业创新力量,旨在为初创企业提供全方位的赋能与服务,助力创业公司在阿里云上快速构建自己的业务,开启智能时代创业新范式。