对话熵简科技:站在DeepSeek的肩膀上,推开AI投研新世界的大门 | 高榕未来

阿里云创新中心> 创业资讯> 对话熵简科技:站在DeepSeek的肩膀上,推开AI投研新世界的大门 | 高榕未来
0
0

对话熵简科技:站在DeepSeek的肩膀上,推开AI投研新世界的大门 | 高榕未来

高榕创投 2025-02-21 11:00:49 265
从AI辅助投研,到AI辅助投资决策。

对话熵简科技:站在DeepSeek的肩膀上,推开AI投研新世界的大门 | 高榕未来

高榕创投 高榕创投 2025年02月21日 11:02

这个春节,DeepSeek凭借高性能模型、低训练成本和开源,引爆了全球AI界。


在技术创新的讨论之外,我们也非常关注——如何将模型能力落地到具体应用场景?垂直领域的创业者如何抓住DeepSeek带来的机会?


熵简科技率先验证了DeepSeek-R1和推理模型对于金融投研这一To B场景带来的质变。


熵简定位为AI投研领域的基础设施提供商。公司最早服务国内大型资管机构,帮助客户建设投研数据中心;大模型出现之后,熵简顺势推出了旗舰产品AlphaEngine——一款面向金融人士的专业AI搜索引擎,一年多时间实现机构投资者用户从0到40000+的增长,服务了国内5000+家资管机构。基于AlphaEngine,用户可以高效搜索和查阅各类行业研报、公告和会议纪要,并通过FinGPT与资料库进行问答。



DeepSeek-R1开源之后,熵简迅速行动起来,用DeepSeek-R1结合高质量的投研CoT(思维链)轨迹作为参考,蒸馏了国内首个具备深度推理能力的金融大模型FinGPT Deep,并搭载于AlphaEngine产品上。


“上线以后市场反馈很热烈,有很多用户截图说AI的回答太牛了,对比之前模型能力是质的提升。”熵简科技创始人、CEO费斌杰说道。

有了深度推理能力,AlphaEngine能实现哪些升级?我们看两个例子。

提问FinGPT:DeepSeek点燃A股后,有哪些实质意义上的关联标的?可以看到大模型通过多步推理,给出了自己的答案。


近期小米股价和市值一路上涨,未来的投资价值如何?这是FinGPT基于基本面、业务增长潜力和估值分析给出的回答,背后有着精准的资料溯源,并展示出投研分析的思考过程。


“我们看到了AI辅助投研向AI辅助投资决策演进的可能性。”近期,我们和费斌杰做了一次对话,分享如何站在DeepSeek的肩膀上,推开AI投研新世界的大门。


以下是费斌杰的分享:


DeepSeek-R1允许用户通过蒸馏技术训练其他模型,而且春节期间DeepSeek非常火爆,我们就想到用DeepSeek-R1来蒸馏熵简的FinGPT模型,那么就可以在算力有限的条件下支持用户的访问。我们调了不到30张GPU、用了2周的时间,将R1背后600多亿参数所蕴含的深度理解和长程推理能力迁移并蒸馏到FinGPT中,使其具备逻辑推理、因果分析和多步决策能力。

依托FinGPT的深度推理能力,AlphaEngine实现了三大核心功能升级:1)多步推理问答,2)精准资料溯源,3)融合分析师思维。

之所以我们能快速完成这项工作,并且让产品体验有了颠覆性的提升,源于熵简积累的全面深度的投研数据库和高质量的投研CoT。

实际上,目前投研领域的数据还远未被充分挖掘。几年前,大家高频接触的投研数据包括行情数据、财务数据、公告数据以及海内外研报;今天有一种新的形式出现了——会议。金融市场上每天都有大量的会议在发生,例如业绩会、券商分析师面向客户组织的各种公开和小型会议,这些会议时效性很高,也有非常大的价值。

熵简集合了全市场最全的会议纪要,全行业日均更新300+场次。有人会说,如果要高效挖掘这些会议数据的价值,前提是语音转文字的准确度要足够高,“把A公司误转译成B公司,AI分析能力再强也无济于事”,加之投研领域有很多专业词汇。因此熵简针对会议场景推出一个名为FinAudio的模型,支持将投研领域会议音频准确地转写为文本。

由于FinGPT背后接的是行业的私域资料库,它的回答相比通用大模型更加贴近用户需求。比如提问《哪吒2》上映后有哪些值得关注的关联股票,其他大模型参考的可能是互联网上的新闻报道等资料;FinGPT参考的是一篇专家访谈、一篇研报,亦或是某个券商首席的会议分享。


此外,熵简也积累了几十万的高质量投研CoT、即推理过程数据集作为冷启动,也让整个工作更快完成、模型效果更佳。


我们很早就在关注推理模型。OpenAI从Q*到Strawberry再到o1,原理都是将推理算力scale up之后,大模型推理能力提升,并且能涌现复杂的思考逻辑。o1本质上是把原本在大模型之外的推理的思维链能力内化到LLM中了。

DeepSeek-R1的横空出世,标志着一个全新的转折点。DeepSeek不单纯的是把OpenAI的能力学过来,复刻一个开源版的o1;而是在算法、并行计算等方面有自己独到见解和创新,例如纯强化学习激发推理能力、GRPO算法等。DeepSeek不是纯粹站在巨人肩膀上,自己也成为了一个新的肩膀。

读了R1的论文,我们感到非常兴奋,因为带给垂直领域的AI厂商颠覆性的改变。

1. DeepSeek验证了用蒸馏方法可以把大模型的推理能力迁移至小模型,使得小模型的性能得到显著提升甚至超越原来的大模型。带给我们的启发是,想要训练一个行业模型,最好的方式是拿一个开源的基座模型去蒸馏行业小模型。

2. 有人说R1出来以后行业模型不复存在了;我们认为恰恰相反,有了R1,我们完全可以在一个垂直细分领域快速训练出一个在行业中表现胜于R1的模型。

背后是2个逻辑:1)一个行业模型和一个同等参数规模的通用模型相比,经过行业训练后模型在行业领域的性能会显著提升;2)把一个大模型推理能力蒸馏到一个小模型,这个小模型处理行业问题的能力显著高于其他同等规模的小模型。

3. 通用模型和行业模型一定是共生关系。可以想象一棵树,通用模型是主干,行业模型是枝干,当主干向上生长,侧边会长出新的枝干。新的枝干也就是行业模型,在领域中的能力一定会比通用模型优一个量级。

直到通用模型再往上进一个台阶,我们再在基础上训练行业模型,继续为行业带来新的变化。

4. DeepSeek-R1验证了只要做纯粹的强化学习,不需要大规模的标注数据,不需要做SFT(监督微调),就能让大模型自己涌现推理过程。这提示我们,模型蒸馏应该准备行业特定训练集,而且训练集不需要靠人工标注,应该更多由机器以规则化的方式来生成。

换言之,只需要准备特定行业足够多有明确结论的数据集,就能批量生成无穷无尽的训练集。例如让大模型推荐下周最有可能上涨的10支股票,大模型自己通过各种各样的方式去推理最后给出答案,我们可以用一套明确规则化的评判系统检验这10支个股接下来一周的市场表现。当评判模型(股票涨跌)是100%准确的,训练成本大幅下降,收敛速度也会快速提升。

5. 几年前我们训练行业模型,需要让从业人员大量标注数据、贡献知识,例如问模型某某公司应该怎么分析其投资价值,那就需要分析师搭一个知识框架和图谱丢给机器学习。而今天大模型通过强化学习能够自己涌现智能。

这是R1为第三方AI厂商带来的重要机会。以往我们的痛点是没有那么庞大的投研团队去贡献知识,现在可以靠涌现的方式来攻克,那么距离行业智能化就不再遥远。


从实际应用角度看,随着大模型推理能力的进化,AlphaEngine可以实现此前受限的一些客户需求。

去年我们就做了大量客户调研,整理出一个涵盖30多项功能的AI辅助投资“愿望清单”。上一代大模型大概只能满足其中20%的需求;有了推理模型,可以基本实现50%的需求。

例如最近攻克的一项能力——AI挖掘投资线索。挖掘投资线索是资管行业最核心的能力,投研本质上是在不确定性的信息中去挖掘出正确的非共识。投资机会又包括短期机会(1周以内)、中期机会(1-3个月),以及长期机会。越是长期机会推理难度越大,因为其中思考的深度越深。目前推理大模型的能力比较适合挖掘一些短中期机会。

这也意味着R1的出现为智能投研打开了一个很大的新空间。借用无人驾驶的L1到L4概念,之前我们做到的是L1,即AI辅助投研,在搜索资料的时候AI帮你找得更准,可能替代的是实习生;R1出现之后,我们发现AI可以向辅助投资决策的方向演进,即L2,从中短期开始探索尝试,未来逐步迈向长线投资。

未来再进一步,我们认为智能投研的产品形态一定是朝着AI Agent的方向去演进的。从用户体验来说,除了自己搜索,未来大模型可以每天为你整理和加工日报、主动推送给你,乃至自动执行一些任务。

畅想智能投研的L4终局形态,可能每一家基金公司就是一个AI。员工要做的是喂给AI数据,为它挑选优质的训练集,准备行业中独家的优质资料,又或是访谈专家之后同步纪要,然后把这些数据给到大模型做综合判断。


我们的产品之所以命名为AlphaEngine,是希望打造一个引擎帮助投资者去产生Alpha(超额收益)。

我们坚定相信,深度推理型AI会成为全新的Alpha来源。关键是看投资机构谁能把握得更快,把AI能力内化。

为什么这么说?假设你是一位非常勤奋的投资经理,每天工作10个乃至12个小时,那一天参加8个会议基本是上限,加上每天市场上都会出现大量的新研报,还有各个媒体和大V的文章,个人是没精力读完的。而AI每天都可以读完所有资料,再深度分析其中有哪些有价值的线索和机会。这件事情本身人做不到,但是机器可以做到。

未来,熵简也将持续深耕投研领域,并将AI的能力贯穿到投研人士的工作流中。例如熵简已上线专家服务模块,利用AI帮助投研人员高效匹配专家资源,让专家call的价值充分发挥。


大模型狂奔之下,垂直领域的厂商更加应该做深做透,只有做到行业里最极致,才能去体现价值,价值再变成利润。就像我们一直所说的,“挑2厘米宽度的事,把它做到2米深”。

福利时间

投研神器AlphaEngine免费VIP权益


Web端:https://www.alphaengine.top

小程序端:AlphaEngine

APP端:https://www.alphaengine.top/app/index.html


在小程序或App端“我的”页面,输入“gaorong”权益码即刻兑换1个月VIP权益。先到先得,送完即止。






评论

登录后可评论