阿里云Startup平台推出AI24小时系列文章,网罗国内外最新的AI人工智能前沿资讯,帮助AI创业者掌握最新行业资讯。
1.斯坦福大学团队涉嫌抄袭中国清华大学团队开发的AI大模型 >>
斯坦福大学的学生团队Llama3-V被指控抄袭了清华大学团队开发的MiniCPM-Llama3-V 2.5模型。涉事的斯坦福学生Siddharth Sharma和Aksh Garg发出了致歉推文,承认了抄袭行为,并将主要责任归咎于另一位团队成员Mustafa Aljadery,他们声称Mustafa编写了项目代码,而他们自己负责推广。被指控为主要过错方的Mustafa Aljadery自事件发酵以来就无法联系到,他的社交媒体账户也已经设置为保护状态。斯坦福人工智能实验室主任Christopher Manning批评了该团队的行为,认为他们没有承认错误,而是试图找借口推脱责任。被抄袭的模型MiniCPM-Llama3-V 2.5的团队,面壁智能的CEO李大海和首席科学家刘知远,都对此事进行了回应,确认了Llama3-V是对他们模型的套壳,并讨论了开源共享的重要性。
1.企业搜索明星Glean为什么这么猛?>>
Glean是一家在企业搜索领域表现出色的公司,它通过为企业定制AI模型和构建知识图谱,打破了不同SaaS应用和数据结构之间的壁垒,同时避免了通用模型在信息准确性和安全性上的不足。Glean的主要功能包括个性化搜索、知识管理和工作主页,其搜索功能特别强调个性化和跨应用搜索能力。公司已经吸引了索尼电子和Databricks等大客户,并在2023年2月完成了2亿美元的融资,估值达到22亿美元,去年的年化收入为3900万美元,较上一年增长了近两倍。
2.RL4VLM表现甚至超越了GPT-4v>>
RL4VLM由UC伯克利等高校提出,主要研究者包括图灵奖得主、Meta首席AI科学家Yann LeCun,UC伯克利教授Sergey Levine等。RL4VLM通过强化学习直接对多模态大模型进行微调,无需人类反馈,赋予模型决策能力。该方法的创新点在于:直接使用环境提供的奖励信息进行微调,摆脱了对人类反馈的依赖。通过生成思维链再做决策,提高了任务的成功率。研究者使用了两类任务评估模型能力:
第一类任务(a-d):考验模型利用图像中的细粒度视觉信息做决策的能力,包括数字识别和逻辑推理。
第二类任务(e):考察模型在具身智能环境中的视觉语义推理能力。
3.AMD在Computex 2024上的重大发布>>
AMD宣布了每年更新芯片的产品策略,以与行业领导者英伟达竞争。AMD首席执行官苏姿丰(Lisa Su)强调了市场对新产品和能力的需求。AMD详细介绍了未来两年开发人工智能芯片的计划,以挑战英伟达在AI领域的领导地位。AMD宣布了第五代EPYC Turin处理器,具有192个核心和384个线程,预计在AI工作中性能比英特尔Xeon快5.4倍,将于2024年下半年推出。AMD推出了Ryzen AI 300系列处理器,特别是「Strix Point」APU,具备高达50 TOPS的AI性能,采用Zen 5c密度核心,并集成了XDNA 2 AI加速器。AMD展示了其芯片在各种工作负载中相对于英特尔和高通芯片的性能优势,包括在游戏和AI任务中的性能。
AI工具箱 >> 点击 进入
阿里云汇聚市面上最新、最全面的AI工具。从此,让你的创意不再遥远
#阿里云 #Create@AI创客松 #AI创业
ToB 企业软件的智能化正在经历从传统小模型、知识图谱驱动向大模型驱动的引擎升级。大模型已不仅仅局限在简单的生成或理解文本和图像数据,更成为AI智能体的超级大脑。
以大模型为核心的企业软件势在必行,如何将其融入业务并实现持续价值是企业面临的必答题。为此,第五季Create@Al 创客松,以“AI x 企业服务”为主题,邀约所有利用大模型能力构建企业服务产品的公司参加。
评论