AI早报 24年07月07日

AIGC最新资讯7个月前更新 AiBots
113 0 0

昨天(2024年07月06日),AI领域发生了多项重要事件和进展,这里汇总如下。

AI应用进展和演化

1-1. 穹彻具身大脑 Noematrix Brain机器人:现场削黄瓜、叠衣服,曾爆火的刮胡子

结合实体机器人,穹彻在完全开放的环境中向现场观众近距离展示了 “随手一扔就能叠的衣物折叠”(无限自由度物体操作,复杂物体理解堪比人类)和 “削完就能吃的黄瓜削皮”(不规则曲面操作,精细度甚至超越人类水平)等突破性技术,以及家庭地面整理等落地应用。通过这些实时演示和真实互动,穹彻具身大脑的通用性和鲁棒性得以全方位展现。据穹彻表示,Noematrix Brain 穹彻具身大脑聚焦在非结构化、开放场景、开放任务下的机器人智能边界的突破,与各种类型的机器人本体、甚至工业设备都能有机结合,包括但不限于工业机器人、人形机器人、服务型机器人、智能家居设备等等。

https://www.jiqizhixin.com/articles/2024-07-06-4

AI早报 24年07月07日
机器人可以完成柔性衣物的展开、识别与折叠等操作
AI早报 24年07月07日
AnyShave 同样可以用于黄瓜削皮等操作中,并组合其他技能一起使用,精细程度达到人类水平
AI早报 24年07月07日
1-2. WAIC 期间,联汇科技正式发布第二代多模态智能体 :OmAgent
今年联汇的第二代多模态智能体 OmAgent 有哪些惊喜?首先是感知模块全新升级。相较于 G-DINO 和联汇的第一代感知模型,OmDet V2 在每一个环节上都实现了 20 倍以上的速度提高。

第二是思考决策能力的提升。联汇第二代思考大模型 OmChat V2,基于多模态模型原生预训练的生成大模型,OmChat V2 支持高达 512K、50 万的上下文长度,折合视频长度 30 分钟,仅次于 Google Gemin-1.5,并远超 GPT-4o

OmAgent 框架包含了感知、记忆、决策等综合模块,整合OmDet等多个类型的大模型能力,推动智能体技术向更深层次、更广领域的赋能。

https://www.jiqizhixin.com/articles/2024-07-06-5

AI早报 24年07月07日

1-3. 中兴通讯罗炜:AI终端比拼的关键在跨设备生态互联|WAIC2024

此次中兴终端展出了六大AI应用场景,包括AI裸眼3D、AI同声传译与方言互译、AI安全反诈、AI智慧商务与创作、红魔魔方AI游戏,以及AI魔法影像等。同时,全球首款AI裸眼3D千元手机中兴远航3D、全球首款5G+AI裸眼3D平板nuiba Pad 3DⅡ,以及红魔AI游戏笔记本红魔游戏本16PRO等多款新品亦集中亮相。WAIC2024期间,中兴通讯副总裁、终端产品中心主任罗炜接受了财联社记者专访。在罗炜看来,AI手机是AI终端的一大核心入口,未来智能AI终端将百花齐放,而跨设备生态互联是AI终端未来比拼的关键。

https://ms.mbd.baidu.com/r/1m2HXE8uT9C?f=cp&rs=1060083411&ruk=1PJuPlec4ZGlYTqNPEAXQw&u=0a51761503df78c5&sid_for_share=80217_3

AI大模型算法和峰会

2-1. LLM用于时序预测真的不行:连推理能力都没用到

近日,弗吉尼亚大学和华盛顿大学一个团队尝试解答了这一问题,并最终给出了一个简单却又重要的主张:对于时序预测任务,使用语言模型的常用方法的表现都接近或劣于基本的消融方法,但前者所需的计算量比后者多几个数量级。但该团队也表示:「我们的目标并不是暗示语言模型永远无法用于时间序列。」事实上,近期一些研究表明语言和时间序列之间具有很好的互动潜力,可以处理时间序列推理和社交理解等任务。

相反,他们的目标是强调这一惊人发现:对于已有的时间序列任务,现有方法几乎没有用到预训练语言模型那与生俱来的推理能力。

https://www.jiqizhixin.com/articles/2024-07-06-2

AI早报 24年07月07日
其中绿色标记(消融方法)通常低于红色标记(LLM),并且集中于左侧,这说明它们计算成本更低但预测性能更好
2-2. 指令微调显著增强Gemma 2 9B/27B模型:中文通用对话、角色扮演、数学、工具使用等能力
Gemma 2 -27B的微调版本也上线后,根据HuggingFace主页信息,模型的下载量已经超过了3.4万。项目介绍显示,采用的微调算法是ORPO,ORPO将监督微调(SFT)和RLHF或DPO等偏好对齐方法合二为一,是一种非常聪明的算法。与原来的9B Gemma 2模型相比,微调的Gemma-2-9B-Chinese-Chat模型大大减少了「中文问题英文回答」和「中英文混杂回答」的问题,在角色扮演、工具使用和数学方面的表现都有所提高。就连应对「最佳中文训练数据」弱智吧的问题,都有非常出色的表现。

https://www.163.com/dy/article/J6DUFDIE0511ABV6.html

AI早报 24年07月07日
2-3.《心理学与人工智能杂志》:世界上第一本致力于心理学和人工智能的研究期刊发表了
Taylor & Francis宣布推出《心理学与人工智能杂志》,这是一本开放获取的杂志,旨在促进开发人工智能(AI)系统的技术专家与探索人类行为、认知和情感的心理学研究人员之间的对话。
随着人工智能技术越来越多地融入我们的生活,这份新杂志将发表关于人类与人工智能直接互动的报告,并探索它如何影响我们与世界互动和思考世界的方式。

公众号:人工智能与生物科技

世界上第一本致力于心理学和人工智能的研究期刊发表了

AI早报 24年07月07日
2-4. 港大和腾讯团队推出了全新多模态推荐系统范式DiffMM:比于各种竞争性基线模型均达到最优!
DiffMM创建了一个包含用户和视频信息的图,这个图会考虑视频的各种元素。
然后它通过一种特殊的方法(图扩散)来增强这个图,让模型更好地理解用户和视频之间的关系。
最后,它使用一种叫做对比学习的技术,来确保不同元素(比如视觉和声音)之间的一致性,这样推荐系统就能更好地理解用户的喜好。
为了测试效果,团队在三个公共数据集上进行了大量实验,结果证明DiffMM相比于各种竞争性基线模型均达到SOTA。作者进一步探索了DiffMM在数据稀疏问题上的表现,实验结果表明DIffMM中的跨模态对比学习方式可以有效缓解数据稀疏的问题,它通过使用图扩散模型生成的模态感知用户-物品图来获得高质量的自监督信号。

https://www.qbitai.com/2024/07/163204.html

AI早报 24年07月07日
论文地址:https://arxiv.org/abs/2406.11781

AI基础设施方面(含硬件、数据)

3-1. 上海交大、清华大学、剑桥大学、上海AILAB联合发布学术:视听数据集M3AV

该工作提出了一个新的多模态、多类型、多用途的视听学术演讲数据集(M3AV),它包含来自五个来源的近 367 小时的视频,涵盖计算机科学、数学、医学和生物学主题。凭借高质量的人工标注,特别是高价值的命名实体,数据集可以用于多种视听识别和理解任务。在上下文语音识别、语音合成以及幻灯片和脚本生成任务上进行的评估表明,M3AV 的多样性使其成为一个具有挑战性的数据集。目前该工作已被 ACL 2024 主会接收。此外,他们构建了基准并围绕数据集进行了多项实验。最终,论文作者发现现有的模型在感知和理解学术演讲视频方面仍有较大的提升空间

https://www.jiqizhixin.com/articles/2024-07-06

AI早报 24年07月07日

论文地址:https://arxiv.org/abs/2403.14168

3-2. 无问芯穹发布全球首个支持单任务千卡规模异构芯片混合训练平台HETHUB:集群资源利用率平均可达90%

无问芯穹联合创始人兼CEO夏立雪发布了无问芯穹大规模模型的异构分布式混合训练系统,千卡异构混合训练集群算力利用率最高达到了97.6%。同时,夏立雪宣布无问芯穹Infini-AI云平台已集成大模型异构千卡混训能力,是全球首个可进行单任务千卡规模异构芯片混合训练的平台,具备万卡扩展性,支持包括AMD、华为昇腾、天数智芯、沐曦、摩尔线程、NVIDIA六种异构芯片在内的大模型混合训练。7月起,通过试训申请的用户,已可在Infini-AI上一键发起700亿参数规模的大模型训练。

已有智谱AI、月之暗面等大模型公司在Infini-AI上稳定使用异构算力。

https://www.jiqizhixin.com/articles/2024-07-06-3

AI早报 24年07月07日

3-3. 曙光数推相变浸没液冷:能效比显著提升、能耗大幅降低,引领绿色智算新纪元

在WAIC的璀璨舞台上,曙光数创的相变浸没液冷技术成为了全场焦点。该技术通过将服务器等计算设备完全浸没于低沸点、非导电、高效散热的冷却液中,通过液体相变为气体,将热量从芯片直接导出。相比传统风冷技术,相变浸没液冷能效比显著提升,能耗大幅降低,有效解决了数据中心散热难题,为构建低碳、高效的智算中心提供了创新路径。

https://www.qbitai.com/2024/07/163292.html

AI早报 24年07月07日

AI人才、融资动态

4-1. 高盛发布生成式AI报告:生成式AI目前还无法解决证明自己成本合理的复杂问题,但即便如此,AI主题也依然有着很大发展的空间。

在高盛上个月发布的生成式AI报告中,分析师Jim Covello对AI行业发表了严厉的批评:「为了从昂贵的AI技术中获得足够的回报,AI必须解决非常复杂的问题,但目前它还做不到,甚至可能永远做不到。」红杉分析师提出6000亿美元问题红杉资本的分析师David Cahn也在最近发布的博文中,对全世界提出警告:人工智能泡沫,如今正在接近临界点!

不过,尽管有一些担忧和限制,高盛依然认为AI主题有着很大发展的空间——或是因为AI开始带来真正的变革,或是因为泡沫需要很长时间才会破裂。根据高盛的分析,在广泛采用之后,美国劳动生产率和GDP增长可能会累积增加多达15%。

https://www.163.com/dy/article/J6DUFRMQ0511ABV6.html

AI早报 24年07月07日
AI早报 24年07月07日

© 版权声明

相关文章

暂无评论

暂无评论...