主页 > 快资讯 > 正文

深度学习红利见顶,AI“敢问路在何方”?潘云鹤、姚期智两院士支招(2)

2022-09-07 19:25来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

2012年,这块空白被神经网络所填补,人工智能发展进入第三阶段,此后发生的一切,大家便熟知了, 深度神经网络在视觉识别、听觉识别、文字识别、多媒体人工智能方面得到了极大突破 ,但同时也产生了很多缺点,比如不可解释的“黑盒”、大量需要标注的数据。

“这些缺点都和只采用数据而不采用知识有很大关系。”潘云鹤表示,现在人们常说AI的逻辑能力很难训练,但其实早期的AI逻辑能力很强,只是现在这一轮的深度神经网络技术没有这个能力,所以要将两者联合起来使用,他称之为“知识和数据共同驱动”的人工智能。

潘云鹤指出, 人工智能第四阶段是将数据和跨媒体智能、跨媒体知识表达相结合 ,对视觉的对象进行识别、分析和模拟,其中,开路先锋很可能就是视觉、文字等其他知识的多重知识表达,也即这两年技术上正在突破的多模态人工智能。

比如,此次大会讨论的中心“元宇 宙”,便是典型的跨媒体人工智能。元宇宙要同时模拟物理世界和人类社会,这需要人工智能不仅有大量的设备识别,还要大量的视觉生成。

潘云鹤以数字人为例解释,它不但要表现人的外观、动作、感知、人的认知能力,还要表现人的个性化数据,“ 数字人本身就是一个人的跨媒体知识表达,是元宇宙的难点 ”。

清华大学在“多模态学习”方面的研究也开展多时。上海期智研究院院长姚期智介绍,清华大学交叉信息研究院赵行研究组正在将多模态学习从理论推向实际应用,目前已经可以让AI根据配音脚本,自动生成与画面节奏同步的高质量配音。据了解,这项研究是利用视频中的嘴部运动控制生成语音的韵律,以达到语音和视频同步。

可喜的是,近年来,人工智能产学研协同的速度越来越快。据《IT时报》记者了解,腾讯已经将多模态融合应用于计算机视觉研究,为交通银行提供多个场景下的视觉AI解决方案,可快速处理用户上传图片不清晰、用户证件照片识别、资料印章模糊干扰、用户证件PS鉴伪等问题,从而提升银行交易流程效率,提升用户办理业务体验。

自动驾驶认不出“雪糕桶”

99科技网:http://www.99it.com.cn

相关推荐
【深度剖析】玖惠仓是什么?玖惠仓公司简介? 【深度剖析】玖惠仓是什么?玖惠仓公司简介?

聪明的人总是能够跟上时代的发展趋势。就比如说现在,目前发展的大趋势就是

快资讯2022-09-07

深度 | 社交元宇宙的进化论 深度 | 社交元宇宙的进化论

现阶段,无论是VR硬件的性能,还是内容开发的成本,均限制着元宇宙朝着“硬

快资讯2022-09-01

万亿级AI市场:几家欢喜几家愁,谁收获了人工智能红利? 万亿级AI市场:几家欢喜几家愁,谁收获了人工智能红利?

在过去几年中,人工智能得到前所未有的发展。

快资讯2022-09-01

基于机器学习的因果推断方法研究进展 基于机器学习的因果推断方法研究进展

基于机器学习的因果推断方法研究进展。

快资讯2022-09-01

理论计算机科学家 Boaz Barak:深度学习并非“简单的统计”,二者距离已越来越远 理论计算机科学家 Boaz Barak:深度学习并非“简单的统计”,二者距离已越来越远

几千年来,科学家们一直在为观测结果拟合模型。

快资讯2022-08-30

Nature子刊 | 像婴儿一样学习,DeepMind新模型28小时学会物理世界规则 Nature子刊 | 像婴儿一样学习,DeepMind新模型28小时学会物理世界规则

DeepMind 旨在建立一个能够直观学习物理学的模型。

快资讯2022-08-30

理论计算机科学家 Boaz Barak:深度学习并非“简单的统计”,二者距离已越来越远 理论计算机科学家 Boaz Barak:深度学习并非“简单的统计”,二者距离已越来越远

统计学习在深度学习中扮演着重要的角色,这是毋庸置疑的。

快资讯2022-08-30

​被误解的机器学习 ​被误解的机器学习

数字孪生、数学模型这些概念,在离散制造业和流程行业是有差别的。

快资讯2022-08-30

针对深度学习的“失忆症”,科学家提出基于相似性加权交错学习 针对深度学习的“失忆症”,科学家提出基于相似性加权交错学习

本文介绍了神经科学和机器学习的进一步发展。

快资讯2022-08-30

AI真的能为学习机注入灵魂吗? AI真的能为学习机注入灵魂吗?

期待,未来随着AI 学习机的不断发展,帮助更多孩子爱上学习,促进教育数字化

快资讯2022-08-30