深度学习红利见顶,AI“敢问路在何方”?潘云鹤、姚期智两院士支招(3)
扫一扫
分享文章到微信
扫一扫
关注99科技网微信公众号
向新的技术方向前进,是人工智能发展10年后的顺势而为。
如今,数据、算力、算法是公认“AI三件套”,其中,大数据是基础中的基础。究其原因,在于深度学习本质是寻找规律,利用大量没有加工处理过的数据,通过概率的方式不断寻找重复出现的模式。也就是说,一种模式出现次数多了,就会被人工智能认为是正确的,但它为何会得出这个结论,中间的过程是个“黑箱”。
因此,我们常听到这样的说法,如果某个模型还不够准确,那是数据还不够多,需要更多的数据“投喂”。甚至有时候,AI会自动形成“偏见”,比如此前谷歌便被质疑“性别歧视”,搜索“工程师”,出现的图片结果大多是男性,这是因为现实生活中的工程师以男性居多。
但当人工智能具有越来越普遍的应用价值时,以海量数据和超强算力为主的深度学习技术,不仅没办法解决所有问题,甚至出现新的风险。上文中,记者看到的“隐身衣”,便是一种“对抗样本攻击”,通过在输入数据中添加扰动,从而使系统做出错误判断。
瑞莱智慧RealAI合伙人、高级副总裁朱萌告诉《IT时报》记者,测试显示, 在自动驾驶场景中,通过修改锥桶的形状,可以让汽车感知模块失效,径直撞上去;而通过带有特制花纹的眼镜,他们数分钟便刷开了数十部商用手机的人脸密码。
同时,低数据效率也使得强化学习发生很大缺陷,打败李世石的AlphaGo需要的数据量,一位职业棋手要花两万年才能学完,这意味着,在一些小样本的场景中,识别准确率将大打折扣。
Robust.AI 创始人、纽约大学名誉教授 Gary Marcus在今年3月的一篇论文中也以特斯拉未能识别“举着停车标志的人”的案例说明,由于这个场景远远超出了训练数据库,以至于系统不知道该怎么做。
“
占领制高点议题
“为了人工智能将来的发展,我们必须在基础研究上做大量工作。”姚期智指出,生成原始创新的生态,中国研究学者必须做到“人无我有”。
清华大学交叉信息研究院高阳研究组去年在高效率强化学习上实现了突破。
Atrai游戏是目前强化学习领域最常用的性能测试标准之一。2015年,Deep Mind团队提出的算法DQN,通过200M帧训练数据,在Atari游戏上达到了人类平均水平。但高阳团队提出的EfficientZero仅使用了DQN需求数据量的1/500,2小时便实现了同等效果。
99科技网:http://www.99it.com.cn
