主页 > 元宇宙 > 正文

迈向可验证的 AI: 形式化方法的五大挑战(5)

2022-09-06 12:39来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

学习系统的建模

在形式验证的大多数传统应用中,系统 S 在设计时是固定的且已知的,比如它可以是一个程序,或者一个用编程语言或硬件描述语言来描述的电路。系统建模问题主要涉及的,是通过抽象掉不相关的细节,来将 S 减小到更易于处理的大小。AI 系统给系统建模带来了非常不同的挑战,这主要源于机器学习的使用: 高维输入空间 用于感知的 ML 组件通常在非常高维的输入空间上运行。比如,一个输入的RGB 图像可以是 1000 x 600 像素,它包含256((1000x600x3)) 个元素,输入通常就是这样的高维向量流。尽管研究人员已经对高维输入空间(如在数字电路中)使用了形式化方法,但基于 ML 的感知输入空间的性质是不同的,它不完全是布尔值,而是混合的,包括离散变量和连续变量。 高维参数/状态空间 深度神经网络等 ML 组件具有数千到数百万个模型参数和原始组件。例如,图 2 中使用的最先进的 DNN 有多达 6000 万个参数和数十层组件。这就产生了巨大的验证搜索空间,抽象过程需要非常仔细。 在线适应和进化 一些学习系统如使用 RL 的机器人,会随着它们遇到的新数据和新情况而发生进化。对于这样的系统,设计时的验证必须考虑系统行为的未来演变,或者随着学习系统的发展逐步地在线执行。 在上下文中建模系统 对于许多 AI/ML 组件,它们的规范仅仅由上下文来定义。例如,要验证图 2 中基于 DNN 的系统的安全性,就需要对环境进行建模。我们需要对 ML 组件及其上下文进行建模的技术,以便可以验证在语义上有意义的属性。 近年来,许多工作都专注于提高效率,来验证 DNN 的鲁棒性和输入-输出属性。然而,这还不够,我们还需要在以下三个方面取得进展: 自动抽象和高效表示 自动生成系统的抽象一直是形式方法的关键,它在将形式方法的范围扩展到大型硬件和软件系统方面发挥着至关重要的作用。为了解决基于 ML 的系统的超高维混合状态空间和输入空间方面的挑战,我们需要开发有效的技术来将 ML 模型抽象为更易于形式分析的、更简单的模型。一些有希望的方向包括:使用抽象解释来分析 DNN,开发用于伪造有 ML 组件的网络物理系统的抽象,以及设计用于验证的新表示(比如星集)。 解释与因果 如果学习者在其预测中附上关于预测是如何从数据和背景知识中产生的的解释,那我们就可以简化对学习系统进行建模的任务。这个想法并不新鲜,ML 社区已经对诸如“基于解释的泛化”等术语进行了研究,但是最近,人们正在对使用逻辑来解释学习系统的输出重新产生了兴趣。解释生成有助于在设计时调试设计和规范,并有助于合成鲁棒的 AI 系统以在运行时提供保障。包含因果推理和反事实推理的 ML 还可以帮助生成用于形式方法的解释。 语义特征空间 当生成的对抗性输入和反例在所使用的 ML 模型的上下文中具有语义意义时,ML 模型的对抗性分析和形式验证就更有意义。例如,针对汽车颜色或一天中时间的微小变化来分析 DNN 对象检测器的技术,比向少量任意选择的像素添加噪声的技术更有用。当前,大多数的方法在这一点上都还达不到要求。我们需要语义对抗分析,即在ML 模型所属系统的上下文中对它们进行分析。其中额的一个关键步骤,是表示对 ML 系统运行的环境建模的语义特征空间,而不是为 ML 模型定义输入空间的具体特征空间。这是符合直觉的,即与完整的具体特征空间相比,具体特征空间在语义上有意义的部分(如交通场景图像)所形成的潜在空间要低得多。图 2 中的语义特征空间是代表自动驾驶汽车周围 3D 世界的低维空间,而具体的特征空间是高维像素空间。由于语义特征空间的维数较低,因此可以更容易地进行搜索。但是,我们还需要一个“渲染器”,将语义特征空间中的一个点映射到具体特征空间中的一个点。渲染器的属性如可微性(differentiability),可以更容易地应用形式化方法来执行语义特征空间的目标导向搜索。

99科技网:http://www.99it.com.cn

相关推荐
报告:想学AI的学生数量已涨200%,老师都不够用了 报告:想学AI的学生数量已涨200%,老师都不够用了

随着神经网络的卷土重来以及深度学习的蓬勃发展——让想学AI的学生越来越多

元宇宙2022-09-06

Batch大小不一定是2的n次幂!ML资深学者最新结论 Batch大小不一定是2的n次幂!ML资深学者最新结论

在神经网络训练中,2的n次幂作为Batch大小已经成为一个标准惯例,即64、128、

元宇宙2022-09-06

​被误解的机器学习 ​被误解的机器学习

创新中有个特点: 无知的人经常会提出荒唐的要求,就像古人希望郎中给他长

元宇宙2022-09-06

商汤的另一面 商汤的另一面

作为AI行业的龙头企业, 商汤科技 当下受市场关注的程度,说是AI赛道的 “晴

元宇宙2022-09-06

3D机器视觉厂商的场景争夺战役 3D机器视觉厂商的场景争夺战役

2025年国产厂商可参与的机器视觉市场空间有望达到356亿元,2021-25E CAGR达29%,保

元宇宙2022-09-06

机器学习的3大“疑难杂症”,因果学习是突破口 | 重庆大学刘礼 机器学习的3大“疑难杂症”,因果学习是突破口 | 重庆大学刘礼

重庆和许多西部城市一样,常常被诟病为“互联网荒漠”,但它却有着很好的物

元宇宙2022-09-06

AI 步态识别突破的秘密,藏在NVIDIA® DGX系统里 AI 步态识别突破的秘密,藏在NVIDIA® DGX系统里

常用的生物识别方法包括人脸识别、指纹识别、虹膜识别、步态识别等。

元宇宙2022-09-06

三年亏损超八亿  被明星股东不断“减持”的思必驰 三年亏损超八亿  被明星股东不断“减持”的思必驰

7月15日,思必驰科创板申请获上交所受理,保荐人中信证券。

元宇宙2022-09-06

马斯克把脑子上传到云端是一个彻头彻尾的商业和科技谎言 马斯克把脑子上传到云端是一个彻头彻尾的商业和科技谎言

据他自己说把自己的脑子传上了云端,很多人都信以为真了。

元宇宙2022-09-06

百度到2030年可能成为中国市值最高的公司 百度到2030年可能成为中国市值最高的公司

虽然百度可能不会在“搜索”领域看到直接竞争,但可能会承担来自社交媒体、

元宇宙2022-09-06