重磅！斯坦福李飞飞教授团队新研究登 Nature 子刊(3)

2022-09-02 16:40来源：未知编辑：admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

数据标注

数据标注也是数据偏差的一个主要来源。尽管 AI 模型可以容忍一定程度的随机标签噪声，但有偏差的错误会产生有偏差的模型。目前，我们主要依赖于人工标注，成本很昂贵，比如标注单个 LIDAR 扫描的成本可能超过 30 美元，因为它是三维数据，标注者需要绘制出三维边界框，比一般的标注任务要求更高。因此作者认为，我们需要仔细校准 MTurk 等众包平台上的标注工具，提供一致的标注规则。在医疗环领域，还要考虑到标注人员可能需要专业知识或者可能有无法众包的敏感数据。降低注释成本的一种方法是数据编程。在数据编程中，AI 开发人员不再需要手动标记数据点，而是编写程序标签函数来自动标注训练集。如图 3b，使用用户定义的标签函数为每个输入自动生成多个可能有噪声的标签后，我们可以设计额外的算法，来聚合多个标签功能以减少噪声。图 3b：数据编程。另一种降低标注成本的「人在回路」（human-in-the-loop）方法是优先考虑最有价值的数据，以便我们通过主动学习（active learning）来进行标注。主动学习从最佳实验设计中汲取思想，在主动学习中，算法从一组未标注的数据点中选择信息量最大的点，比如具有高信息增益的点或模型在其上具有不确定性的点吗，然后再进行人工标注。这种方法的好处是，所需的数据数量比标准的监督学习所需的数据量要少得多。

数据增强

最后，当现有数据仍十分有限时，数据增强就是一种扩充数据集和提高模型可靠性的有效方法。计算机视觉数据可以通过图像旋转、翻转和其他数字转换来增强，文本数据可以通过变换自动书写风格来增强。还有最近的 Mixup，是一种更复杂的增强技术，它通过对训练样本对进行插值来创建新的训练数据，如图 3c。除了人工数据增强之外，目前的 AI 的自动化数据增强流程也是一种流行方案。此外，当未标注的数据可用时，还可以通过使用初始模型进行预测（这些预测称为伪标签）来实现标签增强，然后在具有真实和高置信度伪标签的组合数据上训练一个更大的模型。图 3c：Mixup 通过创建对现有数据进行插值的合成数据来扩充数据集。蓝点表示训练集中的现有数据点，红点表示通过插值两个现有数据点创建的合成数据点。

用于评估和监控 AI 模型的数据

99科技网：http://www.99it.com.cn

共5页:
上一页
1
2
3
4
5
下一页

相关推荐

斯坦福李飞飞团队新研究登Nature子刊：实现可信AI，数据的设计、完善、评估是关键
在当前 AI 模型的开发以模型为中心转向以数据为中心的趋势下，数据的质量变

快资讯2022-09-01

斯坦福李飞飞团队新研究登 Nature 子刊：实现可信 AI，数据的设计、完善、评估是关键
数据的设计、完善、评估三大步骤是关键。

快资讯2022-09-01

重磅发布|从“造物节”看平台驱动下的敏捷创新
数字经济时代，随着各类数字平台壮大，越来越多的小微企业飞速成长、高频创

快资讯2022-08-27

终于iOS 16重磅功能来了：iPhone14 Pro专属
5月30日，有消息人士向彭博社“Power On”的马克·古尔曼透露，苹果即将发布的

快资讯2022-08-15

十周年重磅更新！魅族新版Flyme发布：两年前的机型也能升级
6月30日，魅族官方宣布，最新Flyme 9.3大版本正式开放全量推送，新版本适配最新

快资讯2022-08-15

释放大量空间！微信PC版迎来重磅更新：终于能进行存储管理了
5月31日消息，小雷发现微信PC版推送了3.7.0正式版更新，没有收到推送的朋友，

快资讯2022-08-12

宇通重磅发布“超基因价值链”，全面引领客车行业价值升级
这是最特别的时代，也是大有可为的时代。当前，随着国家“双碳”战略和交

快资讯2022-08-11

该换新机了！iPhone14重磅功能提前曝光：息屏显示稳了
不久前，有消息人士向彭博社记者马克·古尔曼透露，苹果发布的iOS 16将会支持

快资讯2022-07-24

腾讯公布“车云一体化”战略布局推出智能汽车云等重磅产品
6月24日，“TIME Day·腾讯智慧出行2022新品发布会”于线上举行。会上，腾讯智慧

快资讯2022-07-18

VR沉浸式通信公司ENGAGE XR与HTC VIVE和斯坦福大学建立合作伙伴关系
日前， VR沉浸式通信公司ENGAGE XR宣布与HTC VIVE和斯坦福大学的虚拟人机交互实验

快资讯2022-06-24

头条资讯

元宇宙概念为何爆发，互联网技术枯竭

音乐对顾客心理的影响

县级加盟什么店挣钱？

加盟雪丰建材需要什么条件？

未来经济发展的趋势？

推荐资讯

win7系统应用程序提示0x00000010错误怎么解决方法

OPPO,Vivo,华为，小米，哪个手机和智能手表更胜一筹？

在小县城开一家什么店比较赚钱?

在县城，做什么项目能挣大钱？

未来价值投资在哪里，未来经济世界又有着怎样的联系？

最近更新

企服新浪潮，从数字藏品到元宇宙

趋势前瞻：Web3里的中国力量

红洞张贝龙：中国Web3发展过程中亟待解决的问题

莫晓康：隐私计算是区块链入场实体经济的门票

打通数据要素梗阻，区块链恰逢其时