主页 > 快资讯 > 正文

DeepMind又放大招！用大型语言模型实现可信推理，距离模型可解释性又近了一步(2)

2022-09-15 17:30来源：未知编辑：admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

研究人员观察到，在删除掉模型认为无法忠实回答的问题之后，模型性能得到显著提高。他们相信，这种方法有助于提高模型在以精确度（而非召回率）为优先的现实世界中的可信度与安全性。

实际效果

在这次实证研究中，该团队将自己的选择推理系统与 Proof Writer（PW）和 EntailmentBankQA（EB）数据集上的基准模型进行了比较。他们提出的模型在 PW 和 EB 上分别实现了 88.1% 和 78.1% 的最终答案准确率，大大优于基准模型。

这项工作表明 DeepMind 提出的新方法确实能在不牺牲模型性能的前提下，通过多步推理对问题做出忠实回答。虽然该研究目前只侧重于给定上下文中的多步骤推理，但该团队已经计划在未来的工作中利用检索进一步充实上下文信息。

从实际性能来看，尽管存在“只能执行可信推理”的限制，该模型的实际表现仍然非常出色。考虑到如果一项技术要想安全普及、为大众所接受，就必须能够通过审计检验，此次研究可能代表语言模型正向着可解释性迈出重要一步。

声明

来源：AI前线， RAD极客会推荐阅读，不代表RAD极客会立场，转载请注明，如涉及作品版权问题，请联系我们删除或做相关处理！

99科技网：http://www.99it.com.cn

共3页:

2

相关推荐

DeepMind创始人：AI 的强大，超乎我们的想象

DeepMind创始人：AI 的强大，超乎我们的想象

有人认为 AI 已经穷途末路，但一些绝顶聪明的人还在继续求索。

快资讯2022-09-15

DeepMind 发了篇论文，把我看笑了

DeepMind 发了篇论文，把我看笑了

DeepMind 一直是通用人工智能（AGI）探索路上的先行者。

快资讯2022-09-15

给我1张图，生成30秒视频！｜DeepMind新作

给我1张图，生成30秒视频！｜DeepMind新作

近日，DeepMind提出了一种基于概率帧预测的图像建模和视觉任务的通用框架——

快资讯2022-09-15

DeepMind创始人Demis Hassabis：AI 的强大，超乎我们的想象

DeepMind创始人Demis Hassabis：AI 的强大，超乎我们的想象

有人认为 AI 已经穷途末路，但一些绝顶聪明的人还在继续求索。

快资讯2022-09-15

【AI】隔空论战：DeepMind声称用AI首次在量子尺度上模拟物质，俄罗斯科学家不同意了

【AI】隔空论战：DeepMind声称用AI首次在量子尺度上模拟物质，俄罗斯科学家不同意了

随着人工智能和量子科学领域越来越紧密地交织在一起，这方面的研究也逐渐被

快资讯2022-09-13

钱包金融最新消息： 2022又一波清退进行中，清退指日可待！即将展开回款工作~揭晓

钱包金融最新消息： 2022又一波清退进行中，清退指日可待！即将展开回款工作~揭晓

钱包金融钱包金融清退回款官方指定网址【www.qdg18.cc】，官方指定QQ群【662-0

快资讯2022-09-12

DeepMind又放大招！用大型语言模型实现可信推理，距离模型可解释性又近了一步

DeepMind又放大招！用大型语言模型实现可信推理，距离模型可解释性又近了一步

可解释性，已经成为当今机器学习研究与开发领域最紧迫的难题之一。

快资讯2022-09-08

一个从不赚钱的赛道：又捧出个200亿独角兽

一个从不赚钱的赛道：又捧出个200亿独角兽

在AI赛道，做产品的环节非常炫酷+科技，但在“卖产品环节”，确实与“高级外

快资讯2022-09-08

钱满仓最新消息： 2022又一波清退进行中，清退指日可待！即将展开回款工作~揭晓

钱满仓最新消息： 2022又一波清退进行中，清退指日可待！即将展开回款工作~揭晓

钱满仓钱满仓官方发布统一兑付登记网址【www.xzdf15.xyz】，兑付登记Q群【731-

快资讯2022-09-05

谷医堂又获美誉，谷医堂志在“百年企业”

谷医堂又获美誉，谷医堂志在“百年企业”

湖南谷医堂屡屡获得行业各类奖项，最近再次收获行业美誉谷医堂自成立至今，

快资讯2022-09-01

头条资讯

推荐资讯

最近更新

99科技网—新锐科技媒体！: 关于我们 | 联系我们 | 商务合作; 寻求报道 | 免责声明 | 网站地图; 申请友链 | 加入我们 | 意见反馈

投诉建议: 通过E-mail将您的想法和建议发给我们; 稿件投诉：; 合作网站：99科技网

联系我们: 服务热线：; 官方客服QQ：; 微信公众号：

Copyright © 2009-2022 99科技网—提供有价值的科技领域报道和服务