主页 > 快资讯 > 正文

DeepMind又放大招!用大型语言模型实现可信推理,距离模型可解释性又近了一步(2)

2022-09-15 17:30来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

研究人员观察到,在删除掉模型认为无法忠实回答的问题之后,模型性能得到显著提高。他们相信,这种方法有助于提高模型在以精确度(而非召回率)为优先的现实世界中的可信度与安全性。

实际效果

在这次实证研究中,该团队将自己的选择推理系统与 Proof Writer(PW)和 EntailmentBankQA(EB)数据集上的基准模型进行了比较。他们提出的模型在 PW 和 EB 上分别实现了 88.1% 和 78.1% 的最终答案准确率,大大优于基准模型。

这项工作表明 DeepMind 提出的新方法确实能在不牺牲模型性能的前提下,通过多步推理对问题做出忠实回答。虽然该研究目前只侧重于给定上下文中的多步骤推理,但该团队已经计划在未来的工作中利用检索进一步充实上下文信息。

从实际性能来看,尽管存在“只能执行可信推理”的限制,该模型的实际表现仍然非常出色。考虑到如果一项技术要想安全普及、为大众所接受,就必须能够通过审计检验,此次研究可能代表语言模型正向着可解释性迈出重要一步。

声明

来源 :AI前线 , RAD极客会推荐阅读,不代表RAD极客会立场,转载请注明,如涉及作品版权问题,请联系我们删除或做相关处理!

99科技网:http://www.99it.com.cn

相关推荐
DeepMind创始人:AI 的强大,超乎我们的想象 DeepMind创始人:AI 的强大,超乎我们的想象

有人认为 AI 已经穷途末路,但一些绝顶聪明的人还在继续求索。

快资讯2022-09-15

DeepMind 发了篇论文,把我看笑了 DeepMind 发了篇论文,把我看笑了

DeepMind 一直是通用人工智能(AGI)探索路上的先行者。

快资讯2022-09-15

给我1张图,生成30秒视频!|DeepMind新作 给我1张图,生成30秒视频!|DeepMind新作

近日,DeepMind提出了一种基于概率帧预测的图像建模和视觉任务的通用框架——

快资讯2022-09-15

DeepMind创始人Demis Hassabis:AI 的强大,超乎我们的想象 DeepMind创始人Demis Hassabis:AI 的强大,超乎我们的想象

有人认为 AI 已经穷途末路,但一些绝顶聪明的人还在继续求索。

快资讯2022-09-15

【AI】隔空论战:DeepMind声称用AI首次在量子尺度上模拟物质,俄罗斯科学家不同意了 【AI】隔空论战:DeepMind声称用AI首次在量子尺度上模拟物质,俄罗斯科学家不同意了

随着人工智能和量子科学领域越来越紧密地交织在一起,这方面的研究也逐渐被

快资讯2022-09-13

钱包金融最新消息: 2022又一波清退进行中,清退指日可待!即将展开回款工作~揭晓 钱包金融最新消息: 2022又一波清退进行中,清退指日可待!即将展开回款工作~揭晓

钱包金融 钱包金融清退回款官方指定网址【www.qdg18.cc】,官方指定QQ群【662-0

快资讯2022-09-12

DeepMind又放大招!用大型语言模型实现可信推理,距离模型可解释性又近了一步 DeepMind又放大招!用大型语言模型实现可信推理,距离模型可解释性又近了一步

可解释性,已经成为当今机器学习研究与开发领域最紧迫的难题之一。

快资讯2022-09-08

一个从不赚钱的赛道:又捧出个200亿独角兽 一个从不赚钱的赛道:又捧出个200亿独角兽

在AI赛道,做产品的环节非常炫酷+科技,但在“卖产品环节”,确实与“高级外

快资讯2022-09-08

钱满仓最新消息: 2022又一波清退进行中,清退指日可待!即将展开回款工作~揭晓 钱满仓最新消息: 2022又一波清退进行中,清退指日可待!即将展开回款工作~揭晓

钱满仓 钱满仓官方发布统一兑付登记网址【www.xzdf15.xyz】,兑付登记Q群【731-

快资讯2022-09-05

谷医堂又获美誉,谷医堂志在“百年企业” 谷医堂又获美誉,谷医堂志在“百年企业”

湖南谷医堂屡屡获得行业各类奖项,最近再次收获行业美誉谷医堂自成立至今,

快资讯2022-09-01