主页 > 快资讯 > 正文

DeepMind又放大招！用大型语言模型实现可信推理，距离模型可解释性又近了一步(2)

2022-09-08 14:06来源：未知编辑：admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

实际效果

在这次实证研究中，该团队将自己的选择推理系统与 Proof Writer（PW）和 EntailmentBankQA（EB）数据集上的基准模型进行了比较。他们提出的模型在 PW 和 EB 上分别实现了 88.1% 和 78.1% 的最终答案准确率，大大优于基准模型。这项工作表明 DeepMind 提出的新方法确实能在不牺牲模型性能的前提下，通过多步推理对问题做出忠实回答。虽然该研究目前只侧重于给定上下文中的多步骤推理，但该团队已经计划在未来的工作中利用检索进一步充实上下文信息。从实际性能来看，尽管存在“只能执行可信推理”的限制，该模型的实际表现仍然非常出色。考虑到如果一项技术要想安全普及、为大众所接受，就必须能够通过审计检验，此次研究可能代表语言模型正向着可解释性迈出重要一步。

99科技网：http://www.99it.com.cn

共2页:

2

下一页

相关推荐

一个从不赚钱的赛道：又捧出个200亿独角兽

一个从不赚钱的赛道：又捧出个200亿独角兽

在AI赛道，做产品的环节非常炫酷+科技，但在“卖产品环节”，确实与“高级外

快资讯2022-09-08

钱满仓最新消息： 2022又一波清退进行中，清退指日可待！即将展开回款工作~揭晓

钱满仓最新消息： 2022又一波清退进行中，清退指日可待！即将展开回款工作~揭晓

钱满仓钱满仓官方发布统一兑付登记网址【www.xzdf15.xyz】，兑付登记Q群【731-

快资讯2022-09-05

谷医堂又获美誉，谷医堂志在“百年企业”

谷医堂又获美誉，谷医堂志在“百年企业”

湖南谷医堂屡屡获得行业各类奖项，最近再次收获行业美誉谷医堂自成立至今，

快资讯2022-09-01

大势！又一关乎中美竞争的关键行业，走到关键时刻了……

大势！又一关乎中美竞争的关键行业，走到关键时刻了……

　挺过寒冬，迎来超车。

快资讯2022-08-30

Nature子刊 | 像婴儿一样学习，DeepMind新模型28小时学会物理世界规则

Nature子刊 | 像婴儿一样学习，DeepMind新模型28小时学会物理世界规则

DeepMind 旨在建立一个能够直观学习物理学的模型。

快资讯2022-08-30

ICCV何恺明团队又一神作：Transformer仍有继续改善的空间

ICCV何恺明团队又一神作：Transformer仍有继续改善的空间

一个简单、渐进、但必须知道的基线：用于 Vision Transformer 的自监督学习。

快资讯2022-08-30

非科班AI小哥火了：他没有ML学位，却拿到DeepMind的offer

非科班AI小哥火了：他没有ML学位，却拿到DeepMind的offer

这两天，DeepMind研究工程师小哥Aleksa Gordić的个人经验贴在Twitter上火了一把。

快资讯2022-08-30

“未来5-10年，哪些工作被AI取代，我又该怎么办？”

“未来5-10年，哪些工作被AI取代，我又该怎么办？”

比尔盖茨说： “人们总是低估了未来长期的变化，而高估了眼前短期的改变。

快资讯2022-08-30

Gartner又画饼了

Gartner又画饼了

又是一年技术炒作时。

快资讯2022-08-28

DeepMind 发了篇论文，把我看笑了

DeepMind 发了篇论文，把我看笑了

DeepMind 一直是通用人工智能（AGI）探索路上的先行者。

快资讯2022-08-25

头条资讯

推荐资讯

最近更新

99科技网—新锐科技媒体！: 关于我们 | 联系我们 | 商务合作; 寻求报道 | 免责声明 | 网站地图; 申请友链 | 加入我们 | 意见反馈

投诉建议: 通过E-mail将您的想法和建议发给我们; 稿件投诉：; 合作网站：99科技网

联系我们: 服务热线：; 官方客服QQ：; 微信公众号：

Copyright © 2009-2022 99科技网—提供有价值的科技领域报道和服务