主页 > 快资讯 > 正文

DeepMind又放大招!用大型语言模型实现可信推理,距离模型可解释性又近了一步(2)

2022-09-08 14:06来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

实际效果

在这次实证研究中,该团队将自己的选择推理系统与 Proof Writer(PW)和 EntailmentBankQA(EB)数据集上的基准模型进行了比较。他们提出的模型在 PW 和 EB 上分别实现了 88.1% 和 78.1% 的最终答案准确率,大大优于基准模型。 这项工作表明 DeepMind 提出的新方法确实能在不牺牲模型性能的前提下,通过多步推理对问题做出忠实回答。虽然该研究目前只侧重于给定上下文中的多步骤推理,但该团队已经计划在未来的工作中利用检索进一步充实上下文信息。 从实际性能来看,尽管存在“只能执行可信推理”的限制,该模型的实际表现仍然非常出色。考虑到如果一项技术要想安全普及、为大众所接受,就必须能够通过审计检验,此次研究可能代表语言模型正向着可解释性迈出重要一步。

99科技网:http://www.99it.com.cn

  • 共2页:
  • 上一页
  • 1
  • 2
  • 下一页
  • 相关推荐
    一个从不赚钱的赛道:又捧出个200亿独角兽 一个从不赚钱的赛道:又捧出个200亿独角兽

    在AI赛道,做产品的环节非常炫酷+科技,但在“卖产品环节”,确实与“高级外

    快资讯2022-09-08

    钱满仓最新消息: 2022又一波清退进行中,清退指日可待!即将展开回款工作~揭晓 钱满仓最新消息: 2022又一波清退进行中,清退指日可待!即将展开回款工作~揭晓

    钱满仓 钱满仓官方发布统一兑付登记网址【www.xzdf15.xyz】,兑付登记Q群【731-

    快资讯2022-09-05

    谷医堂又获美誉,谷医堂志在“百年企业” 谷医堂又获美誉,谷医堂志在“百年企业”

    湖南谷医堂屡屡获得行业各类奖项,最近再次收获行业美誉谷医堂自成立至今,

    快资讯2022-09-01

    大势!又一关乎中美竞争的关键行业,走到关键时刻了…… 大势!又一关乎中美竞争的关键行业,走到关键时刻了……

     挺过寒冬,迎来超车。

    快资讯2022-08-30

    Nature子刊 | 像婴儿一样学习,DeepMind新模型28小时学会物理世界规则 Nature子刊 | 像婴儿一样学习,DeepMind新模型28小时学会物理世界规则

    DeepMind 旨在建立一个能够直观学习物理学的模型。

    快资讯2022-08-30

    ICCV何恺明团队又一神作:Transformer仍有继续改善的空间 ICCV何恺明团队又一神作:Transformer仍有继续改善的空间

    一个简单、渐进、但必须知道的基线:用于 Vision Transformer 的自监督学习。

    快资讯2022-08-30

    非科班AI小哥火了:他没有ML学位,却拿到DeepMind的offer 非科班AI小哥火了:他没有ML学位,却拿到DeepMind的offer

    这两天,DeepMind研究工程师小哥Aleksa Gordić的个人经验贴在Twitter上火了一把。

    快资讯2022-08-30

    “未来5-10年,哪些工作被AI取代,我又该怎么办?” “未来5-10年,哪些工作被AI取代,我又该怎么办?”

    比尔盖茨说: “人们总是低估了未来长期的变化,而高估了眼前短期的改变。

    快资讯2022-08-30

    Gartner又画饼了 Gartner又画饼了

    又是一年技术炒作时。

    快资讯2022-08-28

    DeepMind 发了篇论文,把我看笑了 DeepMind 发了篇论文,把我看笑了

    DeepMind 一直是通用人工智能(AGI)探索路上的先行者。

    快资讯2022-08-25