主页 > 快资讯 > 正文

全能不如专精!微软发布Z-code++屠榜文本摘要,参数量仅为PaLM的1/600(2)

2022-08-25 17:38来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

Z-Code++采用 两阶段预训练 提升模型在低资源摘要任务上的性能:首先使用大规模文本语料库进行预训练,提升模型的语言理解能力;然后再摘要语料库上针对文本生成任务继续预训练。

在模型设计上,Z-code++将编码器中的自注意力层换成了 disentangled注意力层 ,每个词的表征包含 两个向量 用来编码内容和位置。模型还使用fusion-in-encoder方法以层次化的方式提升处理长序列的效率。

文章的第一作者 贺鹏程 在微软认知服务团队中进行自然语言处理研发工作,专注于顶级深度学习算法和系统的研究,包括大规模训练的语言模型、对抗性训练,问答和其他相关的NLP问题。

黄学东博士 是IEEE/ACM Fellow,微软首位华人「全球技术院士」、微软云计算人工智能首席技术官。他先后获得湖南大学学士学位,清华大学硕士学位和英国爱丁堡大学博士学位。

从通用回归专用

今年初,微软开发了一类全新的AI模型Z-Code,通过迁移学习利用跨多种语言的共享语言元素,将知识从一项任务应用到另一项相关任务,旨在提高机器翻译和其他语言理解任务的质量,并将这些功能扩展到其他小众的语言上。

Z-Code的基本思想很直观:与传统的神经机器翻译方法不同,Z-Code不仅使用多语言的数据在机器翻译任务上进行训练,同时使用单语言数据作为补充,在掩码语言模型(MLM)任务上训练。使用多任务学习,同时优化多个目标函数。模型结构使用标准Transformer的编码器和解码器。

99科技网:http://www.99it.com.cn

相关推荐
特斯拉的车机这么拉胯?马斯克公开吐槽:还不如5年前的iPad 特斯拉的车机这么拉胯?马斯克公开吐槽:还不如5年前的iPad

近日,特斯拉创始人埃隆·马斯克公开吐槽了特斯拉的车机系统,他表示,特斯

快资讯2022-08-06

八成专精特新未上市,哪些能成为“北交所后备军”? 八成专精特新未上市,哪些能成为“北交所后备军”?

深耕专业领域的专精特新企业,已从昔日的坐足冷板凳发展到如今广受认可。不

快资讯2022-08-01

大力培育“专精特新”企业 大力培育“专精特新”企业

近年来,我国不断加大“专精特新”企业培育力度,推动“专精特新”企业在产

快资讯2022-07-30

中国足球是时候抛弃“技不如人”这个借口了 中国足球是时候抛弃“技不如人”这个借口了

中国男足选拔队在普遍不被看好的情况下,逼平主场作战的日本队,让人颇感意

快资讯2022-07-25

618高性价比、全能轻薄本怎么选?这篇文章说清楚 618高性价比、全能轻薄本怎么选?这篇文章说清楚

今年的618促销依然是如火如荼,笔记本电脑市场更是出现了许多好价好产品,不

快资讯2022-07-23

第四批专精特新“小巨人”企业培育工作启动 第四批专精特新“小巨人”企业培育工作启动

记者从工信部获悉,工信部6月15日印发通知,组织开展第四批专精特新“小巨人

快资讯2022-07-21

建设“专精尖”大学是教育高质量发展的应有之义 建设“专精尖”大学是教育高质量发展的应有之义

  近日,在“2021高等教育国际论坛年会”上,中国高等教育学会会长杜玉波

快资讯2022-07-21

格力空调全能王i尊自动清洗功能怎么用 格力空调全能王i尊自动清洗功能怎么用

内机的话可以开启制冷模式,用内机清洗剂清洗。只需要喷到需要清洗的地方,

快资讯2022-07-21

25元出行券!上海消费券来了:不如深圳2000元礼包? 25元出行券!上海消费券来了:不如深圳2000元礼包?

6月13日,上海派发第二轮消费券,全市48家盒马鲜生会员店、17家盒马mini店,到

快资讯2022-07-21

中国研究团队发现能诱导出全能干细胞的药物组合 中国研究团队发现能诱导出全能干细胞的药物组合

新华社北京6月22日电(记者彭茜)从克隆技术到再生医学,如何找到除通过生殖

快资讯2022-07-19