主页 > 快资讯 > 正文

全能不如专精！微软发布Z-code++屠榜文本摘要，参数量仅为PaLM的1/600(2)

2022-09-15 13:24来源：未知编辑：admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

复制网址

Z-Code++采用两阶段预训练提升模型在低资源摘要任务上的性能：首先使用大规模文本语料库进行预训练，提升模型的语言理解能力；然后再摘要语料库上针对文本生成任务继续预训练。

在模型设计上，Z-code++将编码器中的自注意力层换成了 disentangled注意力层，每个词的表征包含两个向量用来编码内容和位置。模型还使用fusion-in-encoder方法以层次化的方式提升处理长序列的效率。

文章的第一作者贺鹏程在微软认知服务团队中进行自然语言处理研发工作，专注于顶级深度学习算法和系统的研究，包括大规模训练的语言模型、对抗性训练，问答和其他相关的NLP问题。

黄学东博士是IEEE/ACM Fellow，微软首位华人「全球技术院士」、微软云计算人工智能首席技术官。他先后获得湖南大学学士学位，清华大学硕士学位和英国爱丁堡大学博士学位。

从通用回归专用

今年初，微软开发了一类全新的AI模型Z-Code，通过迁移学习利用跨多种语言的共享语言元素，将知识从一项任务应用到另一项相关任务，旨在提高机器翻译和其他语言理解任务的质量，并将这些功能扩展到其他小众的语言上。

Z-Code的基本思想很直观：与传统的神经机器翻译方法不同，Z-Code不仅使用多语言的数据在机器翻译任务上进行训练，同时使用单语言数据作为补充，在掩码语言模型（MLM）任务上训练。使用多任务学习，同时优化多个目标函数。模型结构使用标准Transformer的编码器和解码器。

99科技网：http://www.99it.com.cn

共6页:
上一页
1
2
3
4
5
6
下一页

相关推荐

杉川深耕机器人领域多年荣获国家级专精特新“小巨人”
近期，北京市经济和信息化局发布了工业和信息化部组织的《第四批专精特新小

快资讯2022-08-30

全能不如专精！微软发布Z-code++屠榜文本摘要，参数量仅为PaLM的1/600
超大规模预训练模型混战之后，NLP模型该走向何方？

快资讯2022-08-25

特斯拉的车机这么拉胯？马斯克公开吐槽：还不如5年前的iPad
近日，特斯拉创始人埃隆·马斯克公开吐槽了特斯拉的车机系统，他表示，特斯

快资讯2022-08-06

八成专精特新未上市，哪些能成为“北交所后备军”？
深耕专业领域的专精特新企业，已从昔日的坐足冷板凳发展到如今广受认可。不

快资讯2022-08-01

大力培育“专精特新”企业
近年来，我国不断加大“专精特新”企业培育力度，推动“专精特新”企业在产

快资讯2022-07-30

中国足球是时候抛弃“技不如人”这个借口了
中国男足选拔队在普遍不被看好的情况下，逼平主场作战的日本队，让人颇感意

快资讯2022-07-25

618高性价比、全能轻薄本怎么选？这篇文章说清楚
今年的618促销依然是如火如荼，笔记本电脑市场更是出现了许多好价好产品，不

快资讯2022-07-23

第四批专精特新“小巨人”企业培育工作启动
记者从工信部获悉，工信部6月15日印发通知，组织开展第四批专精特新“小巨人

快资讯2022-07-21

建设“专精尖”大学是教育高质量发展的应有之义
近日，在“2021高等教育国际论坛年会”上，中国高等教育学会会长杜玉波

快资讯2022-07-21

格力空调全能王i尊自动清洗功能怎么用
内机的话可以开启制冷模式，用内机清洗剂清洗。只需要喷到需要清洗的地方，

快资讯2022-07-21

头条资讯

元宇宙概念为何爆发，互联网技术枯竭

音乐对顾客心理的影响

县级加盟什么店挣钱？

加盟雪丰建材需要什么条件？

未来经济发展的趋势？

推荐资讯

win7系统应用程序提示0x00000010错误怎么解决方法

OPPO,Vivo,华为，小米，哪个手机和智能手表更胜一筹？

在小县城开一家什么店比较赚钱?

在县城，做什么项目能挣大钱？

未来价值投资在哪里，未来经济世界又有着怎样的联系？

最近更新

买「数字藏品」的年轻人：有人赚10万，有人被套牢

别骗人了由nft推动的游戏哪里来的互操作性?

大厂排兵布阵NFT详情

阿波罗最新兑付消息：2022回款打算敲定，全额清退不是问题（兑付慎重受骗）

长投学堂最新兑付消息：2022年平台曝光兑付细节,让你全程无忧（协会动态）