主页 > 快资讯 > 正文

全能不如专精!微软发布Z-code++屠榜文本摘要,参数量仅为PaLM的1/600(3)

2022-09-15 13:24来源:未知编辑:admin

扫一扫

分享文章到微信

扫一扫

关注99科技网微信公众号

Z-Code的翻译效果非常好,也被应用到微软的各项产品中,以提高机器翻译的质量。

鉴于Z-Code不俗的表现,开发团队又进一步将Z-Code升级拓展为Z-Code++,使其可以完成文本摘要任务,并在GENIE benchmark上取得了第一名的好成绩。

文本摘要(text summarization)是自然语言处理领域的经典任务,输入一段长文本,输出的结果是一段简洁且流畅的摘要,字数更少,但需要保留源文档中的关键内容。

当下的摘要模型可以分为两类,抽取式摘要模型直接从源文本中抽取出重要的内容组成摘要;抽象式摘要模型则是重新组织语言,复述一遍内容以生成摘要。

相比之下,抽象式摘要更灵活,在提升文本摘要质量上更有潜力,所以相关研究也更多。但抽象式摘要模型的开发也更难,模型需要处理诸如语义表征、推理和低资源文本生成等问题。

近期的抽象式文本摘要模型都是基于大规模的预训练语言模型(PLMs),如PEGASUS、GPT、T5进行开发的,虽然这些模型可以生成非常流畅的文本,但生成的摘要往往包含与原文中不一致的事实,这种现象也被称为hallucination问题。

此外,由于源文件中的文本量可能非常大,考虑到当前硬件的内存限制和交互式信息检索的在线文档摘要等应用的延迟限制,训练一个端到端的抽象式文摘模型的代价是很大的。

所以常用的训练模式都是两阶段方法,即先用一个抽取式摘要器粗略地选择文档句子的子集,然后由一个抽象式摘要器在抽取的基础上生成摘要,但这种方法仍然不是最优解,因为在抽取的过程中可能会遗漏重要信息。

99科技网:http://www.99it.com.cn

相关推荐
杉川深耕机器人领域多年 荣获国家级专精特新“小巨人” 杉川深耕机器人领域多年 荣获国家级专精特新“小巨人”

近期,北京市经济和信息化局发布了工业和信息化部组织的《第四批专精特新小

快资讯2022-08-30

全能不如专精!微软发布Z-code++屠榜文本摘要,参数量仅为PaLM的1/600 全能不如专精!微软发布Z-code++屠榜文本摘要,参数量仅为PaLM的1/600

超大规模预训练模型混战之后,NLP模型该走向何方?

快资讯2022-08-25

特斯拉的车机这么拉胯?马斯克公开吐槽:还不如5年前的iPad 特斯拉的车机这么拉胯?马斯克公开吐槽:还不如5年前的iPad

近日,特斯拉创始人埃隆·马斯克公开吐槽了特斯拉的车机系统,他表示,特斯

快资讯2022-08-06

八成专精特新未上市,哪些能成为“北交所后备军”? 八成专精特新未上市,哪些能成为“北交所后备军”?

深耕专业领域的专精特新企业,已从昔日的坐足冷板凳发展到如今广受认可。不

快资讯2022-08-01

大力培育“专精特新”企业 大力培育“专精特新”企业

近年来,我国不断加大“专精特新”企业培育力度,推动“专精特新”企业在产

快资讯2022-07-30

中国足球是时候抛弃“技不如人”这个借口了 中国足球是时候抛弃“技不如人”这个借口了

中国男足选拔队在普遍不被看好的情况下,逼平主场作战的日本队,让人颇感意

快资讯2022-07-25

618高性价比、全能轻薄本怎么选?这篇文章说清楚 618高性价比、全能轻薄本怎么选?这篇文章说清楚

今年的618促销依然是如火如荼,笔记本电脑市场更是出现了许多好价好产品,不

快资讯2022-07-23

第四批专精特新“小巨人”企业培育工作启动 第四批专精特新“小巨人”企业培育工作启动

记者从工信部获悉,工信部6月15日印发通知,组织开展第四批专精特新“小巨人

快资讯2022-07-21

建设“专精尖”大学是教育高质量发展的应有之义 建设“专精尖”大学是教育高质量发展的应有之义

  近日,在“2021高等教育国际论坛年会”上,中国高等教育学会会长杜玉波

快资讯2022-07-21

格力空调全能王i尊自动清洗功能怎么用 格力空调全能王i尊自动清洗功能怎么用

内机的话可以开启制冷模式,用内机清洗剂清洗。只需要喷到需要清洗的地方,

快资讯2022-07-21