近日,华为云AI团队获得第9届国际自然语言处理与中文计算会议NLPCC 2020 轻量级预训练中文语言模型测评第一名。
NLPCC 由中国计算机学会主办,是自然语言处理(NLP)和中文计算(CC)领域的顶级国际前沿会议,每年会议都秉承国际化和一流化的严格标准来进行自然语言处理任务的开放评测,推动相关任务的研究和发展。NLPCC 2020吸引了康奈尔大学、伦敦大学、普林斯顿大学等海内外近600位自然语言处理领域的专家及学者参加大会,其中400余位专家学者在现场共同见证开放评测任务第一名的诞生。
当下,预训练语言模型已经成为NLP的主流方法,在多项NLP任务上都取得了明显的效果提升。但是预训练语言模型往往比较大,限制了预训练语言模型的应用场景。因此,如何构建轻量级的预训练语言模型就成了一个关键问题。
预训练语言模型出现以来发展得非常迅速,目前已经演化形成了一个家族
中文轻量级预训练语言模型能力评测任务的目的在于让参赛团队减少语言模型大小的同时尽可能保证模型效果。本次比赛包含四个任务,分别是指代消解,关键词识别两个句子级别分类任务,实体识别序列标注任务,MRC阅读理解任务,从不同角度评测模型的语义表达能力。同时,比赛要求模型的参数量低于bert-base模型的1/9,模型推理速度达到bert-base模型的8倍,这就要求模型运行快,体积小,效果好。
一般来说,可以通过量化、剪枝、蒸馏等方法来压缩大预训练语言模型来获得轻量级模型。华为云与诺亚方舟实验室联合团队基于自研的NEZHA中文预训练模型通过知识蒸馏得到tiny-NEZHA轻量级模型摘得桂冠。
相比其他模型,华为的模型在结构上找到了一个较好的平衡点,采用TinyBERT两步蒸馏的方式让模型更好地学到任务相关的知识,蒸馏过程中用语言模型预测并替换部分token的方式进行数据增强可以使小模型拥有更强泛化性。
Tinybert知识蒸馏的损失函数中一个重要环节是让中间层去学习隐藏状态和attention向量
同时,华为自研的NEZHA预训练语言模型采用相对位置编码替换BERT的参数化绝对位置编码,能更直接地建模token间的相对位置关系,从而提升语言模型的表达能力。
在即将过去的2020年里,华为云AI在人工智能领域的研发成绩斐然,斩获十二项包含WSDM、WebVision、CCKS篇章级事件抽取技术评测冠军、人工智能金炼奖、德国红点在内的国际国内榜单冠军和奖项。华为云AI将继续夯实技术优势,做智能世界的“黑土地”,持续践行普惠AI,将AI服务触及每一位开发者、每一个企业,助力各行各业进入人工智能新时代。
免责声明:本网站所提供的信息仅供参考之用,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
12月30日24时,潍坊火车站南站房正式启用。启用之后,市民将获得更舒适、更便捷的出行体验,同时潍坊火车站最高容纳乘客将从3500人提升至8000人,为旅客提供更加“安全、舒适、快捷、有序”的乘降转条件。[详细]
12月30日,记者从潍坊公交集团获悉,自2021年1月1日起,山东省及省外来鲁的60周岁(含60周岁)以上老年人,不分国籍、不分地域,一律享受免费乘坐潍坊公交集团所属公交线路的优惠政策。[详细]
此次通过对外启用验收的4个泊位均为5万吨级,位于潍坊港中港区,长度1020米,配套陆域面积80.2公顷。新建泊位的顺利启用,是山东港口一体化改革发展的最新成果,对于提高我市对外开放水平、打造开放型沿海城市、现代化国际城市具有重要意义。[详细]
一场大雪如期而至,雪落无声,让城市披上银装。风动寒重,一场大雪带来了无尽美景,却也给广大市民的正常生活带来了极大不便。自12月28日晚开始,我市城管、环卫、交警、应急管理等部门就行动起来,全力应对寒潮雨雪天气,保障市民出行安全。供热部门也紧急行动起来,[详细]
受强冷空气影响,28日夜间至29日早上,潍坊市区出现明显雨雪天气。一夜之间,整个城市银装素裹。[详细]
2020年11月21日,刘一宁去往河南新乡市学习声乐,为了便于跟老师学习,在新乡的一家酒店办理了入住。11月22日上午,刘一宁准备出门时,遇到两个因家庭纠纷发生肢体冲突的路人,且冲突较为严重,其中一人已被刀具划伤,大喊救命,在这危急时刻,刘一宁立马上前劝阻,在[详细]