报告题目:面向信息抽取的序列到组块神经网络架构
主讲人:中科院软件所林鸿宇博士
时间:2020年12月6日(星期日)10:00-11:00
地点:海韵校区行政楼A306
摘要:
在信息抽取中,有许多任务可以归纳为序列到组块的抽取问题。传统的基于序列标注的方法在模型设计、有监督优化和弱监督学习等层面都面临着重大的挑战。本报告将介绍我们近年来在序列到组块信息抽取各个方向的研究进展。具体来说,在模型层面,基于自然语言的头词驱动结构的特性,本报告将介绍区块生成网络和锚点区域网络模型。在有监督优化层面,本报告将介绍动态权重缩放算法、代价敏感正则化方法以及基于差值学习的优化方法,使得模型在有监督优化的过程中更加贴近于任务的本质。最后,为了缓解模型对于完全标注数据的依赖,本报告首先探究了序列到组块信息抽取泛化的关键因素,并且基于上述研究成果提出了基于超几何概率模型的远监督降噪方法以及字典增强的注意力神经网络模型。
报告人简介:
林鸿宇,中国科学院软件研究所中文信息处理实验室博士后。2015年厦门大学软件学院工学学士,2020年中科院软件所工学博士。主要研究方向包括信息抽取、自然语言处理。近年来在自然语言处理顶级会议ACL及EMNLP发表论文10余篇,获得中国科学院院长奖特别奖、中国科学院大学优秀毕业生等荣誉。
邀请人:软件工程系苏劲松副教授