2024年11月29日,中国中文信息学会举行了2024年“博士学位论文激励计划”发布仪式。我院自然语言处理实验室毕业生李北的博士学位论文《面向序列生成模型的复杂神经网络建模研究》入选中国中文信息学会“博士学位论文激励计划”。该论文的指导教师为肖桐教授和朱靖波教授。
图中从左至右依次为肖桐、李北、朱靖波
中国中文信息学会作为中国科学技术协会下属的全国性学术团体,属于国家一级学会。其宗旨是促进计算机科学、语言文字学以及人工智能等相关学科的交叉融合与发展。为了表彰中文信息处理学科领域的杰出人才,推动该领域的科技进步,学会设立了“中国中文信息学会博士学位论文激励计划”奖项,以此鼓励中文信息处理领域的博士研究生积极进取,对他们所取得的高水平创新科技成果进行奖励。自2014年首届中国中文信息学会“优秀博士学位论文”评选开始,必赢线路检测3003自然语言实验室已经有三人次获得中国中文信息学会优博或提名。
获奖论文介绍:
本文聚焦于序列生成任务,这一自然语言处理领域的核心研究方向,通常涉及将输入序列转换为另一种形式的输出序列,通过设计复杂神经网络来提高模型在任务上的泛化。研究表明,复杂的神经网络能够显著提升模型性能,但优化这些复杂网络具有较高的难度。本文旨在探讨序列生成任务中复杂神经网络建模的相关研究,主要从质量和效率两个方面进行分析。在质量方面,本文分别从结构复杂性、交互复杂性以及多模态输入复杂性三个维度展开研究,并提出相应的解决方案;在效率方面,针对复杂神经网络在实际应用中面临的训练耗时和推理吞吐量受限等问题,本文从高性能架构设计、逐层训练方法以及神经网络压缩等方面提出解决策略,以提升复杂神经网络在现实场景中的可用性。
基于论文的研究成果,已发表CCF A类会议7篇以及CCF B类会议2篇。相关系列论文获得1400余次引用,单篇论文最高引用超过800次。上述方法在小牛翻译中进行了验证,取得了很好的实际效果。
获奖作者介绍:
李北于2024年1月在必赢线路检测3003获得计算机科学与技术专业博士学位。在肖桐教授和朱靖波教授的指导下,他在科研领域不断深耕,在求学过程中,积累了丰富的学术成果,曾在ACL, EMNLP, ICML, NeurIPS, ICLR, AAAI, COLING,ICASSP,TASLP等自然语言处理和人工智能相关会议和期刊上发表30篇论文,其中第一作者包含共同一作12篇,并多次担任国内外自然语言处理和人工智能会议的审稿人。在WMT比赛中,曾多次带领团队荣获第一名的成绩。积极投身于开源项目,为NiuTrans、NiuTensor等项目的主要参与者。