中国计算语言学大会自然语言处理NLP前沿动态综述(CCL 2022)

http://cips-cl.org/static/CCL2022/index.html

目录

1. 林衍凯(预训练模型技术)
2. 桂韬(大模型提示学习)
3. 董力(多模态大模型)
4. 张家俊(机器翻译)
5. 张伟男(对话生成)
6. 何世柱(知识推理)
7. 魏忠钰(智能问答)
8. 赵鑫(个性推荐)
9. 谢晓晖(稠密检索)
10. 陈慧敏(AI伦理)
  1. 林衍凯(预训练模型技术)

讲者:林衍凯
题目:预训练模型技术:进展与挑战
摘要:018年以来,深度学习领域的研究进入了预训练大模型时代。从自然语言处理领域的BERT、GPT-3,图像领域的VIT、MAE到多模态的DALLE-2,超大规模预训练模型展示了其令人瞩目的小样本、推理等能力,为深度学习的研究提供了一种全新的范式,更为自然语言处理等应用场景开辟广泛的探索空间。本次报告将回顾预训练模型技术的起源与发展,并进一步讨论其未来面临的挑战。
简介:林衍凯,中国人民大学高瓴人工智能学院助理教授,毕业于清华大学计算机系自然语言处理与社会人文计算实验室。研究方向包括预训练模型、信息抽取、知识图谱等。目前已在人工智能、自然语言处理等领域的著名国际会议ACL、EMNLP、NAACL、IJCAI、AAAI等发表相关论文30余篇,Google Scholar统计引用数超过7000。曾获2020年教育部自然科学一等奖(第3完成人)、北京市优秀毕业生、清华大学学术新秀等。曾担任EMNLP、ACL ARR等会议领域主席。
2. 桂韬(大模型提示学习)

讲者:桂韬
题目:大模型提示学习进展综述
摘要:自2018年以来,预训练语言模型成为NLP领域一项非常重要的技术突破,在各种NLP任务上都取得了不错的性能表现。随着预训练模型的体量不断增大,比如从BERT-base 110M参数发展到GPT-3 1750亿参数、悟道2.0 1.75万亿参数等,大模型Fine-tune过程中所需的硬件和数据需求也在不断增长,丰富的下游任务也使得预训练和微调阶段的设计更为复杂。如何高效、低成本地利用大模型成为我们面临的新问题。在此背景下,Prompt Tuning逐渐成为大模型使用的新范式。本次报告将回顾提示学习的发展脉络,探讨当前提示学习新的应用场景,并展望未来发展存在的挑战。
简介:桂韬,复旦大学自然语言处理实验室副研究员、硕士生导师。研究领域为自然语言处理、信息抽取和鲁棒模型。兼任中国中文信息学会青年工作委员会委员、青源会青年科学家。在高水平国际学术期刊和会议上发表了30余篇论文,主持国家自然科学基金、CCF-犀牛鸟、华为、海康威视、悟道、微软等多个基金项目。担任 TPAMI、ACL、EMNLP、AAAI、IJCAI 等著名期刊/会议领域主席或审稿人。曾获中国中文信息学会优秀博士论文奖、COLING2018 领域主席推荐奖、NLPCC2019 亮点论文奖、复旦大学“学术之星”特等奖,入选第七届“中国科协青年人才托举工程”。
3. 董力(多模态大模型)

讲者:董力
题目:多模态大模型动态综述
摘要:多模态输入作为人类智能的感知基础,近年来受到了来自各个领域的关注,研究人员在如何进行多模态融合、对齐、互助等问题做了很多探索。得益于自监督预训练(如GPT, BEiT)和模型架构的进步,使大规模多模态基础模型的诞生成为了可能。一方面,预训练使得模型能够从大规模的文本、图像、音频等数据中进行学习,极大地减小了平行对齐数据的依赖,并使得我们能学习出更通用、泛化能力更好的世界知识。另一方面,基于Transformers的模型架构在各个领域都取得了很好的建模结果,这使通用的网络结构成为可能。在上面的基础之上,多模态学习呈现出明显的“大一统”趋势,使各个领域发生了融合,从而推动了通用人工智能的进步。
简介:董力,微软亚洲研究院自然语言处理组研究员,博士毕业于爱丁堡大学。现主要从事大规模预训练的相关研究工作。曾获得AAAI-2021 Best Paper Runner Up、2019 AAAI/ACM SIGAI Doctoral Dissertation Award Runner Up、ACL-2018 Best Paper Honourable Mention,并多次担任ACL、EMNLP、NAACL等会议领域主席。
4. 张家俊(机器翻译)

讲者:张家俊
题目:机器翻译前沿综述
摘要:机器翻译是自然语言处理领域的代表性任务。场景的多样性和任务的复杂性是机器翻译的典型特征。虽然基于Transformer的神经机器翻译研究范式五年来未曾有显著改进,但是机器翻译研究一直非常火热,新的应用场景、研究问题和研究思路不断涌现。本次报告将从不同角度探讨机器翻译最近的研究趋势和方法。
简介:张家俊,中国科学院自动化研究所研究员、博士生导师,主要研究方向为机器翻译和自然语言处理,获得国家优秀青年科学基金资助,入选中国科学院青年创新促进会优秀会员、中国科协首届青年人才托举工程和北京智源青年科学家。发表CCF-A/B类论文80余篇,出版学术专著2部、译著1部。获得中国中文信息学会钱伟长中文信息处理科学技术奖一等奖、青年创新奖一等奖和北京市科学技术奖一等奖等。担任中国中文信息学会青年工作委员会主任和机器翻译专委会副主任,多次担任自然语言处理国际顶级学术会议ACL/EMNLP/COLING的(资深)领域主席、担任《自动化学报》编委。
5. 张伟男(对话生成)

讲者:张伟男
题目:开放域对话生成前沿综述
摘要:开放域对话系统的回复构建分为检索式和生成式两种技术方案。随着大模型的不断发展,逐渐有两种技术方案融合的趋势,以提升开放域对话系统回复的多样性和连贯性,本次报告将就以上三类技术方案中的代表性前沿技术和面向的开放域对话具体任务进行综述和趋势分析。
简介:张伟男,副教授/博士生导师,哈尔滨工业大学计算机学院院长助理,黑龙江省中文信息处理重点实验室副主任。研究兴趣包括人机对话及自然语言处理。在ACL、AAAI、WWW、IJCAI、IEEE TKDE、ACM TOIS等CCF A类国际会议及国际顶级期刊发表论文多篇,多次担任ACL、EMNLP领域主席、AAAI高级程序委员会委员(S