面向藏语文本标题生成任务
https://mp.weixin.qq.com/s/9bPZ4ucQKlyyz-VHqY7LqA
自然语言生成与智能写作 2023-05-12 23:02 Posted on 北京
- 任务背景
文本标题生成是自然语言生成研究的一个重要方向,近年来受到学术界和工业界的广泛关注。文本标题生成旨在生成能够概括或评价文本主要内容的简短、连贯且信息丰富的标题。针对标题生成的研究有助于阅读者快速获取文本主要内容和主旨,也可以避免标题缺失或者题不对文对读者的误导。通过本共享任务,我们希望能够吸引更多研究者和开发者关注藏语文本生成研究。通过针对藏语文本标题生成研究,进一步推动藏语生成理论和实践问题的研究水平。
本任务得到中国中文信息学会自然语言生成专业委员会(筹)支持,将在第二届中国自然语言生成大会(NLGIW2023)召开研讨会,并在大会上对获奖团队颁奖。
- 任务介绍
本任务给定藏语文本作为模型输入,要求参与者设计实现藏语文本标题生成模型,使模型根据输入文本生成包含文本主要内容和主旨且自然流畅的藏语标题。
- 数据集简介
数据为csv格式,包括标题和文本两列,每一行对应一个样本。示例如下:
标题
文本
藏语
སློབ་འབྲིང་བོད་སྐད་ཡིག་སྦྱོང་བ་འི་སྤྲོ་བ་སྐྱེད་བསྲིང་བྱ་ཐབས་སྐོར་མདོ་ཙམ་གླེང་བ།
སློབ་ཁྲིད་ཡག་པོ་བྱས་ཏེ་ཤེས་ལྡན་མི་སྣ་གང་མང་ཞིག་གསོ་སྐྱོང་བྱ་རྒྱུ་ནི་དགེ་བ་འི་བཤེས་གཉེན་ཚོ་འི་འགན་འཁྲི་དོར་མེད་ཅིག་ཡིན་ལ་ལས་འགན་དེ་སྒྲུབ་པ་འི་བརྒྱུད་རིམ་ནང་སློབ་སྦྱོང་བྱེད་འདོད་ཀྱི་སྤྲོ་བ་སྐྱེད་བསྲིང་བྱེད་རྒྱུ་ནི་ལས་འགན་དེ་ལེགས་འགྲུབ་ཡོང་བ་འི་སྔོན་འགྲོ་འི་ཆ་རྐྱེན་ཞིག་ཀྱང་རེད།གལ་སྲིད་རྦུང་བྱའི་ཡོན་ཏན་ལ་སྤྲོ་བ་སྐྱེད་གྱུར་ན་རིག་ཚན་གང་ཞིག་རྦུངས་ཀྱང་ཚེགས་མེད་དུ་ཤེས་ཐུབ་ཅིང་དེ་ཡང་རང་ཉིད་ཀྱི་ལོ་འགའི་སློབ་ཁྲིད་ཀྱི་ཉམས་མྱོང་བརྒྱུད་ཤེས
登录后可查看完整内容,参与讨论!
立即登录