新闻 | 我组三篇论文被 CCL 2020 录用
第十九届中国计算语言学大会(CCL 2020)于2020年10月30日—11月1日线上召开。会议主办单位为中国中文信息学会,组织单位为清华大学,承办单位为海南大学。我组共3篇论文《基于BERT与柱搜索的中文释义生成》《面向汉语二语学习的个性化语法纠错》《汉语学习者依存句法树库构建》被大会录用。
基于BERT与柱搜索的中文释义生成
作者:范齐楠,孔存良,杨麟儿,杨尔弘
摘要:释义生成任务是指为一个目标词生成相应的释义。前人研究中文释义生成任务时未考虑目标词的上下文,本文首次在中文释义生成任务中使用了目标词的上下文信息,并提出了一个基于BERT与柱搜索的释义生成模型。本文构建了包含上下文的CWN中文数据集用于开展实验,除了BERT指标之外,还使用语义相似度作为额外的自动评价指标,实验结果显示本文模型在中文CWN数据集和英文Oxford数据集上均有显著提升,人工评价结果也与自动评价结果一致。朂后,本文对生成实例进行了深入分析。
全文链接 : http://www.cips-cl.org/static/anthology/CCL-2020/CCL-20-032.pdf
视频链接 : https://hub.baai.ac.cn/view/3253
面向汉语二语学习的个性化语法纠错
作者:张生盛,庞桂娜,杨麟儿,王辰成,杜永萍,杨尔弘,黄雅平
摘要:语法纠错任务旨在通过自然语言处理技术自动检测并纠正文本中的语序、拼写等语法错误。当前许多针对汉语的语法纠错方法已取得较好的效果,但往往忽略了学习者的个性化特征,如二语等级、母语背景等。因此,本文面向汉语作为第二语言的学习者,提出个性化语法纠错,对不同特征的学习者所犯的错误分别进行纠正,并构建了不同领域汉语学习者的数据集进行实验。实验结果表明,将语法纠错模型适应到学习者的各个领域后,性能得到明显提升。
全文链接 : http://www.cips-cl.org/static/anthology/CCL-2020/CCL-20-010.pdf
视频链接 : https://hub.baai.ac.cn/view/3207
汉语学习者依存句法树库构建
作者:师佳璐,罗昕宇,杨麟儿,肖丹,胡正升,王一君,袁佳欣,余婧思,杨尔弘
摘要:汉语学习者依存句法树库为非母语者语料提供依存句法分析,可以支持第二语言教学与研究,也对面向第二语言的句法分析、语法改错等相关研究具有重要意义。然而,现有的汉语学习者依存句法树库数量较少,且在标注方面仍存在一些问题。为此,本文改进依存句法标注规范,搭建在线标注平台,并开展汉语学习者依存句法标注。本文重点介绍了数据选取、标注流程等问题,并对标注结果进行质量分析,探索二语偏 误对标注质量与句法分析的影响。
全文链接 : http://www.cips-cl.org/static/anthology/CCL-2020/CCL-20-054.pdf
视频链接 : https://hub.baai.ac.cn/view/3281
欢迎大家在CCL 2020官网张贴海报区留言,对我们的工作进行批评与指正。