句法语义分析

总体介绍

句法语义自动分析旨在自动给出句子中文分词、词性标注、句法分析和语义分析等结果。本组工作包括依存句法分析、汉语词语结构分析、句本位句法分析与汉语增强依存句法自动转换等。

依存句法分析

依存句法分析通过词与词之间的依存关系体现句子的句法结构,可以服务于后续的信息提取、主题分析等应用。
我们改进依存句法标注规范,对含有偏误句(汉语学习者原始语料)和目标句(纠偏后的句子)的平行句对进行标注,初步构建了汉语学习者依存句法树库。
汉语学习者依存句法树库为汉语学习者文本提供依存句法分析,可以支持第二语言教学与研究,对面向学习者文本的句法分析、语法改错等相关研究具有重要意义。

句本位句法分析

句本位语法是黎锦熙先生创导的汉语语法理论,相比于短语结构语法、依存语法,句本位语法更适合于汉语教学,本质上是一种“教学语法”,并具有以下特点:

  • 凸显句子的主干成分,即句子的主语、谓语、宾语;
  • 注重对句式的分析,如兼语、连谓等。

我们通过规则的方法,将宾州中文树库自动转换为句式结构树库,以此构建了大规模的新闻领域句式结构树库,可以为汉语教学、语言学研究以及自动句法分析等研究提供基础资源。

在此基础上,我们构建了句本位自动分析器,可以自动分析句子的句本位句法结构。

句本位句法分析-教材
句本位句法分析-新闻

汉语词语结构标注

词法分析是自然语言处理中的基础任务,旨在通过计算机进行分词、词性标注以及分析词语结构。
我们制定汉语词语结构标注规范,以宾州中文树库的汉语词语为标注语料,试构建汉语词语结构标注树库,该资源可以服务于汉语词汇研究、汉语自动分词与词性标注、汉语词结构自动分析等相关研究。目前资源正在建设中。

增强依存句法自动转换

受限于依存句法中每个节点只能有一条入弧的规则,基础依存句法中许多实词之间的关系无法用依存弧和依存标签直接标明;同时,已有的依存句法体系中的依存关系还有进一步细化、提升的空间,以便从中提取连贯的语义关系。
我们在斯坦福基础依存句法规范的基础上研制了汉语增强依存句法规范,通过修改依存标签、添加依存弧或节点的方式,将依存句法树转换为可以表示更多信息的依存句法图,显性地展示实词之间的关系,更有利于自然语言处理下游任务的应用。

句本位句法分析-新闻


我们将现有所有成果集成到一个在线演示系统“文心·句法分析器”中,欢迎大家尝试使用!
文心·句法分析器:https://parser.litmind.ink

指导老师

  • 杨尔弘, 北京语言大学教授
  • 杨天麟, 北京语言大学副教授

研究团队

  • 谢晨晖,北京语言大学信息科学学院硕士生
  • 余婧思, 北京语言大学信息科学学院硕士生
  • 廖田昕,北京语言大学信息科学学院硕士生
  • 袁佳欣, 北京语言大学信息科学学院硕士生
  • 师佳璐, 北京语言大学信息科学学院硕士生(已毕业)
  • 胡正升, 北京语言大学信息科学学院硕士生(已毕业)
  • 罗昕宇, 北京语言大学信息科学学院硕士生(已毕业)
  • 陆天荧, 北京语言大学信息科学学院硕士生(已毕业)
  • 肖 丹, 北京语言大学信息科学学院硕士生(已毕业)

相关论文

  • 谢晨晖, 胡正升, 杨麟儿, 廖田昕, 杨尔弘. 2022. 句式结构树库的自动构建研究. 第二十一届中国计算语言学大会
  • 余婧思, 师佳璐, 杨麟儿, 肖丹, 杨尔弘. 2022. 汉语增强依存句法自动转换研究. 第二十一届中国计算语言学大会
  • 师佳璐, 罗昕宇, 杨麟儿, 肖丹, 胡正升, 王一君, 袁佳欣, 余婧思, 杨尔弘. 汉语学习者依存句法树库构建. 中文信息学报, 2022, 36(1): 39-46
  • 肖丹, 杨尔弘, 张明慧, 陆天荧, 杨麟儿. 汉语中介语的依存句法标注规范及标注实践. 中文信息学报, 2020, 34(11): 19-28