文本可读性

总体介绍

文本可读性自动分析即给定一篇文本,通过对其复杂度进行分析,给出该文本的可读性等级。本组工作包括二语作文文本水平定级与二语教材文本难度定级两个方面。文本复杂度与正确性、流利度是衡量语言水平的重要指标,常被用在二语习得领域的各项研究中。而在这三者之中,文本复杂度无疑是众多研究者关注和争论的焦点。

我们将现有研究成果集成到一个在线演示系统“中文CTAP:汉语文本复杂度分析平台”中,欢迎大家尝试使用!

中文CTAP系统:https://ctap.litmind.ink/

指导老师

  • 杨尔弘, 北京语言大学教授
  • 杨天麟, 北京语言大学副教授
  • 陈小彬, 德国图宾根大学教授

开发团队

  • 朱君辉, 北京语言大学信息科学学院硕士生
  • 刘鑫, 北京语言大学信息科学学院硕士生
  • 王誉杰, 北京交通大学计算机与信息技术学院硕士生
  • 崔悦, 北京语言大学信息科学学院硕士生(已毕业)
  • 方雪至, 北京语言大学信息科学学院硕士生(已毕业)
  • 陆天荧, 北京语言大学信息科学学院硕士生(已毕业)

相关论文

  • 朱君辉, 刘鑫, 杨麟儿, 师佳璐, 杨尔弘.2022. 文心语料库检索平台的研制. 第十二届全国语言文字应用学术研讨会 [paper] [demo]
  • 朱君辉, 刘鑫, 杨麟儿, 王鸿滨, 杨尔弘.2022. 汉语语法点特征及其在二语文本难度自动分级研究中的应用.语言文字应用, 2022, (3): 87-99 [paper]
  • Yue Cui, Junhui Zhu, Liner Yang, Xuezhi Fang, Xiaobin Chen, Yujie Wang, Erhong Yang. CTAP for Chinese: A linguistic Complexity Feature Automatic Calculation Platform.The 12th Language Resources and Evaluation Conference (LREC 2022)[paper] [code] [toolkit]