新闻 | 我组论文被国际语言资源与评测大会 LREC 2022 录用

2022-04-06 崔悦 王梦焰


2022年4月5日,我组与德国图宾根大学陈小彬老师合作的论文被International Conference on Language Resources and Evaluation-2022 (LREC-2022)会议录用。LREC是语言资源和语言技术评估领域的重要会议,旨在提供最先进的观点,探索新的研发方向和新兴趋势,交流语言资源及其应用、评估方法和工具等。会议将于2022年6月20-25日在法国马赛召开。

会议网址: https://lrec2022.lrec-conf.org/

  • 论文题目:中文CTAP:一个语言复杂度特征自动计算平台 (CTAP for Chinese: A linguistic Complexity Feature Automatic Calculation Platform)

  • 作者:崔悦、朱君辉、杨麟儿、方雪至、陈小彬、王誉杰、杨尔弘

  • 论文摘要:语言复杂度已经在语言学习研究中得到了广泛的应用,现存的中文文本分析工具也涉及到了对语言复杂度的自动计算分析。但是,由于研究目的不同,这些工具所提供的复杂度特征是有限的。The Common Text Analysis Platform (CTAP)是一个开源的语言复杂度自动计算工具,不局限于任何研究。它最初是为英语文本的复杂度分析所开发,但其用到的非结构化信息管理框架允许加入其他语言。在本研究中,我们构建了包含汉字、词汇、句子和篇章四个层面共196个特征的汉语复杂度特征集,并将这些特征加入到CTAP中,实现汉语复杂度特征的自动计算。最后,我们将其与现存三种汉语文本分析工具进行比较。到目前为止,CTAP共实现了四种语言的复杂度特征自动计算,旨在为语言学家研究语言复杂度提供帮助。

  • CTAP网址: https://ctap.litmind.ink

  • CTAP介绍: 中文CTAP | 汉语文本复杂度分析平台