新闻 | 我组成员参加CCL 2025
2025年8月11日-14日,由中国中文信息学会计算语言学专业委员会主办,齐鲁工业大学(山东省科学院)承办的第二十四届中国计算语言学大会(CCL 2025)在济南市成功召开。会议聚焦计算语言学前沿技术与发展趋势,为700余位与会学者搭建了高水平的学术交流平台,获得与会专家学者的高度认可。
本次会议上我组博士生王梦焰对论文《跨语言方位词对“左-右”的语义衍化与语义关联模式探究》进行海报展示,硕士生鲁鹿鸣对论文《例句质量评估体系构建及大语言模型例句生成能力评估》进行海报展示,硕士生宗绪泉就我组参加CCL2025评测任务六的情况进行报告。
论文一:跨语言方位词对“左-右”的语义衍化与语义关联模式探究
摘要:
“左-右”作为普遍空间概念,其语义不断向政治、文化等领域衍化,但对其系统性的跨语言比较仍付阙如。本研究依托词汇类型学框架,选取汉语、英语、挪威语等十种语言,对“左-右”方位词的语义衍化路径与对应关联进行量化分析。在梳理权威词典义项的基础上,利用大语言模型(LLM)生成补充语料,并经母语者审核校对,最终构建跨语言方位词对“左-右”的语义网络。结果表明,“左-右”普遍沿“空间→政治→文化”三阶衍化,对应性语义衍化呈现高度跨语言一致性。该发现为二元对立概念的跨语言普适性提供了新的实证支持,亦丰富了方位词语义演变的类型学证据。本文提出的“智能体设计+上下文学习+多语对齐控制+母语者验证”混合模式为低资源语言语料扩展与语义研究提供了可复制方案。

海报展示现场合影
论文二:例句质量评估体系构建及大语言模型例句生成能力评估
摘要:
本研究针对大语言模型(LLMs)生成例句的教学适用性问题,基于二语习得认知理论构建了多维例句质量评估体系,涵盖规范性、语境独立性、典型度、词汇适切性及句法复杂度五大核心维度。通过采集汉语词典与教材的优质例句作为基准语料,结合特征工程构建了机器学习模型(准确率为98%),验证了评估框架的有效性。在此基础上,本研究利用该评估框架对LLMs生成例句与传统人工编纂词典中的例句进行了系统对比分析。研究结果表明:LLMs在语法典型度、词汇难度、汉字笔画数方面展现出与传统词典例句相当的质量水平,而在语境独立性、语义典型度、词汇常用度方面仍存在一定不足。进一步研究发现,不同提示策略影响例句生成质量,其中融合语言特征约束型提示策略优化效果最佳。本研究首次实现LLMs生成例句教育适应性的量化评估,为智能语言教辅系统开发提供了兼具理论指导意义与实践应用价值的评估范式。


海报展示现场合影
评测任务:任务6系统报告:**基于数据增强及大小模型协同的中小学作文修辞识别
摘要:
CCL25-Eval任务6提出了一个段落级、多层次,细粒度中小学修辞识别与理解任务。针对修辞分类任务的特点,本文构建了一种以数据增强为核心、结合高效监督微调的多策略融合框架,并融合语句层面修辞识别与段落句间关系建模及识别,以全面提升模型的修辞理解能力。针对修辞成分抽取任务的特点,本文采用先进行修辞类别判定,后在该基础上进行修辞相关实体识别的两阶段处理策略,有效提升了整体识别精度。结果表明,本文所提出的方法能够有效对修辞进行识别和抽取,三个赛道上的分数分别达到了43.47、51.71、38.27,总成绩位列第二。

硕士生宗绪泉作评测报告

专题论坛参与人员合影

语言监测与智能学习研究组参会成员合影
中国计算语言学大会创办于1991年,是中国中文信息学会(CIPS)的旗舰会议。经过三十多年的发展,CCL已经成为国内自然语言处理研究领域最具影响力的学术交流平台。