新闻 \| 2022年春夏季中国报纸十大流行语发布

新闻 | 2022年春夏季中国报纸十大流行语发布

2022-07-29 王梦焰

2022年7月29日,北京语言大学国家语言资源监测与研究平面媒体中心发布“2022年春夏季中国主流报纸流行语”。本次发布的流行语包括9个类目,分别为:综合类、国内时政类、国际时政类、经济类、科技类、文化教育体育类、社会生活类、民生专题和航天航空专题。

参赛邀请 \| CCL 2022 汉语学习者文本纠错评测期待您的参与!

参赛邀请 | CCL 2022 汉语学习者文本纠错评测期待您的参与!

2022-06-13 王莹莹  孔存良  王梦焰

我们依托第二十一届中国计算语言学大会(CCL 2022),组织汉语学习者文本纠错评测。本次评测既整合了已有的相关评测数据和任务,又有新开发的数据集,以设置多赛道、统一入口的方式开展比赛任务。同时,我们研制了各赛道具有可比性的评测指标,立足于构建汉语学习者文本纠错任务的基准评测框架。

新闻 \| 我组6位同学顺利通过硕士学位论文答辩

新闻 | 我组6位同学顺利通过硕士学位论文答辩

2022-06-05 王梦焰

2022年6月1日,我组6位同学(谢永慧、师佳璐、崔悦、方雪至、胡正升、高山)硕士学位论文答辩会在线上举行。答辩委员会成员包括宋继华、杨尔弘、赵小兵、刘鹏远、岳岩、黄伟、张梅山、刘正皓、杨天麟。经答辩委员会评议,一致认为以上6位同学皆符合北京语言大学硕士研究生培养要求,同意通过本次硕士学位论文答辩。

新闻 \| CCL 2022 中文语法纠错评测

新闻 | CCL 2022 中文语法纠错评测

2022-05-13 王莹莹  王梦焰

中文语法纠错任务(Chinese Grammatical Error Correction,CGEC)旨在自动检测并修改中文文本中的标点、拼写、语法、语义等错误,从而获得符合原意的正确句子。近年来,中文语法纠错任务越来越受到关注,也出现了一些有潜在商业价值的应用。我们依托第二十一届中国计算语言学大会(CCL 2022),组织中文语法纠错评测。本次评测既整合了已有的相关评测数据和任务,又有新开发的数据集,以设置多赛道、统一入口的方式开展比赛任务,同时,我们研制了各赛道具有可比性的评测指标,立足于构建中文语法纠错任务的基准评测框架。

新闻 \| 智能辅助汉语学习研究进展

新闻 | 智能辅助汉语学习研究进展

2022-04-25

2022年4月24日,语言资源高精尖创新中心 “汉语作为第二语言学习者的智能辅助写作研究”( TYZ19005 )项目以公开报告的方式举行了线上进展交流会,会上项目组成员杨尔弘教授介绍了项目组开展的工作。与会人员围绕语言数据资源的建设质量、词语简单释义自动生成的方法等问题进行了充分的讨论。

新闻 \| 我组论文被国际语言资源与评测大会 LREC 2022 录用

新闻 | 我组论文被国际语言资源与评测大会 LREC 2022 录用

2022-04-06 崔悦 王梦焰

2022年4月5日,我组与德国图宾根大学陈小彬老师合作的论文被International Conference on Language Resources and Evaluation-2022 (LREC-2022)会议录用。LREC是语言资源和语言技术评估领域的重要会议,旨在提供最先进的观点,探索新的研发方向和新兴趋势,交流语言资源及其应用、评估方法和工具等。会议将于2022年6月20-25日在法国马赛召开。

新闻 \| 我组论文被计算语言学顶会 ACL 2022 主会录用

新闻 | 我组论文被计算语言学顶会 ACL 2022 主会录用

2022-02-25 孔存良 王梦焰

2月24日,计算语言学领域的国际顶级会议ACL 2022论文接收结果公布,我组有1篇论文被主会录用。国际计算语言学年会(Annual Meeting of the Association for Computational Linguistics,简称ACL)在世界范围内每年召开一次,今年是第60届会议,将于5月22-27日在爱尔兰都柏林召开。

新闻 \| 我组在 SemEval 2022 释义建模任务上斩获佳绩

新闻 | 我组在 SemEval 2022 释义建模任务上斩获佳绩

2022-02-22

近日,第十六届国际语义评测比赛(International Workshop on Semantic Evaluation, SemEval 2022)落下了帷幕。由北京语言大学信科院杨天麟老师、杨尔弘老师和北京交通大学计算机与信息技术学院黄雅平老师带领的参赛队伍(团队名:BLCU-ICALL,团队成员:孔存良、王誉杰、崇瑞宁、张恒源)在Task1:CODWOE - Comparing Dictionaries and Word Embeddings(比较词典与词向量),释义建模子任务上斩获佳绩。在比赛设置的五种语言(EN, ES, FR, IT, RU)中,分别取得了第一(IT),第二(ES,RU)和第三(EN,FR)的名次。

发布 \| 2021年科技焦点名词

发布 | 2021年科技焦点名词

2022-01-22 朱君辉 王梦焰

语言是社会的产物,凝聚了时代的缩影。2021年,是科技工作者们步履不停的一年,他们在追寻科学真理的道路上百折不挠,不断刷新着人类所能达到的新高度,科技界乘着时代的东风再次启航。基于国家语言资源监测语料库筛选出的2021年18个中国科技焦点名词,将这些奋斗的成果一一记录下来。

新闻 \| 汉语学习者文本多维标注数据集 YACLC 1.0 在智源指数平台发布

新闻 | 汉语学习者文本多维标注数据集 YACLC 1.0 在智源指数平台发布

2021-12-30 王莹莹 孔存良 谢晨晖 王梦焰

我组杨尔弘教授于2021年12月30日出席北京智源人工智能研究院自然语言处理前沿技术开放日活动,并汇报了汉语学习者文本多维标注数据集建设的最新成果。智能辅助语言学习是跨自然语言理解与生成两个方面的研究任务,对学习者产生的文本进行错误识别、并修改成为符合母语习惯的语句,需要知识指导。