新闻 \| 中文CTAP,汉语文本复杂度分析平台

新闻 | 中文CTAP,汉语文本复杂度分析平台

2020-12-31 崔悦 方雪至 朱君辉 谢晨晖

文本复杂度与正确性、流利度是衡量语言水平的重要指标,常被用在二语习得领域的各项研究中。文本复杂度无疑是二语习得领域众多研究者关注和争论的焦点,但由于缺乏可用的计算工具进行复杂度特征的自动分析,一定程度上影响了前人研究中一些结论的可靠性及分析的进一步深入。基于此,我组与图宾根大学陈小彬教授团队合作推出了中文CTAP—汉语文本复杂度分析平台。

新闻 \| 2020,无论是新词、流行语还是网络用语,都离不开这个字

新闻 | 2020,无论是新词、流行语还是网络用语,都离不开这个字

2020-12-23

12月21日,“汉语盘点2020”活动继陆续发布了2020年度十大网络用语、十大流行语、十大新词语之后,公布了2020年度国内、国际字词。“民”、“脱贫攻坚”、“疫”、“新冠疫情”分别当选年度国内字、国内词、国际字、国际词。回顾一年来的国内国际大事,这些字词当选,可谓名副其实。即将过去的2020,人类经历了百年来最严重的传染病大流行,在中国,我们党团结带领全国各族人民,进行了惊心动魄的抗疫大战,经受了艰苦卓绝的历史大考。细细品味,无论是新词、流行语还是网络用语,万变归一,离不开“民”。

新闻 \| 2020年度中国媒体十大流行语发布:新冠肺炎、民法典等入选

新闻 | 2020年度中国媒体十大流行语发布:新冠肺炎、民法典等入选

2020-12-16

作为年度“汉语盘点”活动重要组成部分,2020年12月11日,国家语言资源监测与研究中心发布“2020年度中国媒体十大流行语”。本次发布的十大流行语依次为:新冠肺炎、抗疫、复工复产、民法典、网课、双循环、人类卫生健康共同体、抗美援朝70周年、六稳六保、嫦娥五号。

新闻 \| 杨尔弘:基于语言数据的智能辅助学习初探

新闻 | 杨尔弘:基于语言数据的智能辅助学习初探

2020-12-14 田苗苗 孔存良 谢晨晖

2020年12月12日晚,北京语言大学杨尔弘教授于“全球中文教学线上交流平台(第十一场):基于语料库/数据库的国际中文教学与研究”研讨活动上做学术报告。报告题目为:基于语言数据的智能辅助学习初探。

新闻 \| GPU计算集群使用培训圆满结束

新闻 | GPU计算集群使用培训圆满结束

2020-11-23

2020年11月19日,我校知识工程实验中心GPU计算集群使用培训于主南304举行,本次培训由信息科学学院宣传与信息化委员会主办,由张忠伟老师主持,近30位师生参加了此会。

新闻 \| 我组三篇论文被 CCL 2020 录用

新闻 | 我组三篇论文被 CCL 2020 录用

2020-11-01 谢晨晖 谢永慧

第十九届中国计算语言学大会(CCL 2020)于2020年10月30日—11月1日线上召开。会议主办单位为中国中文信息学会,组织单位为清华大学,承办单位为海南大学。我组共3篇论文《基于BERT与柱搜索的中文释义生成》《面向汉语二语学习的个性化语法纠错》《汉语学习者依存句法树库构建》被大会录用,以下是论文相关介绍。

新闻 \| 国家语委科研中心“国家语言资源监测与研究平面媒体中心”顺利通过专家组实地考察

新闻 | 国家语委科研中心“国家语言资源监测与研究平面媒体中心”顺利通过专家组实地考察

2020-08-11

2020年8月6日教育部语信司委派的专家组对国家语委科研中心“国家语言资源监测与研究平面媒体中心”进行实地考察。国家语委原副主任傅永和担任组长,教育部语言文字应用研究所靳光瑾研究员、商务印书馆周洪波总编辑、清华大学人工智能研究院常务副院长孙茂松教授、北京大学计算语言学研究所所长王厚峰教授、首都师范大学中国语言产业研究院贺宏志院长、北京师范大学科研处周晓旭副处长为成员。北京语言大学副校长张旺喜,校长助理、人事处处长郁有学,信息科学学院院长荀恩东,科研处副处长王秋生,财务处副处长张婧,研究生院副院长李文成出席了考察会。平面媒体中心的全体教师现场参会,全体学生线上参会。

新闻 \| 北京语言大学程序设计与算法课程平台上线运行

新闻 | 北京语言大学程序设计与算法课程平台上线运行

2020-04-30 孔存良

如何提高编程能力?许多计算机相关专业的教师和同学都思考过这个问题。问题的答案是见仁见智的,但不可否认的一点是:提高编程能力离不开动手实践,需要一定程度的练习。为了解决教师和同学们的痛点需求,信息科学学院杨天麟老师和刘鹏远老师主持研制了程序设计与算法平台。平台提供了课程、题库、比赛等功能,集教学练为一体,可供教师进行班级管理、作业发放、成绩管理、事件通知等操作,也可供学生自主学习与训练。

发布 \| 汉语学习者语料库标注平台

发布 | 汉语学习者语料库标注平台

2020-04-10 王莹莹 陆晓蓉 崔悦

学习者语料库(Learner Corpus)是外语/第二语言学习者产生的真实文本的集合。它不仅可以用于第二语言习得研究,还可以识别特定学习者群体(例如中级学习者)在学习中的典型困难,从而为识别学习者语言中经常发生的错误提供帮助。汉语学习者语料库标注平台是由北京语言大学语言监测与智能学习研究组研发的,其目的是对汉语学习者语料进行偏误标注,建构语料库。汉语学习者语料库立足于智能计算机辅助语言学习,构建完成后,将在对外汉语教学研究、汉语学习者的语言能力研究、中介语系统研究、偏误分析等研究领域发挥作用。