成果 | 多语言开放式问答数据集OMGEval发布

成果 多语言开放式问答数据集OMGEval发布

2023-12-7

近一年,大模型发展迅速,带动了⼀系列通用人工智能技术的迅速发展,对大模型性能的评测随之涌现。从评测能力上来看,由于目前的评测数据集主要是利用人类试题及其标准答案进行评测,这种评价方式更偏向对推理能力的评估,存在评估结果和模型真实能力有⼀定偏差。他们在自动化评测流程中都只包含有标准答案的问题,无法全面衡量生成式大模型的综合能力。构建一个多语言的开放式问答数据集用以全面评测大模型的综合能力是有必要的。我们将从中文入手,逐渐迁移至其他语言。

汉语盘点:2023年度中国媒体十大流行语发布

汉语盘点:2023年度中国媒体十大流行语发布

2023-12-6

作为年度“汉语盘点”活动重要组成部分,“2023年度中国媒体十大流行语”于2023年12月6日由国家语言资源监测与研究中心发布。本次发布的十大流行语为:中华民族现代文明、高质量共建“一带一路”、全球文明倡议、数字中国、杭州亚运会、核污染水、巴以冲突、大语言模型、神舟十七号(神十七)、村超。

新闻 \| 我组论文获得CCL 2023最佳英文论文奖

新闻 | 我组论文获得CCL 2023最佳英文论文奖

2023-08-07

2023年8月3-5日,第二十二届中国计算语言学大会(CCL 2023)在哈尔滨市成功举行。在本次会议上我组博士聂锦燃报告了论文《Lexical Complexity Controlled Sentence Generation for Language Learning》,硕士朱君辉对论文《人工智能生成语言与人类语言对比研究 ——以ChatGPT为例》做了海报展示。

CCL 2023 \| 用于语言学习的词汇难度可控句子生成

CCL 2023 | 用于语言学习的词汇难度可控句子生成

2023-07-21

CCL是中国中文信息学会(CIPS)的重要会议,是中国最大的自然语言处理学者和专家的社区。我组论文《Lexical Complexity Controlled Sentence Generation for Language Learning》被大会录用并将于会议上做口头报告,作者为聂锦燃、杨麟儿、陈云、孔存良、朱君辉、杨尔弘。

新闻 \| 《智能辅助汉语写作研究》项目成果介绍

新闻 | 《智能辅助汉语写作研究》项目成果介绍

2023-07-19

《智能辅助汉语写作研究》(TYZ19005)项目由语言资源高精尖创新中心特聘研究员、北京语言大学信息科学学院杨天麟副教授主持开展。项目于2019年12月立项,2023年7月开展结项工作。智能辅助语言学习是当前人工智能研究领域重要的研究内容,随着大语言模型技术的发展,智能辅助语言学习的技术更迭速度也越来越快,不少研究已经融入实际的应用系统中。

新闻 \| 我组三位硕士生参加 AIS 2023 会议并作报告

新闻 | 我组三位硕士生参加 AIS 2023 会议并作报告

2023-06-30

近日,由中国中文信息学会青年工作委员会主办、MLNLP和智源社区支持、国防科技大学和中南大学联合承办的ACL-IJCAI-SIGIR顶级会议论文报告会(AIS 2023)在湖南长沙举办。ACL、IJCAI和SIGIR是自然语言处理、人工智能和信息检索领域的顶级国际学术会议。AIS顶级会议论文报告会是由中国中文信息学会青年工作委员会主办的系列学术活动,自2017年起已连续成功举办六届,累计吸引了数千人参会。

新闻 \| 我组论文被CCL 2023录用

新闻 | 我组论文被CCL 2023录用

2023-06-13

第二十二届中国计算语言学大会(The 22nd China National Conference on Computational Linguistics, CCL 2023) 将于2023年8月3-5日在黑龙江省哈尔滨市举行。会议主办单位为中国中文信息学会。CCL是中国中文信息学会(CIPS)的重要会议,是中国最大的自然语言处理学者和专家的社区。我组论文《人工智能生成语言与人类语言对比研究 ——以ChatGPT为例》被大会录用,作者为朱君辉、王梦焰、杨尔弘、聂锦燃、王誉杰、岳岩、杨麟儿。以下是论文相关介绍。