释义自动生成

总体介绍

词典是语言学习者重要的工具之一, 可以为阅读、写作及日常交流提供帮助。传统词典需要预先编制词语的释义、例句, 用户检索时按图索骥, 找到自己需要的释义。释义生成旨在利用计算机技术及深度学习算法, 自动为汉语词语生成适合学习者使用的释义。相比于传统词典, 释义自动生成具有以下优势:

(1) 直接生成词语在特定上下文中的释义, 不需要用户从多个义项中进行分辨;
(2) 可以对释义难度进行控制, 满足不同学习水平的汉语学习者;
(3) 可以对新词或旧词新义生成释义。

我们将现有研究成果集成到一个在线演示系统“文心·词典”中, 欢迎大家尝试使用!
文心·词典系统:https://dictionary.litmind.ink

文心词典

我们整理开源了词典释义生成论文列表:DG-Reading-List, 覆盖了释义生成任务相关的已发表论文、综述等, 欢迎使用。
论文列表地址:https://github.com/blcuicall/DG-Reading-List

指导老师

  • 杨尔弘, 北京语言大学教授
  • 杨天麟, 北京语言大学副教授
  • 陈云, 上海财经大学信息管理与工程学院副教授

开发团队

  • 孔存良, 北京语言大学信息科学学院博士生
  • 聂锦然, 北京语言大学信息科学学院博士生
  • 袁佳欣, 北京语言大学信息科学学院硕士生
  • 王誉杰, 北京交通大学计算机与信息技术学院硕士生
  • 范齐楠, 北京语言大学信息科学学院硕士生(已毕业)
  • 方雪至, 北京语言大学信息科学学院硕士生(已毕业)
  • 张恒源, 北京语言大学信息科学学院本科生(已毕业)
  • 张海同, 北京工业大学信息学部硕士生(已毕业)

相关论文

  • Jiaxin Yuan, Cunliang Kong, Chenhui Xie, Liner Yang, Erhong Yang. 2022. COMPILING: A Benchmark Dataset for Chinese Complexity Controllable Definition Generation. In Proceedings of CCL 2022. [paper] [arXiv]
  • Cunliang Kong, Yun Chen, Hengyuan Zhang, Liner Yang, and Erhong Yang. 2022. Multitasking Framework for Unsupervised Simple Definition Generation. In Proceedings of ACL 2022. [paper] [arXiv] [code]
  • Cunliang Kong, Yujie Wang, Ruining Chong, Liner Yang, Hengyuan Zhang, and Erhong Yang, and Yaping Huang. 2022. BLCU-ICALL at SemEval-2022 Task 1: Cross-Attention Multitasking Framework for Definition Modeling. In Proceedings NAACL-HLT 2022. [paper] [arXiv] [code]
  • Cunliang Kong, Xuezhi Fang, Liner Yang, Yun Chen, and Erhong Yang. 2022. LitMind Dictionary: An Open-Source Online Dictionary. arXiv:2204.11087. [blog] [arXiv] [code]
  • Qinan Fan, Cunliang Kong, Liner Yang, and Erhong Yang. 2021. Chinese Definition Modeling Based on BERT and Beam Search. Journal of Chinese Information Processing. [paper] (in Chinese)
  • Liner Yang, Cunliang Kong, Yun Chen, Yang Liu, Qinan Fan, and Erhong Yang. 2020. Incorporating Sememes into Chinese Definition Modeling. IEEE/ACM Transactions on Audio, Speech and Language Processing. [link] [arXiv] [code]
  • Haitong Zhang, Cunliang Kong, Liner Yang, Shan He, Yongping Du, and Erhong Yang. 2020. Gated Context-Aware Network for Definition Generation. Journal of Chinese Information Processing. [paper] (in Chinese)
  • Cunliang Kong, Liner Yang, Tianzuo Zhang, Qinan Fan, Zhenghao Liu, Yun Chen, and Erhong Yang. 2020. Toward Cross-Lingual Definition Generation for Language Learners. arXiv:2010.05533. [arXiv]