近日,我院2021级本科生管海粟的独立一作论文“Deciphering Oracle Bone Language with Diffusion Models”被自然语言处理(NLP)领域国际顶级会议ACL主会录用。人工智能与自动化学院刘禹良教授、软件学院白翔教授为指导教师。
自1899年甲骨文被发现,迄今已有约4500个不重复的单字,但仍有三分之二的甲骨文等待破译。近年来,利用现代人工智能技术理解甲骨文逐渐成为人们关注的研究领域。然而,现有的绝大多数人工智能研究主要集中在对已破译甲骨文文字的识别和检测上,而使用人工智能进行甲骨文未知文字的破译仍是一个未充分开发的领域。
该论文创新性地关注利用人工智能辅助破译未知甲骨文这一领域,从人工智能辅助破译甲骨文的角度出发,利用扩散模型(Diffusion Model)提出了一种新的甲骨文破译的方法(OBSD)。该方法能够有效解决甲骨文综合语料库严重缺失的问题,并从图像生成的角度出发,为甲骨文文字提供重要的破译线索。此外,该方法可以轻松推广到其他象形和会意文字,为破译其他古文字提供了一个可能的潜在方案。
作为我院首届学生,大二时管海粟加入软件学院白翔教授创建的本科生创新团队,初步进行科研探索,并在这里认识了从事人工智能视觉与自然语言处理领域研究的刘禹良教授,正式开启用人工智能辅助破译甲骨文的探索之旅。在两位老师的指导下,他和课题组其他成员分别尝试用不同路径探索辅助未知甲骨文破译的方法,共同搭建甲骨文开源数据集HUST-OBC和EVOBC,并协作设计了基于人工智能的多途径辅助破译系统Open-Oracle。有关工作已获得4项国家专利。
据悉,ACL会议(Annual Meeting of the Association for Computational Linguistics)是由计算语言学协会主办的顶级学术会议,是由中国计算机学会(CCF)推荐的自然语言处理和计算语言学领域A类会议。