语文网-语言文学网-读书-中国古典文学、文学评论、书评、读后感、世界名著、读书笔记、名言、文摘-新都网移动版

首页 > 学术理论 > 语言学 > 其他分支学科 >

2019首届计算词典学研讨会在京召开(2)


    
    俞敬松副教授作报告 主办方供图
    北京大学俞敬松副教授作“古文自然语言处理研究的进展与古汉语词典辅助编纂”的报告,介绍了古文的自动句读、分词与古籍文字识别的最新进展。报告使用最新的深度学习方法和基于超大规模语料预训练模型再加下游任务的微调方法,对古汉语文本进行自动句读、自动标点、无指导和弱指导方法分词、词性标注等多项任务的研究,证明了深度学习在古文自然语言处理领域同样可以发挥积极的作用。
    
    胡钦谙博士作报告 主办方供图
    中国社会科学院胡钦谙博士的报告“例句检索技术综述”从展现形式、数据来源与标注、方法以及评测四个方面对现有例句检索技术进行了回顾。报告指出现有例句检索技术存在许多问题:展现形式上对语料库中词的用法以及例句之间的关系缺乏整体刻画;难以区分义项;例句相似度计算难以聚焦在检索词用法上;未能充分利用海量数据;基于分类的评测指标难以对序关系进行精微的评估。报告认为,深度学习方法的向量化表示、注意力机制以及预训练模型等技术在例句检索方面具有潜力。
    
    顾曰国研究员作报告 主办方供图
    “概念、词、汉字、词林与知识本体”是顾曰国研究员的报告题目,他使用语义网技术(OWL 语言)构建用于汉语语文辞书的知识本体,并演示了把概念、词、字、词林统一起来的方法。报告首先通过被感知世界、内在世界、有声语言世界等“三个世界” (Umwelt-Innenwelt-Lebenswelt)的构建演示了概念、词和字的动态发生关系。随后,指出不同于以词为基点的传统语文辞书,词林的本质是以概念为基点进行编撰。
    
    学者们进行现场交流 主办方供图
    专家报告结束后,会议进行了简短的专题讨论。顾曰国研究员最后作了总结发言,他指出本次会议的召开是国内计算词典学研究的一个新起点,提供了一个供大家互相交流的新平台。 (责任编辑:admin)