论文作者简介: 李洪政,北京师范大学中文信息处理研究所博士研究生,主要从事中文信息处理研究。 基金项目: 国家语委“十二五”科研规划项目“语言资源建设规划研究”( YB125-124) 。 文章对国内已知的方言资源库建设情况进行了调研分析,并以其中三个资源库为例,总结了目前方言资源库建设的若干特点,同时也指出了一些存在的问题与不足之处。 文章分为以下几个部分:首先介绍了方言资源库建设的重要性及调研的主要内容;其次是介绍了国内的三个方言资源库;第三部分指出了方言库建设的特点和存在的主要问题;第四部分是对未来发展趋势的一些建议。 方言资源库建设的重要意义在于汉语方言亟需保护,开展方言调查、建设方言资源库就是保护方言资源的有效手段和重要途径。文章对国内(包括大陆和港澳台地区)已知的50个左右建好和在建的汉语方言数据库和语料库进行了调研,基本思路是:首先设计一些调研维度作为研究内容,主要是资源库的基本情况;然后通过查找论文资料、与相关单位联系等途径尽可能地搜集大量信息补充维度表;最后根据掌握的调研信息归纳方言资源建设的特点。 文章重点介绍的三个方言资源库包括:中国语言资源有声数据库、中国方言文化典藏多媒体资料库、方言文化网。 中国语言资源有声数据库是国家语委2008年开展的,坚持“政府主导、专家实施和社会参与”的工作思路。该数据库主要分为两个部分:一是语言和方言调查,二是地方普通话调查。该数据库的特点是根据实际情况,增加了不同省份的特色文化资源;优点是有利于保护语言资源和语言文化遗产、有利于语言规划、有利于推进语言文化信息化建设。 中国方言文化典藏多媒体资料库是中国语言资源保护研究中心、北京语言大学语言科学院语言资源研究所2010年启动的“中国方言文化典藏”项目的已有研究成果之一。特点是通过音视图文等多媒体表现手段,将地方特色文化现象用特殊方言形式进行保存与展示;目标是“实态保存,永久使用”。该资源库的优点是可以使用单点展示、多点对比和说唱表演等查询展示功能。 方言文化网是由暨南大学汉语方言研究中心方言文化室主办的方言共享网站,目的是更好地保护、推广方言文化。特点是支持用户随时录制和上传各种类型的口语文化资源,并在地图上标注出录音方言的位置;优点是网站的方言资源随时处于最新的更新状态,并且支持用户下载音频。 文章总结了目前方言库建设的特点,主要有:一、资源建设的方言类型基本覆盖了国内公认的七大方言区的不同方言以及下面的次方言;二、资源库建设的形态分为有声资源库和文本资源库;三、资源库涵盖的语言层次较为全面,也存在专门针对某一特定类型专门建设的资源库;四、方言与文化关系密切,资源库建设逐渐呈现出用方言展示当地文化资源和文化现象的趋势;五、资源建设的载体逐渐由单一形态的文化库或语音库向多模态资源库发展,展示形式也变得多样化。 目前方言库建设虽然发展较快,但是也存在一些问题与不足,文章指出了以下几种:一是能够直接访问利用的资源十分有限;二是没有充分发动用户广泛参与。 针对目前方言库建设的特点及存在的问题,作者提出的建议包括: 一、国家和正负部门的重视非常重要,一方面应该加大对语言资源保护和扶持力度,另一方面也要加强对方言资源建设的宣传,号召全民参与; 二、方言资源的建设要持开放的态度,尽可能面向全社会公布开放,收集用户建议和反馈; 三、方言资源建设是一个持续的工作,不能只靠语言学工作者来完成,而应该支持用户上传共享自己的语言资源; 四、各方言语料库最好能够统筹兼顾,能够嫁接在一起方便地使用,尽量减少重复建设。 文章通过实际调研,考察汉语方言资源库的建设情况,并给出了恰当合理的建议,对资源库的建设很有益处。 (本文刊于《曲靖师范学院学报》2016年第35卷第2期) (中国社会科学网 郭雅静) (责任编辑:admin) |