文学研究在数字人文时代拓展全新视野——访中南民族大学数字人文资源研究中心主任王兆鹏
http://www.newdu.com 2024/11/23 03:11:21 未知 张清俐 参加讨论
近年来,依托强大数据技术手段而兴起的“数字人文”浪潮,不仅为诸多人文学科带来了新的方法和问题域,甚至在传统研究领域激发了一系列学术增长点。其中,在文学研究中,出现了一批融合了数字人文的学术成果,尤为令人耳目一新。数字人文为文学研究带来了哪些学术增长点?未来数字化的文学研究前景如何?就相关问题,记者进行了采访。 中国社会科学网:目前学界对数字人文的理解众说纷纭,您是如何理解对数字人文的界定?就您所从事的文学研究领域来说,数字人文有望激发怎样一些新的思考?文学研究领域的数字人文应该体现哪些特征? 王兆鹏:因为数字人文还在不断发展变化之中,所以至今没有一个公认的固定的定义。不同的学者从不同的角度去理解,会有不同的界定。我对数字人文的理解是:数字人文是以多学科交叉的学术团队为研究主体,以数据为基础、平台为支撑,运用数字技术方法来研究人文科学。团队、数据和平台是数字人文的三大核心要素。 我目前理解的数字人文,是一种“技术方法”。作为一种不断发展变化而且应用十分广泛的技术方法,数字人文必然会给人文科学带来方法的革新、范式的转换和研究领域的拓展。 说到什么样的文学研究才算数字人文研究,首先是要有数据,是以数据说话。过去的文学研究也偶尔会用到数据,但那些数据是点缀、补充。而数字人文研究,数据是出发点,是讨论所有问题的基础。传统的文学研究,是以主观的理解阐释和客观的文献史料为基础。而数字人文研究,需要将文献史料转化为数据。但怎样转化数据和转化什么样的数据,取决于研究者的主观目的和对史料的理解。所以,数字人文在操作层面上,与传统的文学研究截然不同,但在观念层面却是相通的。 其次,是要用数字技术来处理数据、分析数据。通常是借助软件来开发和分析,比如最常用的地理信息系统(GIS)技术、人工智能(AI)技术和虚拟现实(VR)技术等。我主持开发的国家社会科学基金重大招标项目《汉魏六朝地图平台建设》,运用的人工智能技术包括FP-growth、朴素贝叶斯、决策树等。 FP-growth技术,主要用于协助构建领域知识数据模型。例如,在构建时节数据模型时,需要从大量的样本资料中,提取与各个时令季节相关的频繁项集,归纳挖掘出强关联词汇。以重阳为例,通过FP-growth技术,我们可得到“茱萸”、“菊”、“秋风”、“霜”、“雁”等强关联字词,甚至可根据作品时代,细分出“落帽”、“白衣”(出自白衣送酒的典故)之类的强关联词。朴素贝叶斯技术,则在前面借助FP-growth得到的强相关词汇的基础上,分析作品中含各种领域的强关联词汇的数量,协助判断作品内容所涉及的主题信息。例如,重阳也写作九日。诗中的九日,究竟是指重阳节,还是九天,这时即可通过前面得到的强关联词,分析其可能性。决策树技术,则用于综合多个领域提取到的特征,协助排除噪音。例如,西湖这一地点,唐代以前就有多个西湖。究竟作品中所述及的西湖哪一个是我们需要查询的杭州西湖、颍州西湖或福州西湖,可以综合从作品中分析到的地点或人物等其它特征,综合判定西湖属地。这些技术的应用,需要有懂技术的专业人员参与。一般的人文学者,能了解这些技术有什么用就很不错了,能娴熟地运用这些技术解决具体问题就更难。所以,数字人文团队中,必须有人文学者和懂数字技术的专业人员协同合作。 数字人文研究还有一个特点,就是可视化呈现,用各种地图、图表、图像来呈现。比如,我主持开发完成的国家社会科学基金重大项目成果《唐宋文学编年地图平台》就是在地图上动态展现唐宋时代作家一生的活动行迹。 前年参加美国一个数字人文学术研讨会,我提交了一篇题为《唐五代诗歌版图的静态分布与动态变化?——基于<唐宋文学编年系地信息平台>的数据分析》的论文,比如其中一份关于唐代著名诗人占籍和活动地域分布对比表,为了凸显数字人文的可视化特色,我特地请武汉大学测绘学院制图专业的高级工程师乔俊军先生将统计表设计转化为可视化图表。 中国社会科学网:您是从什么时候开始注意到数字人文这样一个概念,并将其运用到古典文学研究中?据您观察,近年来,文学研究中的数字人文化,出现了哪些让您印象深刻的成果或者学术增长点? 王兆鹏:我是先实践数字人文研究,后了解数字人文的概念。我从20世纪90年代初开始尝试做定量分析。先是手工录入数据和统计,后来学会用软件录入和分析数据。2000年以来,我先后与友人合作,自己设计开发了好几种数据统计分析小软件,自己设计功能,由专业技术人员编程开发。这些软件,可以将文学研究资料转化为数据,然后自动生成统计数据和统计结果。这算是我做数字人文的前期实践。 我真正做数字人文的项目,是从主持国家社会科学基金重大招标项目《唐宋文学编年地图平台建设》开始的。这个项目,醖酿、调研、筹备了一年多,2012年正式立项。但说来有趣,直到项目立项时,我都不知道“数字人文”这个概念。我的项目,是基于古代文学研究的内在需求而开发的。我在做宋代词人年谱时,经常用历史地图,讲课时更常常涉及古代地名、地理,但在课堂上只能是“空讲”地名在哪里,而不方便让学生“看”地图,不能培养学生具体的空间感。于是想借助计算机技术把作家的活动地点、行踪路线和地图结合起来。项目在实施过程中,才接触到GIS技术,并进而了解了数字人文及其进展。 就整体而言,目前的文学研究中的数字人文化,由尝试已进入起步阶段。已完成上线的项目,除了我主持的《唐宋文学编年地图平台》外,还有浙江大学徐永明教授主持的《学术地图发布平台》;其他与文学研究相关的数据库、信息平台建设的国家社会科基金项目越来越多。 在数字人文技术推动下,古代文学思维路向出现了重大转折,由注重“人时关系”转向“人地关系”的研究。人时关系,是指人与时代社会政治的关系;人地关系,是指人与地理空间的关系。近年出现的文学历史现场的还原研究、文学地景和文学景观研究、文学情感空间研究等,都是研究人地关系与地理空间的关系。 中国社会科学网:在您看来,当前文学研究的数字人文化存在哪些瓶颈?您如何看其未来的发展前景?有什么建议? 王兆鹏:我觉得有三大瓶颈。一是研究观念的制约。文学研究者长期形成的思维定式,更习惯于在传统轨道上前行,宁可在已有的研究领域深挖广拓,而不大注意接受新技术、新方法带来的挑战和机遇。更有不少学者认为文学是审美的,是主观化个性化的体悟与阐释,不能用客观的数据来衡量,因而完全排斥甚至拒绝文学研究的数字化和技术化。二是知识结构的局限。文学研究者大都不懂技术,缺乏对新技术的了解和敏感,也不愿意去了解。对技术产生畏难情绪,自然也就难以运用数字人文的技术方法来探索和解决文学研究中的问题。三是学术体制的制约。真正的数字人文研究项目和成果,都需要不同领域的专家合作。另外,现在的期刊只能发表纸质成果,对数字化的研究成果,诸如可视化的成果无法发表和呈现,这也在一定程度上限制了文学研究数字人文化的深入。 (责任编辑:admin) |