最后,中国社会科学院语言研究所刘丹青所长做总结发言。 刘丹青所长指出,这次学术沙龙是一场真正意义上的学术盛宴,今天的主题“语言学论证的论据问题”缘起陈平先生提及的关于对形式语法的一次功能式的大数据的检验。今天的讨论更多的是维度的拓展。与以往关于“语言事实”的讨论有所不同的是,今天跨越的领域从古老的出土文献到刚刚出生的婴儿的语言实验,从时间的纵深到空间平面的探索,成千上万个数据在每一个领域之间进行着非常大的跳跃,包括外国人阅读中国语言文字的心理、眼动的实验,等等,跟我们传统的语言文字相比,都是非典型的、新型的证据。我们今天的讨论,旨在突破语言学传统的藩篱,来一场星际的旅行。从眼界的突破开始,进入到境界的提升,从而使我们免于成为井底之蛙。 刘丹青所长还总结了今天讨论的几点启发: 1、证据在科学研究中具有核心地位,可以区别科学与非科学。自然科学没有证据难以立足,而人文社会科学也在追求向科学靠拢。语言学作为最接近自然科学的人文科学,应该在科学方法的探索上、科学论证和科学证据的追求上,走在人文科学的前列。证据本身具有相对性和主观性,即便在自然科学界也是如此,而在人文科学领域尤为严重。语言学研究的证据多有好坏的程度差异,而不是绝对的真理和谬误、正确和错误的关系。尽管如此,我们还是要在向善的道路上,不断追求更好的证据。 2、关于证据的多维性和多样性。今天的报告拓展了语言学研究应该关注的证据,使我们知道研究语言可以有多个角度,有的确实能带来新知。大数据带来的是一种观念,大数据思维不仅包含总体思维,还包含容错思维,我们应该整体认识大数据给我们带来的新的见解。此外心理学的实验、眼动的实验、跨语言研究、更多的实验语音学扩大为实验语言学的证据,都给我们原有的书斋之学带来新知。域外汉语资料在音韵、文字、词汇、语法方面都可以深化我们对汉语,尤其是从近代汉语到现代汉语演变时期的变化的研究。北语推动的中介语语料库和中介语的研究,不仅对第二语言教学、对外汉语第二语言习得有用,而且对语言的本体研究也有很多启发。 3、关于相关性和因果性的问题。大数据直接带来的是相关性的表述和结论,在多大程度上最终指向因果关系,在很多方面受研究的力度和深度的制约,这也涉及到计算语言学界一直存在的基于统计和基于规则的问题。而对于我们认识语言的本质来说,最终还是要还原到陆俭明先生所言的语言事实,我们不能靠基于统计来回答这个问题,我们必须回到规则上来,语言是受规则制约的。 4、在证据的视野下,如何推进语言学研究。语言学的本体研究仍然是语言学研究的中心和中坚,作为新的意义的传统语言学研究学者,我们应当提升语料本身的质。我们深切体会到,资料的调查描写的准确度和深度、细度,对资料的质量有着至关紧要的作用。大数据有结构性的和非结构性的,结构性和非结构性的质量是完全不一样的。我们要让更多的大数据的资料,变成是结构性的,并且是优质的结构性的语料,在这个基础上我们才能产出更好的语言学研究成果。有了大数据之后,如果没有很好的语言学的素养、语言学的理论、语言学的思维,也只能是材料和表格的堆积,是没有真正价值的。所以必须靠我们语言学的思维和创造力去大数据里提炼。同时,做大数据的人,也需要深入了解语言学学科的发展,才能设计出更加合理的大数据的结构。 刘丹青所长表示,作为语言学本体领域里或者语言学应用领域研究的每位学者,都应该能够从今天的报告得到一点启发:我们可以打开井盖,去了解一下有哪些跟这个学科有关的、可以提供新的证据的研究正在进行,我们要关注这些成果,对于那些有意义的、有启发性的成果要特别关注。能做到这一点,我们今天的沙龙就起到了作用。 (责任编辑:admin) |