何平:机器制造文学? ——关于当下AI写作的技术问题
http://www.newdu.com 2024/11/25 07:11:45 《花城》 何平 参加讨论
关键词:文学性 AI写作 原标题:目前的机器写作,不是文学,更不能取代作家创作 人工智能技术会不会代替独立的人,来完成文学写作?在本期“花城关注”中,作家陈楸帆、王元分别与AI写作软件“创新工场”“彩云小梦”合作完成小说的写作。他们的实践恰恰证明,AI写作目前还停留在简单模仿的层面。人类灵魂的深度,尚不是当前的机器算法所能测量。本文系专题引文。 ——编者 这一期的两篇小说是人和机器共同完成的,虽然最后署的是人名,但我们以楷体字标志出机器完成的部分。和陈楸帆合作的是创新工场的“AI科幻世界”。这款产品可学习和模仿陈楸帆的小说句法和行文风格。而与王元合作的则是网络上很多人都用的写作软件“彩云小梦”。该软件不是专门为特定写作者定制的,是一款公共的AI写作产品。机器(AI)参与到需要人类高级思维和想象能力才能完成的文学、艺术及其他活动在当下不断成为大众传媒的话题,像会唱歌的“洛天依”、会写诗的“小冰”、会下棋的机器人等。一些对风潮敏感的研究者将这些目前只是依靠大数据、算法等计算机技术的初级文学艺术行为径直解读为机器(AI)写作正在取代人类文学。而事实上却不是如此。以“小冰”写诗为例,与文学界的热捧不同,“小冰”的开发者,微软(亚洲)互联网工程院小冰团队首席科学家宋睿华在2018年10月26日的CNCC技术论坛之“自然语言生成:让机器掌握文字创作的本领”的演讲中就明确表示,机器并不会取代人类写诗。他在演讲的最后以他上幼儿园的女儿的一首即兴的小诗为例,认为:“人类在作诗的时候是非常奇妙的,是AI所不能企及的,因此我们的空间还很大。”我理解宋睿华所说的“我们的空间还很大”应该是两个方面的:一方面是人类的写作及其他审美艺术的潜力;另一个方面,则是机器(AI)介入审美艺术等领域的前景,这两个方面都有着辽阔的空间。 普通人对AI的好奇,乃至焦虑和恐惧,和科技进步,和人文社科研究者、大众传媒的宣传有着密切关系;另外一股力量可能来自科幻文艺对未来世界的想象。这种想象典型地体现在宇宙旅行和人工智能上。其中,人工智能很容易让人联想到当下的机器(AI)写作。电影工业产品从20世纪80年代的《银翼杀手》到新世纪的《攻壳机动队》等,对人工智能的可能疆域作出了许多开拓,而《银翼杀手》则由赛博朋克风格的开创者菲利普·迪克的小说《仿生人会梦见电子羊吗》改编。人工智能也是当下中国文学的热点话题之一,“花城关注”发表的年轻作者杜梨和周婉京的小说都探索过这一主题。人工智能不局限在我们现在技术上已经实现了并还在拓展的增强身体的领域,而是智能人从类人、近人到“人”,乃至超人的成长。这种生物体和机器的混合体,“既是社会现实的生物,也是虚构的生物”(哈拉维),也就是所谓的“赛博格”。在科幻文艺描述的未来世界中,智能人从为人所用到逃逸出人的掌控和奴役,成为自足的“另一种人”。“它们”与人类一起分享、占有和竞争生存空间,也实现着自身的成长和进化。而最令人忧虑的不只是人和“另一种人”之间交往的诸多伦理问题,在对未来世界的想象中,“另一种人”可能会反噬,甚至转而奴役人类。 但至少目前的机器(AI)写作,无论是“小冰”,还是参与王元的《他杀》的“彩云小梦”,还是陈楸帆合作的创新工场,最终的成品并不是自足的文学,只是技术辅助,而且只是初级的技术。说到技术,我们当然要把技术的归到技术。同时,可以看陈楸帆的实践和他是怎么说的。 陈楸帆生于1981年,他出生的第二年,1982年,电影《银翼杀手》上映。2017年陈楸帆开始尝试与AI共同写作,这就是《人生算法》这本关于人与AI之间共生的六个故事中的《出神状态》。下面是陈楸帆自述机器写作的技术: GPT本质是一个语言模型,如同物理模型是用来理解和描述这个物理世界的本质一样,语言模型用来理解和描述语言的本质是什么。人类有世界观,也有语言观,比如说语言是什么,构成语言的词或短语之间的关系又是什么。 简单抽象来说,语言模型主要用来做两件事:一是对自然语言做理解,比如给出两个句子,语言模型会判断哪个句子更像自然语言、句子里面的词或短语的依赖关系是什么;二是对自然语言做预测,比如只给出一句话的前几个字,来预测后面的字是什么。 传统意义的语言模型主要用在语音识别、机器翻译、OCR(光学字符识别,即针对印刷体字符,采用光学的方式将其转换为电子文本格式)等序列到序列任务里,对目标序列做预测和判断。 最常见的两种用途之一是,机器会将一句中文翻译成不同的英文,语言模型会对每句英文翻译进行打分,从而选择最优的翻译。另一种是,在语音识别中,仅说到“我们正在聊……”,语言模型就会预测出,你大概率要说的是“我们正在聊天”,即使没听到“天”的声音就能判断出你将要说什么话,而听到的声音则是这个信号的加强。 如果把训练一个模型类比成培养一个学生,我们一般遵从一种叫作“先预训练、后微调”的教学方法。具体来说,我们先给机器很多书本让他自己读,这就是所谓的无监督预训练(pre-training);然后给它很多有答案的题目让它做练习,这就是所谓的有监督的微调(fine-tuning)。经历这个学习过程,模型就训练出来了,接下来就可以对它进行各种考试了,比如说给它一句话,让它接着写下一句。 此次与人类配合创作的AI模型来自创新工场DeeCamp 2020人工智能训练营中的大学生创新项目“AI 科幻世界”,它是一个在一千多块显卡上训练出来的超大规模预训练模型,用了300GB的中文语料,其参数规模与GPT-2 Large相当,训练完毕后又用了少量故事数据做微调。今年大火的GPT-3上体现出来的一些模型特色,在“AI 科幻世界”上也能有所体现,“并且是中文的”。 从操作层面看,人类作家与模型的交互十分简单,只需要给定场景与人物关键词,AI就能自动生成几个段落供作家们选择。人类作家可以在其基础上进行修改,而后AI将在经过修改的前文的基础上继续进行创作,如此往复,完成人类作家和AI的“共同作品”。 今天对于AI来说,一些简单的财经新闻报告已经不是难事,因为这些都是可以结构化处理的语句结构。不过,要涉及文学创作就是另一回事,如果从创作者的角度理解人工智能创作文本的不同阶段,最初的阶段是用统计学对语言要素进行排列组合,可以创作出简单的诗歌;后来进阶到人工智能在网络文本数据集里无监督地学习各种符合人类语法的规则和客观知识、去模拟人类的写作风格;可能更进一步的是AI可以从一个意象、一段话,去生发出来一个逻辑自洽、人物关系清晰、具有典型叙事结构的完整故事。 所以,至少目前机器(AI)写作所提供的只是一种技术路径和文字组合的片段实验,并没有实现真正意义上的机器制造的文学。同样的,王元也持这种观点,关于《他杀》,7月13日,我和王元在微信上有一个交流。 何平 王元 何平:问一个问题,森北和玄理、“我”和婧、光子和“我”,这三个“小梦”完成的场景是如何选择的?还是先有其他部分,然后让“小梦”完成这一段未完成的部分呢?再有,如果选择中间某一个点,让“小梦”自由地写下去,最后逻辑能自洽吗?(我给王元发了豆瓣小组讨论一篇“彩云小梦”完成的小故事,还有一篇关于“彩云小梦”写作的讨论)豆瓣小组的这些故事也是“彩云小梦”完成的吗? 王元:首先是要在那个“彩云小梦”的在线页面内进行写作。我先写一段,然后随机点击生成,就会续写出几个自然段,可以挑选一个满意的,都不满意,可以重新生成。没有特别让“彩云小梦”去生成哪些内容。因为这个在线续写软件不够智能,我在文章中也对生成的文本做了吐槽。 《他杀》里楷体字部分都是生成的,但是经过了修改,不然语义有点太不通顺,我已经尽量保留了行文的原貌,以做区别。 豆瓣上那些我不太清楚,也没有做参考,我只是使用了在线生成功能来完成一次人机交互写作,对这个软件没有做太多了解。这个远不如“创新工场”编写的程序好用,使用感并不好,更适合用来写网文水字数,很难产生真正的互动。 我觉得很重要的两点吧:一是,“彩云小梦”不能像“创新工场”的写作软件可以录入作者的文本,让生成的风格贴近作者的叙事语言。二是,生成的本文很多时候与已有故事情节特别割裂,所以体验感不是很好。 我觉得人机交互写作是一个非常有趣的尝试,但要说人工智能取代作者还任重道远。人工智能更适合生成新闻通稿和报告,这些文本的措辞比较雷同,而且,可以完全避免敏感词。 何平:《他杀》用的是“创新工场”吗? 王元:《大成若缺》是“创新工场”写的,《他杀》是“彩云小梦”写的。当时“创新工场”的软件服务费到期不能用了,我就从网上找免费的续写软件。 何平:所以我觉得《他杀》里的“彩云小梦”所写的恰恰证明了“彩云小梦”的程式化。 王元:对,玩一玩还行,正经要靠这个写作不太够用。或者说没有太多惊喜的发散。楸帆的《大有》的机器部分,我觉得比《他杀》要复杂一些。 何平:所以,这种写作基本上还是尝试。《他杀》恰恰证明目前写作软件不可能完成文学性内容。 王元:相比文学性,我觉得创造性更适合一点。文学性的界定相对模糊。创造性就好说了,就是说给我们一个主题,或者已有的内容,机器能制造出什么? 何平:网文的类型化也许可以适应这种写作软件。机器能制造“文学”吗?这正是我们要讨论的话题。 王元:交互写作是一个人机合作和博弈的过程,得有碰撞才行。两次写作感受下来,碰撞都不够,“彩云小梦”比“创新工场”更差一些。对,一个是网文,一个是通稿。就是类型化比较明显和简单的文体。这些相对来说,不用那么多创造性。 至此,我们可以看到当下机器(AI)写作的大致边界。介入其中的实践者是清醒的,聒噪的往往是旁观者。对我个人而言,也是一次技术启蒙。想象这个专题之初,受前沿学者和大众传媒的蛊惑,我对机器写作(AI)抱有厚望,希望最终的文本不是“小冰”的诗,而是完整的叙事单元,但最终实践者陈楸帆和王元所展示的实践成果,恰恰证明,到目前为止,基于算法和语料的机器写作(AI)并不能独立完成“文学”文本,哪怕是小说中的局部片段也不能完美地嵌入陈楸帆和王元的叙事中。而这种不完美,甚至是失败,对比夸大“小冰”诗歌的完美和成功,正是这个专题的意义所在。“小冰”诗歌的文学性则是诗歌文体本身暧昧模糊为阐释者带来了想象的空间。换句话说,“小冰”诗歌的文学性并不是“小冰”“写”出来的,而是阐释者“说”出来的。如果真要算文学成就,这个成就只能记在阐释者的名下。但这不意味着世界范围内与机器写作相关的“赛博格”的广泛讨论和忧虑没有意义,相反,初级的机器写作已经引发了我们如此多的焦虑和恐惧,如果科幻文学所描绘的赛博空间有一天真正兑现,人类准备好了吗? (责任编辑:admin) |