□ 朱恬骅
载《光明日报》2024年9月28日。
近期,国内首部由人工智能创作而成的百万字长篇小说发布,有关文学与人工智能的话题再度引发文学创作与研究领域的广泛关注。自2020年ChatGPT问世以来,人工智能在文本生成上取得的进展有目共睹,可以按照人们的要求,完成包括纠正语法错误、摘编文章观点、编制广告文案等多种多样的任务。用人工智能完成故事大纲、背景设定、人物形象等一系列工作,并在此基础上生成出具体的情节文本,则是对这些功能的综合应用。
这并不是人们第一次感受到“机器”对于文学的冲击。2017年,伴随“小冰”的《阳光失了玻璃窗》出版,“骆梦”“风的指尖”等一批在网络平台活跃的“诗人”,也终于揭晓为“小冰”的“马甲”。同一年,清华大学的“九歌”系统发布并在电视舞台亮相,其产生的文本具有古典诗歌的形式,能够遵守格律和用韵的要求,同样让人难辨真假。
但在当今围绕人工智能与文学的讨论中,诗歌却仿佛离场了。取而代之的是一个技术名词位居话题的中央,那就是“语言大模型”。通过将模型内部参数的规模提升到十亿、百亿的数量级,并在人类穷其一生也无法读完的海量文本上进行训练,大模型获得了模仿人类生成各种文本的能力。无论是生成诗歌还是小说,又或是各类应用文,都只是其通用性的体现。
如今,无论是否是技术专家,人们将更多注意力放在大模型如何获得这种按需“定制”文本的能力,又如何才能对它的生成能力施加进一步的控制。人工智能生成长篇小说的尝试,正是属于这类可统称为“提示词工程”的工作。诗歌生成本身似已不再构成技术发展中的一项主要挑战,人工智能写诗也随之失去了当年的话题性。在这样的境况下,不禁有必要怀疑:机器写诗还有未来可言吗?
鉴往知来。探求机器写诗的未来,也许我们应当首先回顾机器写诗的历史。在语言大模型出现之前,机器写诗一直是技术专家进行文本实验的工具。1952年,英国计算机专家克里斯多夫·斯特雷奇编写了最早的文本生成程序,以检验使用计算机操作文本信息的可行性。七年之后,德国工程师鲁兹(Theo Lutz)从卡夫卡的小说《城堡》中分别选择了16个名词和形容词,编制了计算机程序将其按四种句式加以组合,产生出大量随机排列的句子。由于这些句子排列规整,并因句式上的重复,而获得别具一格的韵律感,这一题为《随机文本》的作品被视为最早由计算机生成的诗歌。
在谈论自己的作品时,鲁兹指出,他的目的在于表明计算机能够应用于数学以外的领域,并将“计算”的概念拓展到字词和逻辑推理上。为此,他应用了计算机中的随机生成器,来做出决策、生成文本,并指出未来的研究方向应在于引入概率统计的结果,来使字词的组合更有意义。后世的发展也确如鲁兹所料:一些新的数学模型得以提出,并在诗歌形式的文本生成中展露身姿。即便今天的语言大模型在原理上已与当年基于模板和规则的方式大相径庭,在对语言材料进行统计分析这一点上,仍然殊途同归。
在人工智能的技术发展历程中,诗歌生成具有特殊的地位,不仅因为它代表了最早使用计算机进行文本生成的尝试,而且还在于它独特的象征意义:利用千百年来诗歌的崇高精神地位,机器写诗吸引了人们关注并支持人工智能领域的整体发展;借助诗歌体裁对词句非日常用法的宽容,诗歌生成方面的探索描绘了通用文本生成的技术图景。其背后的预期是,既然能够用计算机生成出某些“诗作”,那么未来也完全有可能生成新闻、报告,抑或小说、散文,产生社会与经济价值。
现在,当初许诺的“未来”已经到来。语言大模型以一种通用的方式,实现了不同体裁文本的生成,其中诗歌并不具有特殊的地位。要取得一首机器生成的“诗”,人们只需将自己的需求按照“大模型”所能接受的格式写成文本,这与让机器生成其他形式的文本时完全一致。大模型应用的普及让专门化的诗歌生成反而成为了边缘,尽管使用计算机进行文本生成的历史可以说正是由机器写诗开启的。
技术地位上的沉寂,只是使“机器写诗”蒙上阴影的一个方面。由机器产生的诗歌自进入公众视野以来,就受到诗人、作家和批评家们近乎一致的反对。一位当代著名诗人批评,机器生成的“诗”只是“一些碎片的无机组合”,是“拙劣的”、玩弄“修辞智性”而已。
但曾几何时,机器写诗也是诗人们主动的追求。20世纪60年代,西方诗坛曾经流行过所谓的“具体诗”。他们将文本、字母图像化,主张将语词用作“物质材料”,用不同的字体、文字的大小、曲线化的排列和连线,来创造诗歌在视觉上的韵律。其中的代表人物之一,德国美学家马克斯·本泽(Max Bense),提出了“人工诗”和“自然诗”的区分,倡议诗歌应“依照理论来创作”,而这种“理论”又应当是可以“科学地”加以验证的。严格遵循规则运作的计算机程序,成为了进行这种“检验”的最佳工具。
与此同时,还有一些诗人和作家也将目光投向了字词排列组合的艺术。在巴黎成立的作家团体“乌力波”(Oulipo)致力于按照人为设定的规则,在受限的情况下进行实验性的创作。意大利知名作家卡尔维诺,在70年代以外籍成员身份加入该团体,其晚期作品如《命运交织的城堡》就带有浓厚的组合色彩。
到80年代以后,计算机的普及让艺术家们有机会以自动化的方式实现文本的生成过程。“乌力波”的“受限创作”被重新提起,并交给计算机程序自动完成。这些诗人和艺术家们亲身投入了新技术的学习和使用,在技术上的复杂性和艺术上的先锋性之间建立了实践上的关联。他们用机器产生的诗歌,发展和应和了“具体诗”对于“人工诗”的期望,也展现了语言在不同规则束缚下仍能顽强生长的潜力。
其实,如果将“机器写诗”的范围拓展到计算机以外,就不难看到,机器写诗同样有其悠久的历史渊源。1845年,英国一位出身工匠家族的生意人约翰·克拉克,用回收再利用的齿轮、皮带、木条,拼装出一台名为“尤里卡”(Eureka)的“诗歌机器”。他将写有字母的木条安装在传动装置上,转动机器的把手,“尤里卡”就能逐个字母拼写出一句由6个单词组成的拉丁文诗行,其格律符合“六步格”的要求。
“尤里卡”的展出迅速成为了当时社会的热点,并进入公共话题的领域。彼时,撰写拉丁文诗歌一直是大学必考的科目之一。学生们疲于记诵各种陈词滥调,使“作诗”削减为机械化的应试技巧。对于这样的状况,主张改革的一派认为,古典语言知识已经不适应现代社会的需要,应加强自然科学、当代史等“现代学科”的教学,以促进前瞻性的技术发展与知识生产。而克拉克所制造的这台“真正的机器”,无疑是对这种应试“写诗”最好的讽刺——不合时宜的应试要求,将人贬低为一种受“死规矩”束缚的“写诗机器”,限制了他们学习和推动现代学科所需要的创造能力。
当然,“尤里卡”并不像克拉克宣称的那般,每一个单词、每一个字母都出自精密的“计算”。在本质上,它只是将一组精心选择的单词随机地组合起来,而实际上无论它们如何组合,都能在符合语法的同时满足韵律上的要求。这一创意本身可以上溯到1677年:一位名叫约翰·彼得(John Peter)的英国医生就已利用这点编写了一本小册子,聊作学童的娱乐,并称颂“数字的伟大力量”。
机器写诗这项古老的事业,诞生于对“人的机械化”加以批评的社会思潮中。然而三百余年间,从木制的机械齿轮到高速运行的电子计算机,机器写诗所处的世界早已时过境迁。人工智能时代的我们用简单的“提示词”就能进行诗歌生成,自然无需为19世纪英国的高等教育制度而忧心。产生“机器写诗”的文化境况发生改变,连同诗歌生成技术地位的下降,以及技术的复杂性与诗歌的先锋性之间联系的“失灵”,使机器写诗很难再有未来可言。
当然,这并不是说机器写诗就必然会消失。恰恰相反,由于语言大模型越来越容易访问获取,机器写诗的实践或许会更加频繁。只是这或许要求人们从另一种方面来看待机器所产生出的文本:不是把它们看作诗歌,并且以诗歌的标准来评价;而是将它们视为自身与诗之间的某种桥梁和媒介。
必须承认的是,人们并不都会作诗。但通过调用自动化的诗歌生成工具,他们也可以用诗歌的形式,使自己的所思所感有所依凭。无论是通过“对话提示词”、借助照片图像,还是依照软件要求选择体裁、风格,又或是为生成出的“诗歌”附上解读,从诸多可能的字词组合中,带有随机性地计算得出最有可能、最接近已知诗歌的选项。
由此得出的文本固然只是诗歌的“碎片”,但它们毕竟还是跨越远近不同的时空间隔,在文本生成的瞬间实现与此时此地个体经验的连结,也就是在传统的表达形式与现代人的生活经验之间引发共鸣,导向“诗歌与我有关”的意识。
因此,机器写诗的技术价值或许有所降低,艺术价值或许也已消失,但它的社会意义可以与时俱进。可以促使人们回到支撑机器自动生成的“源文本”,也就是名副其实的诗歌作品之中,创造出亲近诗歌的契机。