四季歌文学社区
标题: 【转帖】AI同光体会梦到赛博杜甫吗?——AI旧体诗创作漫谈&整活倡议 [打印本页]
作者: 剪烛西窗 时间: 2023-4-4 00:24
标题: 【转帖】AI同光体会梦到赛博杜甫吗?——AI旧体诗创作漫谈&整活倡议
此文较长而且内有照片不易复制,所以我只是节选,供各位参考。
声明:
本文为漫谈,并不严谨,因此不引用任何参考文献。全文所谈仅代表作者本人观点,很多是没有证据的猜想,故文中多用“可能”。
一、chatGPT与百度文心
最近chatGPT很火爆,作为一个曾经使用过GPT算法的AI研究者,我其实早在chatGPT破圈前就已经体会过它强大的性能了。不过具体到让chatGPT去写旧体诗,它还是力有不逮,见下图:
图片(略)
chatGPT在旧体诗生成这个方向如此拉胯的原因在于——它没有对旧体诗生成这个任务进行专门的训练,所以写出来的东西自然就不知所云。openAI作为一家美国公司,不关注中国的旧体诗实属正常。
不过就在前些时间,对标chatGPT的国产大模型百度文心一言出现了,作为中国企业的产品,当然要会写中国的诗歌,所以李彦宏在发布会上当场让文心写了一首藏头诗——
图片(略)
这是妥妥的翻车啊,格律不对,内容无厘头,且蹈袭古人原句。可能是百度的技术人员不懂旧体诗,所以得到了这么一个不如人意的效果。
二、AI旧体诗的前世今生与将来的发展
在尝试过国内国外两个大语言模型去生成旧体诗后,我个人认为,chatGPT和百度文心一言并没有太好的AI旧体诗生成功能。目前公开的,能代表AI旧体诗生成的,应该还是九歌和诗三百。
先来讲讲我印象中的AI旧体诗生成的发展脉络:
作者: 剪烛西窗 时间: 2023-4-4 00:25
三、AI旧体诗带来的启示
1、AI与人类诗人
图灵测试
要探讨AI与人类的关系,图灵测试是绕不过去的一个东西。之前为了探究AI生成的旧体诗是否能达到以假乱真的水平,我把击壤的作品和明清大佬(如钱谦益,陈三立)的作品混在一起,出了个问卷让人二选一,分辨哪首是人类写的。一共十六道题,分为五绝五律七绝七律四个体裁,每个体裁四道题。参与测试的人员有旧体诗创作者(铭社,乾社,承社等诗社的社员),也有专业研究者(北大,复旦等高校古代文学方向的学生)。测试的结果是:整体正确率50.32%(二选一的话随便选,正确率也应该是50%)。这次图灵测试的内容与结果详见:
如何分辨一首诗是否是AI创作的?(AI图灵测试答案)
这次测试的结果说明,哪怕是对于旧体诗词了解颇深的创作者与研究者来说,分辨一首诗歌是AI创作的还是人类创作的也是一件不容易的事情。
原创性问题
接上,由于很难分辨AI作品与人类作品的差别,所以导致有人拿诗三百的作品据为己有招摇撞骗,并且开班收钱教人写诗。这种直接的搬运当然是毋庸置疑的抄袭,但是更多的情况是很难去定义的。比如有人取了AI作品中的单个句子放在自己诗里,这种算不算抄袭?或者将AI作品略改数字(李攀龙:这个我熟),这种算不算自己的作品?这些行为如何定义?举办诗赛时如何检测?凡此种种,尚有待达成共识。
AI作诗与人类诗人关系探讨
其实对于AI与人类诗人的关系,我觉得潘静如老师的想法最有道理:“李杜苏黄在前也不影响你写诗,是不是?ai也一样影响不到”,在21世纪这个很难通过旧体诗来获得功名利禄的时代,诗是写给自己看的东西,目的是进行自我表达。AI写的再好,也不过是今之李杜,最多师法借鉴一下,何必跟AI比较诗作水平?
我个人觉得,AI与旧体诗人最合适的关系是:AI提供灵感或变成类书一样的参考工具。因为诗歌是人类表达思想情感的工具,AI生成的作品哪怕写的再好都是无意义的——它唯一的意义是被人看到并对人类的创作产生启发。
作者: 剪烛西窗 时间: 2023-4-4 00:26
2、AI时代下的诗歌审美
主体性
个人猜测,在AI生成的旧体诗已经可以和明清名家的平庸之作五五开的情况下,AI的存在可能会倒逼当前的旧体诗审美产生一些流变。
谈起AI的旧体诗作品,不可忽视的一点就是作者的缺位。我觉得作者本人是旧体诗的一个重要组成部分。龚自珍尝言“人以诗名,诗尤以人名。唐大家若李、杜、韩及昌谷、玉谿,及宋元眉山、涪陵、遗山,当代吴娄东,皆诗与人为一,人外无诗,诗外无人,其面目也完。”,此论是也。试想如果“人生自古谁无死,留取丹心照汗青”一诗是游泳健将钱谦益所做,恐怕大家就不会觉得那么好了吧。这首诗要配上作者文天祥的事迹,才能最大程度地令人感发,如果作者是钱谦益,那么此诗的感染力必然减弱。
基于AI作品主体性缺失这一特点,现行的诗歌审美可能会更加注重诗中作者本人的存在。
诗歌的语境
先给大家看张截图,无冒犯之意
少时壮且厉,抚剑独行游。
谁言行游近?张掖至幽州。
饥食首阳薇,渴饮易水流。
不见相知人,惟见古时丘。
路边两高坟,伯牙与庄周。
此士难再得,吾行欲何求?
注:以下有评论。有人评论其“隔”,贴不上来了。这是陶渊明作品。
图中说陶渊明“隔”的这位,是我非常喜欢的一位当代旧体诗人,并且我认为他说的对。一首诗有属于它自己的语境,这首作品在老陶的语境写出来就是好,在今人写出来就是不合适。在高铁飞机通全国,过安检不能带管制刀具的时代,“撫劍獨行游”“飢食首陽薇,渴飲易水流”这种句子由当代诗人写出来像是摆pose。此外,经历过唐宋元明清诗艺的发展后,六朝时合适的诗语可能已经变成了熟语,当代人写未免觉得顺手。
在AI的创作中,语境也是缺失的,而且由于AI的“妙手空空”之病,作品常缺少明确的指向性,可彼可此。人类诗人为避免此类“妙手空空”,可能要做到指事精当,作品更加贴合创作时的情景。可以在不封号的情况下多写感事诗,如顾青翎《都门春日漫兴》,luq的《徐汇吏》《浦东吏》,槑庵的《黄浦滩民谣》,铁壑斋(因鲁鱼亥豕之误被迫更名铁坚斋
)的《皋兰山民谣》,都是绝好的例子。
拟古与出新
上文提过,现有的AI是基于概率的,所以它会写出最有可能的诗句。而根据我目前对自己编写的AI旧体诗生成模型“击壤”的观察,五绝是其最薄弱的体裁——原因就是古人五绝的作品写的少啊。所以如果过于拟古,写一些跟古人很像的东西,很可能落入AI的窠臼,而如果你比较前卫或创新,写出一些古人未到之境,那么AI是很难碰瓷你的。
这个出新,可以是意新(古人未有过的想法),如诗坛霸主红烧的名句“此后绯衣复谁解,当年红豆已全荒。”;也可以是语新(炼字或用典精妙),如江上木奴的“每志桃溪扶路树,都添滟滪刻舟痕。”“犬雞無數通仙籍,猿鶴幾多浮海槎。”;或者是有李子,黑眼睛,金鱼那样独特且不同于古人的语言风格。此处不再一一枚举。在AI已经能做到拟古的情况下,人类诗人如果想要摆脱“你写诗像AI”的形容,可能要更加注重创新。
长古大篇
AI生成内容是靠计算,有计算必有误差,而误差又字字积累。所以AI生成短一些的文本,如律绝,有时还可以掩人耳目,因其字少,误差就小,效果也好。稍长一些的古体就完全不够看,字数一多,积累的误差就大了。而且AI缺乏明确的指向,糊弄糊弄稍短的律绝还好,对长古大篇来说,这个缺点是致命的。所以像老杜《自京赴奉先縣詠懷五百字》这种长古大篇,是AI暂时望尘莫及的高度。
以个人愚见,长古也最见水平。为什么这么说呢?咱们如果假设诗可以短到一个字,那么我说一个字,和李杜说一个字,我不觉得会有高下之分。如果再长点,诗是一句五言,那么我写一句五言,和李杜写一句五言,虽然有差别,但可能高不了我太多。发展到五绝,李杜就可以随意碾压我。盖因如果只有一个字,那么你只有几千种不分高下的选择(假如都是常用字),五个字的话情况就是几千的五次幂,那已经是一个天文数字,其中蕴含的信息就多得多,差异也大得多。以此类推,我们可以得出结论,字数越多,留给诗人的创作发挥空间也就越大,诗的信息量也就越大,诗与诗之间的差距也就越大。那么依照这个推论,古体是最见功力的体裁。所以如果将来AI作品泛滥,大家又分不太清楚AI作品与不出彩的真人作品,那么长古在审美评价体系中的重要程度可能会陡然提升。
作者: 剪烛西窗 时间: 2023-4-4 00:27
3、破局与否
上文提到了AI可能会对审美体系的改变,当然也提出了面对AI作品的破局方法:增加主体性,贴合语境,出新,长古。但其实摆在破局面前的还有一个重要问题是:有没有必要破局?
就像潘静如老师所说,AI最多是今之李杜,你自己写诗根本不用去管他。哪怕作品跟AI放一起分不出来又如何?只要达到创作目的就好,兹举一例:
AI- 一别三千里,重来十二年。壮怀空老矣,旧话只依然。
钱谦益 - 一别三千里,相看七十年。明朝数行泪,沾洒各山川。
在我的图灵测试中,钱谦益这首五绝和AI根据首句生成的作品放在一起让人二选一,正确率极度接近50%。鉴于这是二选一的题目,哪怕是随机乱选,正确率也应该是50%,所以我们可以得出结论:大多数人是分不出这两首作品哪首是AI创作的。但是,这又能怎么样呢?钱谦益和相知数十年的老友将要离别,他写这首诗赠给朋友——虽然用语寻常,立意也寻常,比起过往的送别诗没有任何新意,毒舌一点,套用纪昀的评论“此等诗可不必做”——但他已经完全达到了他的写作目的,他的临别不舍的情意借此诗得以抒发,而老友也通过这首诗感受到了这些,这就够了,放在AI作品里分不出来又怎么样?
所以我们也需要思考,非要写出有别于AI的作品是否是有必要的?是否偏离了创作的初衷?是否只需要借AI来审视反思自己是否过分拟古就够了?当然,这个问题没有标准答案。
守卫人类心智的荣耀
在围棋的高地失守之后,诗歌这种独属于人类思想情感的存在还在守卫着人类心智的荣耀,AI暂时可以和一些不出彩的作品比肩,但无论如何也比不上当代高水平的旧体诗人——虽然这并没什么用,但我还是想向当代这些坚持旧体诗创作且有自家面目的诗人致敬。
作者: 剪烛西窗 时间: 2023-4-4 00:28
四、整活倡议 AI同光体会梦到赛博杜甫吗?
(蹭一蹭“仿生人会梦到电子羊吗”)
参见之前的推文,我本人的毕业设计做的就是AI生成旧体诗,且支持不同风格,如艳诗风格或同光风格: 当AI开始学写艳诗——当时月照千寻绮,今日花疑万炬烧。
当AI开始同光式负手
原理基于GPT和BART(不是BERT,没有写错)算法,除了支持特定风格诗作的生成之外,与诗三百最大的不同有三点: 1.诗三百在现代汉语基础上训练,我觉得这样会有白话思维,所以纯用古文做预训练,相当于教一个会说古文的孩子写诗,牺牲了普适性(你输入现代汉语的东西击壤就不能处理),但个人认为提高了语感。 (你这燕国地图怎么那么长啊)其实我写这篇文章的目的,就是想要寻找一些对击壤感兴趣的朋友一起整活,但觉得孤零零发个招募不太好,于是借chatGPT和百度文心谈了谈AI作诗,一不小心写了太多。 AI的旧体诗作品虽然很多时候不着调,但有时候确实还行,感兴趣者可以阅读上文那两篇推文。所以我想找一批对击壤感兴趣的朋友试玩一下,你们从生成的作品中挑一些好的或有趣的发给我,我再水一篇推文(计划通)。
由于没钱租服务器,所以只能拿自己电脑开个临时的网站,感兴趣的朋友可以扫二维码加群,链接会更新在群里(临时网站网址不稳定,会变)。群二维码在下方,如果失效了可以加我微信(sansuizibumie) |
欢迎光临 四季歌文学社区 (http://shijiwenxue.top/) |
Powered by Discuz! X3.1 |