设为首页收藏本站

四季歌文学社区

 找回密码
 立即注册(鼓励中文名字)

QQ登录

只需一步,快速开始

查看: 462|回复: 0
打印 上一主题 下一主题

【转帖】AI同光体会梦到赛博杜甫吗?——AI旧体诗创作漫谈&整活倡议(节选)

[复制链接]
  • TA的每日心情

    2015-5-24 17:27
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    跳转到指定楼层
    楼主
    发表于 2023-4-3 00:14:07 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

    欢迎你来注册,这里有更多的热心朋友期待你的加盟参与。

    您需要 登录 才可以下载或查看,没有帐号?立即注册(鼓励中文名字)

    x
    此文较长而且内有照片,所以我只是节选,供各位参考。



    声明:
    本文为漫谈,并不严谨,因此不引用任何参考文献。全文所谈仅代表作者本人观点,很多是没有证据的猜想,故文中多用“可能”。

    一、chatGPT与百度文心
    最近chatGPT很火爆,作为一个曾经使用过GPT算法的AI研究者,我其实早在chatGPT破圈前就已经体会过它强大的性能了。不过具体到让chatGPT去写旧体诗,它还是力有不逮,见下图:

    图片(略)
    chatGPT在旧体诗生成这个方向如此拉胯的原因在于——它没有对旧体诗生成这个任务进行专门的训练,所以写出来的东西自然就不知所云。openAI作为一家美国公司,不关注中国的旧体诗实属正常。

        不过就在前些时间,对标chatGPT的国产大模型百度文心一言出现了,作为中国企业的产品,当然要会写中国的诗歌,所以李彦宏在发布会上当场让文心写了一首藏头诗——
    图片(略)

        这是妥妥的翻车啊,格律不对,内容无厘头,且蹈袭古人原句。可能是百度的技术人员不懂旧体诗,所以得到了这么一个不如人意的效果。

    二、AI旧体诗的前世今生与将来的发展
        在尝试过国内国外两个大语言模型去生成旧体诗后,我个人认为,chatGPT和百度文心一言并没有太好的AI旧体诗生成功能。目前公开的,能代表AI旧体诗生成的,应该还是九歌和诗三百。

        先来讲讲我印象中的AI旧体诗生成的发展脉络:

    • 第一个闻名于众的生成旧体诗词的程序是稻香老农的作诗机,苏无名在2006年左右发表的《网络诗词点将录》中,点稻香老农为金枪手徐宁,将此作诗机类比为钩镰枪这种破敌兵马的神器,并且又说“老农诗词,亦有过人处”。可见稻香老农是在自身有浓厚的旧体诗创作基础上,才开发出的这个程序。但遗憾的是,由于年代久远,我并不能分析出稻香老农的作诗机是否用了AI技术。然而AI技术大火要到2012年之后,所以稻香老农的作诗机可能并没有使用AI的算法。



    • 第一个使用AI领域的深度学习技术来生成旧体诗词并且大火的,当属
      清华大学自然语言处理与社会人文计算实验室开发的“九歌”,我当时看到了九歌网站,惊为天人,遂放弃了转专业的念头,从古代文学跳进了AI的深坑。不过现在看来,九歌当年的作品还比较稚嫩。毕竟17年的时候还没有预训练模型,而且九歌的数据集也只有三十来万首诗词。(略)
      • 目前公开的,影响最大且效果最好的旧体诗生成程序当属诗三百,开发者疑为一位浙大的计算机博士,从它最近推出的“唐宋风格”来看,开发者应该不太懂旧体诗,否则不会没听说过绵延数百年的唐宋之争,导致把唐诗和宋诗混作一种风格。(略)

      • 由于时间较晚,诗三百相比九歌后出转精,2018年后,大规模预训练模型已经铺开,自然语言处理领域的任务可以通过使用预训练模型而获得性能上的较大提升。诗三百使用了哈工大开源的现代汉语语言模型,又使用了更丰富的数据集(八十余万首诗词),获得了比九歌更好的效果。

            这里稍微提一嘴大规模预训练模型为啥能提升性能。我打个比方,九歌在2017年的未使用预训练语言模型的算法,相当于是给一个不会说话的孩子塞了三十万首诗词,希冀他可以照葫芦画瓢写出几首来。而诗三百用了哈工大训练好的现代汉语预训练模型,就相当于是给一个已经会说现代汉语的孩子塞了八十万首诗词让他学习。两者相较,自然是后者更胜一筹。而由于诗三百的底子是现代汉语模型,所以还会有一些有趣的效果,比如说你让它以“召开”等关键词写诗,它能写出标准的老干体。(略)
        • chatGPT的强大性能使一部分人觉得诗歌会成为下一个被AI攻破的领域,就像之前的围棋一样。但是我个人持有不同的看法,现有的基于深度学习的AI,背后都是在计算概率——换言之,AI暂时不知道哪句诗好,它只是根据数据库里的作品,写出最可能,最符合概率的句子来。所以AI生成的作品的期望是最符合概率的作品而非最好的作品。当然了,根据无限猴子原理(给猴子一个键盘乱敲无数次,总有一天它会敲出来一部莎士比亚全集),AI生成的作品中会有好诗,但是这种情况就像诗云中的穷举一样没什么意义。




            目前的AI旧体诗创作,我猜测已经到了一个瓶颈,现有的技术最多通过丰富数据或增加技法规则来提升些许作品质量,无法再带来质的提升。chatGPT和GPT4,基本的原理其实和2018年没什么变化,不同的是算力提升了很多,所以效果好得多。但是提升算力这条路已经快到极限了,不可能一直走下去的,在这点上,杨乐坤大佬(因深度学习领域的贡献而拿到图灵奖的深度学习三巨头)认为chatGPT走错了路。

            在现有的弱AI的情况下,AI超越人类高水平诗人是个可望而不可即的目标。除非将来AI算法取得巨大突破,强人工智能成为现实,AI真正具有了思想和人格(或者能虚拟出思想和人格)。但这一天目前还遥遥无期,这点我认同程羽黑兄的看法:“换言之,写诗的能力附属于强人工智能,没有必要花费太大的代价单独开发。在强人工智能出现前一味关注这一能力,恐怕有事倍功半甚至无解的风险。”


            担心AI快速进步吊打人类诗人的朋友们可以放心了。(这只是我的看法,将来可能被打脸)
      • ——待续



    分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    收藏收藏 转播转播 分享分享 分享淘帖 支持支持 反对反对
    回复

    使用道具 举报

    本版积分规则

    QQ|Archiver|手机版|小黑屋|四季歌文学社区 ( 京ICP备14012862号-2  

    GMT+8, 2024-11-21 19:30 , Processed in 0.206433 second(s), 24 queries .

    Powered by Discuz! X3.1

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表