“凡是过去,皆为序章。” 莎翁遗作《暴风雨》的这句名言断定,我们可以将已然发生的事视作后续之事的先兆。
这一想法可以说是相当悲观的:难道我们注定会重蹈覆辙,直到我们改正为止么?当然,不管是在工作、人际关系、财务、健康还是其他领域,人若要成长,的确是需要一而再、再而三地从生活中汲取教训。
放眼望去,同样的现象也存在于更宏观的层面——人类集体历史之中。我们乐于认为,作为一个物种,人类整体上是在不断进步的,可对那些曾经祸害过我们祖先的冲突与不公,我们却连消灭它们的边儿都没靠上。
我们再把目光收回来(并且放轻松)一点,关注一下近期的未来,比如,在未来一整年里将会发生些什么,又有哪些信息我们可以用来做出一些有依据的推测?
美国《经济学人》编辑组采用一种独特的方式回答了上述问题。在《经济学人》展望2020的专栏中,他们对政治、经济的未来形势以及人工智能等技术的后续发展进行了预测,而在这些预测中最突出的,当属向人工智能征询预测意见。人工智能给出的答案既耐人寻味,又有一点点不可思议。
先读后写的人工智能
几乎就是在一年之前,非盈利组织“开放智能”发布声明称,他们建成了名为GPT-2的神经网络以用于自然语言处理。这一声明引发了争议,因为其中的警告部分说该工具可能会被滥用,所以不会立即向公众发布。在随后几个月中,该工具才被逐步发布出来。
GPT-2的开发者在训练神经网络时提高了质量标准:他们不是拿低质量的文本胡乱地塞给GPT-2,而是拿红迪网上获得超过三个赞的文章来训练它。
训练用的数据库由四万兆字节(40GB)的文本组成。对于纯文本而言,1GB的文本相当于90万页ASCII编码页面,或者是13万页双行距的微软Word文件页面。
GPT-2当然是无法理解它所生成的文本的,它利用语言模式和词语序列来总结出字词短语之间的统计学联系,并建立自己的参考指南(这可不像人类学习一门外语时需要掌握的语法规则和词汇)。随后,它用这本参考指南来回答问题,或者是预测特定词语序列后可能会出现的文字。
GPT-2的开发者还注意到,当用针对范围更窄的运用场景所选取的特定数据库来训练模型时,它所生成的回复更具说服力。
稍加润色
尽管在《经济学人》那篇对GPT-2预测进行详细报道的文章中用了“未经修改”来形容模型所产生的文字,但这并不完全准确。在Medium平台上的一篇博客里,副编辑汤姆 • 斯坦吉奇(Tom Standage)对他用的方法进行了描述,而他的方法是含有一定程度上的调整的。
斯坦吉奇先是写了一段介绍,紧接着就是开场白提问:“你好,GTP-2,你之前接受过采访吗?”他设定GTP-2对每一个后续问题都生成五个回答,然后选择一个最佳答案,并删除GPT-2提出的任何问题(尽管这些问题也是GPT-2回答的一部分)。
人工智能眼中的世界与自己
斯坦吉奇所提出的问题上至政治与经济(唐纳德 • 特朗普连任、中美贸易战),下至科技(人工智能的未来、由科技引发的失业问题、技术滥用),下文是他与GPT-2问答的部分摘录:
问:由人工智能生成的假新闻是否会成为民主的威胁?我们会不会看到这一手段被用在2020美国总统选举当中?
答:会的,我们很可能会看到,这只是时间问题。假新闻通常是由政治竞选团队制造出来的,并且具有对选举结果产生巨大影响的潜力。这主要是因为他们传播假消息,而这些假消息常常没有事实依据。
问:你如何看待2020年的经济前景?
答:我认为非常不明了。英国经济前途未卜,不过美国经济非常强有力。我想世界经济会有很多波动。
尽管GPT-2的部分回答显得很有见地(当问及人工智能的未来时,GPT-2建议我们应该将科技视为工具,然后“尽可能努力发展科技,而不是去担心科技会伤害我们和毁了我们的生活”),但大部分回答非常模棱两可,比如,有个答案提到“中国将会有剧烈变化”,指的是政治变化、社会变化、经济变化还是上述全部呢?
尽管人工智能的回答里没有特别具有启发性或者新颖性的内容,人工智能可以对每个问题就正确的回答进行阐述并且行文连贯,已经很让人印象深刻了。
GPT-2称自己——人工智能——为2020年最重要的颠覆性技术,这也就是说,作为汇集了百万已发布文章所生成的成果,如果GPT-2认为人工智能远比基因编辑或量子计算更重要,那么它可能是对的。或者也可能是因为人工智能正处于炒作的巅峰时期,因此关于人工智能的文章要比关于其他技术的文章更多。
同样有趣的还包括,当问及唐纳德 • 特朗普是否会连任时,GPT-2回答说:“我想他不会连任了,我认为他会在普选中落选。” 如果有更深入的见地也许会更好,不过,我们也接受这个答案。
对预测进行预测
由于人工智能可以比我们更快地读取以及合成海量数据集,人们已经用它来对各式各样的事物进行预测,上至病毒爆发,下至犯罪活动。但让人工智能基于(红迪网过滤后的)过去思考未来就挺新鲜了,仔细想想,还真是一个令人着迷的项目。
随着GPT-2和与它相似的人工智能不断发展,我们极有可能看到它们对未来做出更多并且更精准的预测。同时,让我们期待一下训练这些人工智能模型所用的新数据——本周、本月、本年度发生的新闻——能够为已存在的乐观精神添砖加瓦。
当问及对读者是否有什么建议时,GPT-2回答说,“实际上,你现在看来是不可能的大项目,在不久的将来会变成可能。”
资料来源singularityhub.com
_____________
本文作者瓦内萨 • 拉米雷斯(Vanessa Bates Ramirez)是singularityhub 网站的资深编辑,对可再生能源、医药健康、国际发展以及其他众多话题感兴趣。如果她不是在阅读或写作,那么你通常能在户外、水下或者飞机上找到她。