文/郝晓茹
“一名宇航员骑在一匹马上,超现实主义风格”——将这句话的英文原文输入最流行的AI绘画程序,几分钟后,就能得到几张宇航员在太空中骑马的图片。在我们普通人看来,AI生成的图片质量已经达到相当高的水平。
对于技术研究人员来说,人工智能技术这几年的发展是稳步向前的,一步一个脚印。但是对于普通人而言,体会AI技术的进展,主要是靠有冲击力的时刻或事件,比如近十年来最具冲击力的时刻必然是年人工智能围棋程序AlphaGo战胜人类顶尖棋手。而年最具冲击力的时刻,莫过于人们“突然”发现AI绘画生成的部分作品质量之高,似乎已经能够以假乱真了。更重要的是,人们可以自己亲自“操控”AI绘画程序,生成各种自己想要的作品。
为了方便普通人理解,我们可以大致认为AI绘画程序背后的工作原理是这样的:互联网上有无数张图片,大部分图片都带着描述性的说明文字,通过学习人们是怎么给每一张图片配说明文字的,AI绘画程序学会了用文字来反向生成图片。也就是从海量“给图片配的文字”数据中,学会了“给文字配图”。
这句轻描淡写的“无数张图片”实际上却是个新一代AI绘画程序成功的关键。专业人士从超大规模语言模型的发展上了解到,训练数据量的量变会产生质变,经过海量数据训练的模型,可以学到一些“通用的能力”。我们可以认为,AI绘画程序是把有史以来互联网上出现过的数亿张带文字描述的高质量图片作为训练数据(学习资料)进行学习。研究人员发现,AI绘画程序学到的能力包括组合两种不相关的概念,例如骑马的宇航员、创造动物或物体的拟人化版本,例如人形的白萝卜、把文字渲染成图片,例如做广告牌、转换一张已有图片的艺术风格、延伸一张画的原有边界或补画、修改一张画上的元素等等,更多能力仍在陆续解锁中。
仅仅在一年前,最具代表性的AI绘画程序还没有引发如此高的
转载请注明地址:http://www.1xbbk.net/jwbys/4353.html