1.3 裹挟其中的AIGC
AIGC的发展可以分为四个阶段,如图1-10所示。
图1-10 AIGC发展阶段
1.3.1 早期萌芽阶段(1950—1990年)
受技术所限,AIGC局限于小范围实验。1957年,莱杰伦·希勒(Leiaren Hiller)和伦纳德·艾萨克森(Leonard Isaacson)通过将计算机程序中的控制变量换成音符得到了历史上第一支由计算机创作的音乐作品——弦乐四重奏《依利亚克组曲》(Illiac Suite)。1966年,世界第一款人机对话的机器人“伊莉莎(Eliza)”问世,其可在关键字扫描和重组的基础上进行人机交互。20世纪80年代中期,IBM基于隐型马尔科夫链模型(Hidden Markov Model,HMM)创造了语音控制打字机“坦戈拉(Tangora)”,能够处理约20000个单词。然而在20世纪末期,由于高昂的研发和系统成本以及难以落地的商业变现模式,各国政府减少了对人工智能领域的投入,AIGC发展暂时停滞。
1.3.2 沉淀积累阶段(1990—2010年)
AIGC实用性增强,开启商业化探索。2006年,深度学习算法取得重大突破,且同期图形处理器(Graphics Processing Unit,GPU)、张量处理器(Tensor Processing Unit,TPU)等算力设备性能不断提升。互联网数据层面的发展引发数据规模快速膨胀,成为AIGC发展的算法训练基础,AIGC发展取得显著进步。但算法仍然面临瓶颈,创作任务的完成质量限制了AIGC的应用,内容产出效果仍待提升。2007年,纽约大学人工智能研究员罗斯·古德温装配的人工智能系统通过对公路旅行中见闻的记录和感知,撰写出世界第一部完全由人工智能创作的小说1 The Road,但其仍存在整体可读性不强的劣势,存在拼写错误、辞藻空洞、缺乏逻辑等问题。微软2012年公开展示的全自动同声传译系统,基于深层神经网络(Deep Neural Network,DNN)可自动将英文演讲者的语音内容通过语音识别、语言翻译、语音合成等技术生成中文语音。
1.3.3 快速发展阶段(2010—2021年)
2014年以来,以生成式对抗网络(Generative Adversarial Network,GAN)为代表的深度学习算法被提出和迭代更新,AIGC进入生成内容多样化的时代,且产出的内容效果逼真到难以分辨。2017年,世界首部完全由AI创作的诗集《阳光失了玻璃窗》由微软的人工智能少女“小冰”创造。2018年,英伟达发布了可以自动生成图片的StyleGAN模型,截至2022年年末,其已升级到第四代StyleGAN-XL,可生成人眼难以分辨真假的高分辨率图片。2019年,DeepMind发布了可生成连续视频的DVD-GAN模型。2021年,OpenAI推出了DALL-E,并于2022年将其升级为DALL-E2,该产品主要生成文本与图像的交互内容,可根据用户输入的简短描述性文字,得到极高质量的卡通、写实、抽象等风格的图像绘画作品。
1.3.4 爆发与破圈阶段(2022年至今)
2022年以来,AIGC产品密集发布如图1-11所示,ChatGPT爆火出圈。谷歌于2022年五月推出了文本图像生成模型lmagen,同年8月,开源AI绘画工具StableDiffusion发布;2022年9月,Meta推出可利用文字生成视频的产品Make-A-Video以推动其视频生态的发展。2022年11月30日,OpenAl推出AI聊天机器人ChatGPT,AIGC的内容产出能力迅速吸引大批用户,至2022年12月5日,根据OpenAI创始人表示,ChatGPT用户数已突破100万。2023年2月,微软宣布推出由ChatGPT支持的新版本Bing搜索引擎和Edge浏览器,AIGC与传统工具进入深度融合历程。
根据学界主流观点,人工智能可分为弱人工智能、强人工智能、超人工智能三个阶段。弱人工智能也称为限制领域人工智能或应用型人工智能,本质上是在某个特定领域内基于统计规律的大数据处理者。通俗来讲,弱人工智能只专注于完成某个特定的任务,例如语音识别、图像识别和翻译,是擅长单个方面的人工智能,类似高级仿生学。该阶段的AI技术是为了解决特定具体类任务问题而存在,底层原理是从海量数据中归纳出模型,再泛化至新的数据中进行正向运算。
图1-11 迅速问世的部分AIGC产品
例如,谷歌的AlphaGo和AlphaGo Zero就是典型“弱人工智能”,尽管它们能够战胜人类顶尖棋手,如图1-12所示。
图1-12 AlphaGo与李世石
强人工智能是人类级别的人工智能,拥有独立思想和意识,在各方面均能与人类媲美。拥有AGI的机器不仅是一种工具,其本身可拥有“思维”,能够进行独立的思考、计划、解决问题、拥有抽象思维、理解复杂理念、快速学习等,可实现“全面仿人性”,在智力水平和行动能力方面与人类基本没有差别,目前只存在于电影及人类想象中,如图1-13所示。
图1-13 电影《机械姬》
超人工智能:假设计算机程序通过不断发展,智力水平可以超越人类,则由此产生的人工智能系统就可以被称为超人工智能。在人工智能的三个层级中,超人工智能的定义最为模糊,目前还没有精准预测能够说明超越人类最高水平的智慧到底会表现为何种能力。对于超人工智能,目前只能从哲学或科幻的角度加以想象。
显而易见,以ChatGPT、Midjourney为代表的新一代人工智能,即将叩开通用人工智能和AIGC时代的大门。本书后续内容将重点介绍上述技术的细节及应用场景。