日前,Gartner发布了2022年重要战略技术趋势。其中,生成式人工智能(Generative Artificial Intelligence)位列12项重要战略之首。同时Gartner预计,到2025年,生成式人工智能将占所有生成数据的10%,而目前这一比例还不到1%。
而在2020年Gartner发布《人工智能技术成熟度曲线报告2020(Hype Cycle for Artificial Intelligence,2020)》时,生成式人工智能作为新增技术热点才首次被提出。
此外,在今年《Hype Cycle for Artificial Intelligence,2021》报告中,生成式人工智能同样位列其中。
以上种种迹象表明,生成式AI已经成为未来举足轻重的技术趋势。那么,生成式AI究竟是什么?生成式AI又能给智能时代带来什么?
Vol.1
生成式AI——训练后的再创造
对于生成式AI,Gartner这样定义:通过各种机器学习(ML)方法从数据中学习工件的组件(要素),进而生成全新的、完全原创的、真实的工件(一个产品或物品或任务),这些工件与训练数据保持相似,而不是复制。
简单理解,生成式AI就是利用现有文本、音频文件或图像创建新内容的技术。使用生成 AI,计算机检测与输入相关的基本模式并生成类似内容。
Vol.2
GANs——生成式AI的核心技术
生成式对抗网络(GANs, Generative Adversarial Networks ),是生成式AI的关键技术。其本质是一种深度学习模型,是近年来复杂分布上无监督学习最具前景的方法之一。
在原理上,生成式对抗网络使用两个神经网络相互对立,一个生成器和一个判别器。生成器或生成网络,负责生成类似于源数据的新数据或内容,判别器或判别网络则负责区分源数据和生成数据。经过交替周期训练,生成器不断学习生成更逼真的数据,判别器则更善于区分假数据和真实数据。可以把GANs想象成一个造假者和一个在猫捉老鼠游戏中的警察,造假者正在学习传递假币,而警察正在学习检测假币。渐渐地,双方在对抗中都不断完善。
Vol.3
AI生“万物”——生成式AI商业应用
当下,生成式AI已在研究和商业的多种场景得到应用,如创建软件代码、促进药物研发和有针对性的营销等。具体而言:
生成图形:AI可以从艺术品中抽象视觉图案,然后将这些图案应用到具有该艺术品特征的虚拟图像再现中。这些算法还可以将任何粗糙的涂鸦转换为令人印象深刻的绘图,令其似乎是由描绘真实世界的专业人类艺术家创作的。
生成照片:生成式AI可以通过生成并叠加到原始任何缺失、模糊或误导性的视觉元素上来自动更正照片,还可以将任何低分辨率原始图像转换为高分辨率版本,也可以通过混合现有的肖像或从任何特定的肖像中抽象特征来产生自然的外观,或者从语义标签中生成逼真的图像。
生成音频:生成式AI可以将任何计算机生成的声音渲染成一个真正听起来像是在人类声带中自然产生的声音,也可以将文本翻译成语音、可以组成音乐。同样,生成式AI也可以生成视频、文本、字幕等。
生成材料:生成式AI甚至可以通过3D打印、CRISPR和其他技术从零开始呈现假肢、有机分子和其他物品。
Vol.4
迪斯尼、Netflix、影谱科技等率先发力
那么,如今哪些公司在发力生成式AI呢。通过其能生成音视频、字幕等很容易联想到,传媒娱乐公司一定在使用。
的确,包括迪士尼、Netflix等娱乐传媒巨头均在尝试用生成式AI代替标准内容制作。例如迪士尼借助生成式AI生成动画,只需通过文本描述某些活动,而不是注释数据和大量训练就能创建动画、电影剧本视频。
Netflix会借助生成式AI抽取符合观影习惯和需求的画面,然后把这些图片制作成内容封面,以降低内容搜寻难度,提升视频制作效率。
去年9月上市的Unity是3D生成型AI的推动者。全球有超过一半的移动、PC 和主机游戏采用了其生成引擎来制作,其3D-AI技术也广泛应用于工业设计的3D模型搭建,VR/AR设备内容创作以及影视特效制作。
此外,一家名为Insilico Medicine(英科智能)的AI药物研发公司也是生成式AI的应用者。作为一家抗衰老及癌症治疗药物研发商,Insilico Medicine依托基因组学、医疗大数据及AI技术等技术手段,专注于癌症治疗、抗衰老药物的研发、生产及销售。同时该公司也是全球第一家应用GANs,2015年在全球范围内率先利用生成对抗网络(GANs)和强化学习(RL)技术,生成具有特定性质的药物分子结构。
不止国外,国内的影谱科技在2018年底便发布AGC智能影像生产引擎,这也是国内最早一批借助生成式AI开发的技术框架。
影谱科技的智能影像生成引擎MAGC已率先应用在传媒娱乐领域,被知名电视台、电信运营商、短视频平台广泛采纳。除此之外,MAGC还广泛应用于数字人的3D成像,影视特效制作及数字孪生、虚拟主播、虚拟课堂等数字产权场景。
在文娱领域,影谱科技打造的智能文娱解决方案可以帮助产业推动视频自动化生产,提高内容生产效率,在视频帧审校、视频过滤、内容推荐到视频审核、视频深度预测、流媒体视频及短视频内容生产、故事可视化等产业环节应用。
在传媒领域,影谱科技推出的智慧传媒平台服务,从内容创建到分发,形成以元数据为基本单位的一站式智能影像技术服务,提供包括批量化创建智能影像、视频资产管理与分析、智能影像运营、再到智能视频商业化的全过程。
基于影谱科技智能影像技术的AI方案,可在处理新闻、体育赛事等内容发挥作用。例如,实时自动绘制虚拟越位线,包括徽标,识别名人,提取字幕、人物图像等。