生成式AI技术的发展现状及态势如何?

生成式AI技术的发展现状及态势如何?

最佳答案 匿名用户编辑于2023/02/06 13:33

我来概括一下生成式 AI技术的发展现状及态势。

生成式 AI 是无监督和半监督的机器学习算法,其从数据中自我学习,并生 成全新的、完全原始的数据,以保持与初始数据的相似性,可输出新的内容(包 括文本、图像、视频和音频等)、合成数据和物理对象模型等。生成式 AI 被认 为是一种衍生的新生产动力,是多领域数字化进程的底层技术,支撑服务知识 工作和创造性工作,如自动编程、内容开发、艺术创作、媒体社交、商务、工 程设计、增强/虚拟现实、数字孪生等,能降低相关边际成本,产生巨大的生产 和经济效益。随着数字经济与传统实体经济不断融合,传统生成手段已经无法 满足数字内容需求,供给侧产能瓶颈凸显。生成式 AI 应用下的合成数据可以用 来解决训练数据不足的问题,如合成数据可以用以开发自动驾驶汽车,使用所 生成的虚拟世界的训练数据集实施行人监测等。

生成式 AI 技术自 1950 年代萌芽,1990 年代至 2010 年代中期从实验性向实 用性演进,并随着深度学习算法及图形处理等技术的不断突破取得了显著的进 步,如 2007 年诞生了第一部完全由人工智能创作的小说 The Road,2012 年微软 推出自动英译中同声传译系统。自 2010 年代中期起,生成式 AI 进入快速发展 阶段,随着生成式对抗网络(GAN)等深度学习算法的提出与迭代,生成内容 的效果越发逼真,如英伟达于 2018 年推出能自动生成高质量图片的 StyleGAN 模型,DeepMind 于 2019 年发布能生成连续视频的 DVD-GAN 模型,OpenAI 于 2021 年发布可实现文本图像交互生成的 DALL-E 模型等。

生生成式 AI 对与所输入数据的相关底层进行抽象化,从而便于模型生成新 的内容。随着深度神经网络技术在大模型、多模态等方面的突破,推动生成式 AI 不断升级,满足生成内容多样性等需求。目前已有的广泛使用的生成式 AI 模型主要有生成对抗网络(GAN)、识别与提取器(Transformers)、变分自编 码器(VAE)等,自回归模型(ARM)以及零/单/少样本学习等也正在推动生 成式建模的优化,同时帮助减少对训练数据的需求,以及快速应用到不同场景 与任务。

例如,无监督学习的生成对抗网络(GAN)通过使用生成器和鉴别器这两 大神经网络之间的互相竞争,创建符合生成目标的内容。其中,生成器负责生 成与源数据相似的人工数据,鉴别器则负责区分源数据和生成数据,以识别更 近似源数据的数据。经多次交替循环训练后,生成器将通过调整参数以创建更 近似的数据,直至鉴别器无法区分真假。又如,识别与提取器(Transformers)是强大的深度神经网络,用于理解文本、图像,是数据训练的关键,如深度学 习语言模型 GPT-3、会话神经语言模型 LaMDA、预训练模型 Wu-Dao(悟道) 等。Transformers 将一个序列转换为另一个序列,是一种半监督学习,其使用大 型未标记数据集,以无监督的方式进行预训练,然后通过监督训练进行微调, 以提高性能,从而模仿人类认知,对输入数据重要性进行测量,用以判断关键 信息。而变分自动编码器(VAE)则是无监督的深度生成模型,由编码器(encoder) 和解码器(decoder)组成,编码器将输入数据进行编码,转为压缩代码,解码 器则从该代码重构原始数据。

生成式 AI 应用建立在大型模型之上,如 GPT-3 或 Stable Diffusion 等,并主 要以插件形式搭建于现有软件生态中。目前的生成式 AI 应用主要是一次性的, 未来随着模型更加智能,模型或将支持迭代,允许进一步修改、调整和优化。

生成式 AI 的优势在于:① 生成的合成数据(Synthetic data)能大幅提高 数据丰富度,增加稀缺数据,使用合成数据可以增加训练的数据量,以提升机 器学习算法性能。合成数据是数据增强的低成本有效工具,也是一种隐私匿名 化的方法。Gartner 预测,到 2024 年用于开发 AI 和分析项目 60%的数据将会是 综合生成的。② 生成式 AI 支持提高人工智能交付的准确性和速度,能加快从 内容生成到产品研发等创造性领域的创新周期,随着易用性的逐步提升,并结 合自动化技术,生成式 AI 将推动数据分析、软件编程等产业革新。③ 围绕生 成式 AI 的生态正在形成。生成式 AI 需要巨大的计算量,云服务、芯片制造等 将从中受益。

生成式 AI 发展的障碍主要包括:① 安全问题和对生成式 AI 技术的负面使 用,例如用于深度伪造、恶意软件、欺诈等,将会减慢其在部分行业的渗透速 度,需要人工智能信任技术的发展予以弥补。② 围绕原创性和版权问题,生成 式 AI 利用大量已有图像等内容数据进行学习,原始内容的创建者是否对生成内 容拥有版权还存在争议。③ 在数据有限的情况下,生成式 AI 模型可能会产生 不准确的内容,以及输出与性别、种族或文化等相关的歧视与偏见。④ 训练生 成模型的高能耗、高成本,或将阻碍企业采用。⑤ 目前而言,生成式 AI 并非 单一解决方案,是结合了多个碎片化、专业化技术及产品的工具组合,易用性 还有待提升。⑥ 利用生成式 AI 生成的结果是否具有可重用性也面临挑战。

 

参考报告

2022全球前沿科技热点.pdf

2022全球前沿科技热点。本项研究综合应用科技情报研究的方法和工具,从定性分析和定量分析的角度,相互印证,相互补充,考察国际前沿科技热点所在,并确保其客观性和时效性。首先,分析世界主要国家或地区在科技研发战略或计划方面的权威文本。在当今世界科技研发领域是存在领头羊效应的,无论从科技研发的投入规模还是最终研发取得的成果来看,欧美日以及部分新兴经济体的科技发展战略都应该得到重点关注。其次,分析主流咨询机构涉及前沿科技的相关报告。资本对于前沿技术研发是非常敏感的,很多有影响力的咨询机构长期关注新兴技术及其商业模式的创新,对于技术的产业化发展前景具有较好的洞察力。

查看详情
相关报告
我来回答