2023年Web3.0系列专题研究 人工智能生成内容市场机会

  • 来源:国海证券
  • 发布时间:2023/01/11
  • 浏览次数:700
  • 举报
相关深度报告REPORTS

Web3.0系列专题研究:AIGC,内容生产力的革命.pdf

Web3.0系列专题研究:AIGC,内容生产力的革命。一.人工智能生成内容:技术进步+海量需求,驱动AIGC快速发展;二.人工智能文本生成:大数据+大算法+大算力,交互&个性化生成技术前景广阔;三.人工智能生成内容市场机会:中国AIGC如日方升,建议关注垂直赛道初创公司及下游AI应用场景;三.人工智能生成内容市场机会:中国AIGC如日方升,建议关注垂直赛道初创公司及下游AI应用场景。

核心观点:

AI核心技术包括集成AI、通用人工智能、知识图谱、合成数据、自动驾驶及AIGC等;其中,AIGC技术场景包括文本生成、音频生成、图像生 成、视频生成等;Chatbot为AI文字生成中应用较为广泛的领域。 2022年11月底,OpenAI上线智能对话系统ChatGPT,引爆全球。ChatGPT作为高效的AIGC文字内容生产工具,被认为将在智能客服、虚拟 人、游戏等领域得到更大落地应用,也对很多算力、数据标注、自然语言处理等底层技术公司利好。正如OpenAI的CEO Sam Altman在推特 上写道: “Trust the exponential. Flat looking backwards, vertical looking forwards.” ChatGPT或许正让我们处在某个起飞的点上

如同蒸汽时代的蒸汽机、电气时代的发电机、信息时代的计算机和互联网,人工智能正成为推动人类进入智能时代的决定性力量。全球产业界充分认识到人工智能技术引领新 一轮产业变革的重大意义,纷纷转型发展,抢滩布局人工智能创新生态。人工智能细分赛道持续创新下变革在即,本报告重点关注AIGC领域。

AIGC颠覆传统内容产出模式,或为web3.0内容创造新引擎。AIGC本质上是一种AI赋能技术,能够通过其高通量、低门槛、高自由度的生成能力广泛服务于各类内容的相 关场景及生产者。随着人工智能生成能力的突破进展,内容生产已经从专业生成内容(PGC)、用户生成内容(UGC),进入到人工智能生成内容(AIGC,AI generated content)时代, AIGC被认为是web3.0的重要基础设施。AIGC的快速兴起源于深度学习技术的快速突破和日益增长的数字内容供给需求;应用价值层面,AIGC有望成为 数字内容创新发展新引擎,为数字经济发展注入新能量。数据+算法+算力三大核心要素,决定AIGC产出质量。①数据,海量优质的应用场景数据是训练算法精确性关键 基础。

②算法,神经网络、深度学习等算法是挖掘数据智能的有效方法。与传统机器深度机器学习算法不同,神经网络在学习范式+网络结构上的迭代提升了AI算法的学习 能力,未来多模态大模型或为核心趋势,赋能产业空间及实践潜力。③算力,计算机、芯片等载体为AIGC提供基本的计算能力。 AIGC技术场景中,个性化及自动化内容产出为核心价值。

1.人工智能生成内容

1.1.AIGC发展:需求+技术迭代促发展,从降本增效走向额外价值转移

①驱动因素:AIGC的兴起 源自深度学习技术的快速突 破和日益增长的数字内容供 给需求,市场潜力逐渐显现。 一方面,技术进步驱动 AIGC可用性不断增强; 另一方面,大量需求牵引 AIGC应用落地。 ②发展预判:AIGC在中国 发展可分为三个阶段。助手阶段(摸索磨合期, 2021年~2026年): AIGC辅助人类进行生产, 优先变现的关键在于编辑 优化功能,行业创新关键 能力为模块分拆+个性化 推荐; 协作阶段(推广应用期, 2026年~2028年):人机 共创,主要价值为降本增 效及提供创意,预计互联 网大厂将普遍布局,竞争 热度提升; 原创阶段(价值增长期, 2028年之后):AIGC将 独立完成内容创作,产生 附加价值。

1.2.AIGC技术场景:个性&自动化为核心壁垒,关注渠道把控及商业路径

内容领域:是目前已经能够、但并未有效实现商业化的领 域,其中的存量价值来源于同类内容的降本增效,而增量 价值则来源于跨模态的内容生成以及AI本身带来的科技感。 对内容渠道的把控将成为核心竞争力,发行商、内容最终 消费渠道具有强的产业链话语权。另AIGC变革对内容行 业原有人才结构影响较大: 2B,在PGC领域实现内容创作工业化,加快专业内容的 生产效率,提高PGC内容生产的活跃度。2C,在UGC领域中实现低门槛灵感转化,扩大UGC可 覆盖的领域和潜在人群。延展领域:由于对AI生成的自由度和稳定性有更高的技术 要求,本质为依托人工智能,个性化数字内容的自动化构 建。

2.人工智能文本生成

2.1.AI文本生成:底层架构不断精进,交互+个性化生成技术前景广阔

本质是借助超大规模的训练参数猜测上下文的过程。通过随机Mask(即遮挡)数据库文本中 的词语或语段,让神经网络自主学习复原被遮挡部分,从而拥有“猜测”缺失内容的能力, 产出预训练模型。 再通过大规模预训练模型理解上文或给定条件,从概率层面推测最符合要求的输出结果。 通过词嵌入(Word Embedding)将字、词、句进行区分,然后基于特征评分、序列标注、分类 模型等提取内容特征计算相关文本单元权重; 其次选择相应的文本单元子集组成摘要候选集,完成内容选择;最后是针对字数要求等限定 条件,对候选集的内容进行整理形成最终摘要,完成内容组织。

主流思路是分离文本属性及文本内容。隐式方法即使用某类无监督学习学习或强化学习模式 将文本属性及内容自动分离,常见的有生成对抗方式,即通过GAN实现目标属性和文本属性 完全由不同的编码控制的状态。显式方法首先寻找并删除代表文风的短语,其次检索与目标 文风最匹配的相似短语,最后生成目标语句并保证语句通顺、原意不变。对话式文本生成可分类为管道模式及端对端模式;文本生成普遍具有上下文间逻辑问题、关 键信息位置混淆、内容无中生有等问题。结构性的文本生成首先通过注意力机制、多层感知 器等系统进行语句内容预选,对数值、时间等类型数据进行推理,增强数据间的结构信息; 其次通过Transformer等模式结合上下文进行推导,控制句法及文本连贯性,将语义与句法统 一分析,最后采用Seq2Seq等模式,以BiLSTM为基础构建文本生成器,生成最终文本。

2.2.对话式AI技术:智能语音+NLP+知识工程底层技术变革下的新机遇

知识图谱:深化事务规则联系,建立结构化知识库。基于知识库内容间存在关联,或为上下位关系、约束关 系、递进关系等,由此在知识库的概念下引入知识图谱 技术。 基于自然语言理解对文字内容在语义上进行初步认知和 自动抓取,经由知识图谱对概念间的关系属性进行联结、 转换,进行知识融合与知识加工形成行业知识图谱。 分类:①通用知识图谱注重横向广度,知识积累和问答 应用相对通识广泛;②垂直行业知识图谱注重纵向深度, 考虑到不同的应用场景与业务背景,通常需要以大量一 线行业数据去“喂养”对话机器人,实现基础词库储备, 并对垂直行业知识图谱进行持续深化。

2.3.ChatGPT:仍需调优及训练,进而实现商业化落地

ChatGPT 有时会写出看似合理但错误或荒谬的回答。解决 这个问题具有挑战性,因为: 在RL训练期间,没有正确答案(训练数据的缺乏和训 练数据的偏差会对模型结果产生负面影响); 训练模型过于谨慎导致它拒绝回答问题;训练会误导模型,因为理想的答案取决于模型知道什 么,而不是人类演示者知道什么。

调整问题措辞,可能会获得不同的答案。例如,给定一个问 题的措辞,模型回复不知道答案,但只要改写问题措辞,模 型就可以正确回答。回复过于冗长。这些问题源于训练数据的偏差,因为训练师 (标注人员)更喜欢看起来更全面的更长的答案。无法完全拒绝不合理及不道德的请求。OpenAI已将机器人编 程为拒绝“不适当的请求”,包括诸如为非法活动生成指令 之类的禁忌。但是用户已经找到了绕过这些护栏的方法,包 括将非法指令请求改写为假设性思维实验,要求它编写戏剧 场景或指示机器人禁用其自身的安全功能。

3.人工智能生成内容市场机会

3.1.商业路径:中国企业底层技术发展不足,变现聚焦产出内容及软件服务

中国AIGC企业仍处摸索阶段,独立运行公司数量较少。在中国,由于技术发展不足以及投资环境的影响,AIGC大多被作为 公司的部分业务、乃至相对边缘化的功能进行研发,独立运行的初 创公司数量明显少于国外,大部分细分赛道的初创玩家在5家以下。TTS等较为成熟的AIGC能力大多被综合性的AI公司打包提供,在应 用场景上缺乏明确的指向性。 底层技术及产业应用侧差距,导致中国企业仍停留在内容领 域开发。在中国,布局最多的赛道是AI写作和语音合成领域,虚拟人赛道刚 刚开始兴起,基本均停留在内容领域。而在国外延展领域得到了更 为充分的挖掘,例如个性化文本生成、合成数据等赛道均是重点布 局领域。技术部分导致了这一原因,更大的原因在于此类业务拓展的综合性 要求较高,需要客户方的数字化程度以及对应行业的充分了解,预 计国内外在这两个赛道上存在差距。

中国AIGC企业商业化模式暂未明朗,部分企业仍处引流期 。我国的AIGC行业尚未建立起明确的变现方式。以写作机器人、自动 配音等场景为例,大部分产品仍处在免费试用的“流量吸引+平台改 良”阶段,收费空间相对较小。此外,据量子位智库披露,由于服务B端客户时话语权较弱,部分企 业会考虑向2B+2C领域,乃至直接2C领域延展。但作为工具,能否 在互联网流量相对稳定的前提下有效接触C端用户,设计好产品转化 路径,依旧是一项挑战。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告
评论
  • 相关文档
  • 相关文章
  • 全部热门
  • 本年热门
  • 本季热门
  • 全部热门
  • 本年热门
  • 本季热门
  • 最新文档
  • 最新精读
分享至