ChatGPT商业化进程、应用场景、迭代历程及优势分析

ChatGPT商业化进程、应用场景、迭代历程及优势分析

最佳答案 匿名用户编辑于2024/04/09 16:12

AIGC产业生态迎来爆发期。

1.微软追加投资,ChatGPT商业化进程加快

微软近日考虑宣布将向OpenAI进行近百亿美元的投资,此前微软分别于2019年和2021年对OpenAI进行投 资,若此次投资完成微软将拥有OpenAI 49%的股权。微软对单个100GPU的收费是3美元/时,按照 ChatGPT加载模型和文本的速度,生成一个单词的费用约为0.0003美元;而ChatGPT的回复通常至少有 30个单词,因此ChatGPT每回复一次,至少花OpenAI 1美分。微软既能提供钱,又能提供算力。 2023年1月,ChatGPT的活跃用户数或已达1亿,可能是史上增长最快的消费者应用。因访问量过大, OpenAI对ChatGPT进行了大规模限流,包括限制每小时的提问数量,以及高峰时段排队等举措。 OpenAI于2023年2月正式推出ChatGPT Plus版本(率先对美国地区用户开放),收费20美元/月,Plus版 ChatGPT全天可用,无需排队。

2.依托微软生态, ChatGPT不断拓展应用领域

ChatGPT作为文字模态的AIGC发展潜力大,可以与图形模态的AIGC相结合,打造从文字描述到图 片生成的AI辅助工具。 依托微软生态:依托于微软的操作系统、office等产品在全球市场份额的优势地位和强大产品生态, ChatGPT更多应用场景有望快速推进。微软CEO表示,微软正迅速推进OpenAI工具的商业化, ChatGPT等工具将整合进微软旗下产品中,包括且不限于Bing搜索引擎、Office全家桶、Azure云 服务、Teams聊天程序等 。下游应用场景丰富:ChatGPT的下游应用场景包括代码机器人、小说衍生器、对话类搜索引擎、语 音工作助手、对话虚拟人(客服、外呼、营销)等。

星星之火可以燎原,ChatGPT有望进一步打开AIGC海量空间

ChatGPT爆火的背后是AIGC生态的逐渐繁荣,随着数字经济与实体经济融合程度不断加深,以及互联 网平台的数字化场景向元宇宙转型,人类对数字内容总量和丰富程度的整体需求不断提高。AIGC作为 新型的内容生产方式,已经在传媒、电商、影视、娱乐等行业取得重大创新进展。 2022年,AIGC发展速度惊人,迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续入局 ,未来随着国内政策环境的优化,虚拟人、人机交互等场景需求旺盛,有望推动AI技术在金融、政府、 医疗、工业等领域的加速落地。AIGC有望成为数字内容创新发展的新引擎,为数字经济发展注入全新 动能。

3.ChatGPT的诞生:GPT迭代而来的当今最强版本

ChatGPT是由最初的GPT迭代而来:基于文本预训练的GPT-1, GPT-2,GPT-3都是采用的以Transformer为核心结构的模型。2018年发布GPT-1模型,其规模和数据量都比较小。 2019年发布GPT-2模型,使用了更多参数的模型和更多的训练数据 , 且使用zero-shot设定实现仅通过一次预训练的就能完成多种任务 ,减少了下游微调的频率。 2020年发布GPT-3模型,最显著改变的是把模型参数提升到了千亿 级,并在代码编写和数学运算等方面也有上佳表现。 GPT3的缺陷是存在预训练模型的偏见性,由于预训练模型都是通 过海量数据在超大参数量级的模型上训练出来的,其生成的内容无 法被保证,会存在包括种族歧视,暴力血腥等危险内容。因此推动 了InstructGPT和ChatGPT的诞生,即GPT3.5。

InstructGPT是基于GPT3的微调版本:通过激发模型的理解能力 ,可以根据人类反馈进行微调,使语言模型与用户对各种任务的 意图保持一致,使输出内容的真实性提高且危险性降低。 ChatGPT是InstructGPT的兄弟模型, 但在数据收集上提高了对 话类数据的占比,更多地将提示转换为Q&A,因此ChatGPT更 容易结合上下文,其连续对话能力会更好。

4.ChatGPT的特点与优势

InstructGPT和ChatGPT, 即GPT3.5, 采用了GPT-3的网络结构,通过指示学习构建训练样本来训练一个反应预测内容效果 的奖励模型(RM),最后通过这个奖励模型的打分来指导强化学习模型的训练。 训练任务分为3步: 1. 根据采集的SFT数据集对GPT-3进行有监督的微调(Supervised FineTune,SFT):了解如何回答查询。 2. 收集人工标注的对比数据,训练奖励模型(Reword Model,RM):构建用于对查询进行排名的模型。 3. 使用RM作为强化学习的优化目标,利用PPO算法微调SFT模型 : 学习人类的说话方式。

GPT3.5的优势: 效果更加真实:ChatGPT在GPT-3之上进行根 据人类反馈的微调,引入了不同的labeler进行 提示编写和生成结果排序,这使得训练奖励模型 时对更加真实的数据会有更高的奖励。 无害性提升:由于指示微调的引入,使语言模型 与人类意图保持一致,大大降低危害内容生成的 概率。 具有更强的Coding能力:基于GPT-3制作的 API积累了更多的Coding代码,通过Coding相 关的大量数据以及人工标注训练出来的GPT3.5 模型具备更强大的Coding能力。

参考报告

AIGC&ChatGPT发展专题分析报告.pdf

AIGC&ChatGPT发展专题分析报告。AIGC多模态跨模态应用逐渐成熟,市场空间广阔。广义的AIGC指具备生成创造能力的AI技术,即生成式AI。可以基于训练数据和生成算法模型,自主生成创造新的文本、图像、音乐、视频等内容。2022年被称为AIGC元年,未来兼具大模型和多模态模型的AIGC模型有望成为新的技术平台。据《中国AI数字商业产业展望2021-2025》报告,预测AI数字商业内容的市场规模将从2020年的40亿元,增加到2025年的495亿元。ChatGPT产品历经多代技术演进,产品与商业模式逐渐成熟。ChatGPT是文本生成式AI,过去的传统AI偏向于分析能力,主要基于已有...

查看详情
相关报告
我来回答