2023年 ChatGPT专题报告 OpenAI倾力打造ChatGPT,获得微软有力加持
- 来源:中信证券
- 发布时间:2023/03/13
- 浏览次数:981
- 举报
1. ChatGPT通过大模型突破AI瓶颈,GPT-4多模态应用带动商业化加速
概述:ChatGPT为NLP下的AI大模型,性能和使用体验超预期
ChatGPT是自然语言处理(NLP)下的AI大模型,通过大算力、大规模训练数据突破AI瓶颈。2022年11月,OpenAI推 出ChatGPT,ChatGPT基于GPT-3.5,使用人类反馈强化学习技术,将人类偏好作为奖励信号并微调模型,实现有逻辑 的对话能力。
ChatGPT本质上是通过超大的统计语言模型,对词语序列的概率分布进行建模,利用上下文信息预测后续词语出现的概 率分布,其表现的超预期反映了在算力水平提升的情况下大语言模型技术路线的成功,通过对大规模的未标注的文本数据 进行训练,突破了AI发展的技术瓶颈。根据《瞭望》新闻周刊报道,OpenAI为了让ChatGPT的语言合成结果更自然流 畅,使用了45TB的数据、近1万亿个单词来训练模型,训练一次的成本高达千万美元,一个月的运营成本需要数百万美元。
概述:OpenAI倾力打造ChatGPT,获得微软有力加持
ChatGPT出自美国AI创业公司OpenAI,是AI大模型领域的领军者。OpenAI在2015年由Sam Altman、Peter Thiel、Reid Hoffman、Elon Musk等人创办。公司成立之初,即确定了包括制造“通用”机器人和使用自然语言的聊天机器人的发展 目标。2019年,OpenAI获得来自微软的10亿美元投资,为Azure云端平台服务开发AI技术。2018年起,OpenAI开始发布 GPT(Generative Pre-trained Transformer)模型,2020年发布GPT-3,可以完成答题、写论文、代码生成等任务,被视 为人工智能竞赛的里程碑事件,并直至ChatGPT的推出引起AI的热潮。
除了NLP领域,OpenAI还在多模态领域取得成就,包括发布了AI图像生成器DALL-E2,对音频转录编辑器Descript、AI笔 记应用Mem等进行投资。
演变:GPT-1—无监督预训练+有监督微调
GPT-1发布于2018年6月,参数量达1.17亿,预训练数据量约5GB。GPT-1包含预训练和微调两个阶段,考虑到自然语言 处理任务中有标签的语料少,GPT-1先在大量的无标签数据上训练语言模型,然后在下游具体任务(如分类、常识推理、 自然语言推理等)的有标签数据集上进行微调。1)在无监督训练中,GPT-1采用Transformer的架构,即标准的语言模型 的目标函数,通过前面的词预测后面的词;2)在有监督训练中,采用标准的分类目标函数,仅需对第一阶段预训练的语 言模型做出很小的结构改变,即可应用于各种下游任务。
GPT-1使用了BooksCorpus数据集来训练语言模型,其中有7000余本未出版的书籍。具体表现上,在有监督学习的12项 任务中,GPT-1在其中9项上的表现优于专门训练的受监督模型。
演变:GPT-2—无监督预训练+多任务学习
GPT-2发布于2019年2月,参数量达15亿,预训练数据量约40GB。GPT-1使用的概率条件模型为p(output|input),GPT-2 使用相同的无监督模型学习多个任务,将概率条件模型修改为p(output|input, task) ,期望模型对不同任务的相同输入产 生不同的输出。此外,GPT-2采取Zero-shot设定,不需要下游任务的标注信息,而是根据给定的指令理解任务。因此 GPT-2的核心思想在于多任务学习。
GPT-2训练的数据集来自社交新闻平台Reddit,共有约800万篇文章,体积超40GB。具体表现上,在8个语言模型任务 中,仅通过Zero-Shot学习,GPT-2在其中7个上领先。GPT-2表明,随着模型容量和数据量增大,GPT模型的潜力仍有望 进一步显现。
展望:GPT-4—此前外界预期参数量变化不大、使用门槛有望降低
GPT-4备受业界期待,训练成本控制有望带动商业潜力的极大增强。ChatGPT的突出表现使得外界对GPT-4十分期待, 自2021年以来便有报道称GPT-4“即将推出” ,OpenAI公司CEO Sam Altman今年受StrictlyVC采访时表示GPT-4将在 “有信心可以安全且负责任地运行时”推出。外界此前也曾预期,GPT-4的推出或分阶段进行,例如GPT-3也是先开放给 合作伙伴、付费用户和学术机构,才在2022年底开放给公众。
在参数量上,针对有传言称GPT-4参数量将达到百万亿,OpenAI公司CEO Sam Altman予以否定。此外,AI专家Alberto Romero预测,GPT-4的重点在数据处理优化上,因此其使用门槛有望降低,我们预计训练成本的控制将带动其商业潜力 的增强。
展望:GPT-4—最新消息称推出在即、支持多模态
最新消息称GPT-4将于下周推出,支持多模态应用,开启通往人工通用智能之路。根据德国科技媒体“heise在线”报 道,当地时间3月9日,微软德国公司首席技术官Andreas Braun在名为“AI in Focus - Digital Kickoff”的活动中透露称 “将在下周推出GPT-4,它将是一个多模态模型,会提供完全不同的可能性——例如视频”。这意味着GPT-4可以管理不 同语言数据的输入和输出,也能够做到输出图像甚至视频。在活动上,微软AI技术专家对多模态AI的应用案例进行了介 绍,例如能够将电话呼叫的语音直接记录成文本,这为微软位于荷兰的一家大型客户节省500个工作小时/天。
GPT-4对多模态的支持使得外界对模型潜力的预期进一步强化,原因在于多模态感知是建立人工通用智能(AGI)的重要 一步,基于此能够执行人类水平的一般任务。
商业模式:C端推出订阅制会员,B端提供调用API接口
ChatGPT迅速走红,以订阅制服务B端、C端客户,成本控制下将有效加速商业化落地。ChatGPT自年初以来,持续出 圈,截至2023年1月末月活突破1亿,成为史上增长最快的消费者应用。考虑到计算资源所牵涉的庞大训练成本、运行成 本,ChatGPT的商业化路径已正在探索、明确中。
商业模式—1)C端:OpenAI发布ChatGPT Plus订阅计划,每月收费20美元,相较于免费版本,即便在高峰时段用户也 能正常访问ChatGPT,响应时间更快,可以优先使用新功能,有望引领AI技术变现新模式;2)B端:OpenAI发布 ChatGPT API,开发者可以将ChatGPT集成到产品中,价格为$0.002/1k token,相较于GPT-3.5降低90%,我们预计成 本控制后有望快速带动GPT相关应用爆发。根据微信公众号“智东西” ,生鲜电商Instacart、跨境电商Shopify、照片分 享应用Snap、单词背诵应用Quizlet等已率先接入ChatGPT API。
2.Transformer架构支撑GPT走向多模态,构筑AIGC领域核心基石
GPT采用的Transformer架构在NLP领域已跻身主流
GPT沿用主流Transformer模型,该模型采用自注意力机制,在NLP上表现优于RNN(循环神经网络)。2017年,谷歌 在《Attention is All You Need》中提出Transformer模型,可用于文本摘要、机器翻译等NLP任务。在NLP方面, Transformer模型的自注意力(self-attention)机制可以为输入序列中的任意位置提供上下文,进而模型能够一次性处理 所有输入数据,而非RNN一次只处理一个单词的情况,由此模型可以减少训练时间,能够在更大的数据集上进行训练。 目前,基于Transformer的预训练语言模型已成为NLP领域的主流。
Transformer也可用于CV领域,相较于CNN实现性能巨大提升
Transformer也可用于CV(计算机视觉)领域,表现出巨大的性能提升。CV领域此前更多由CNN(卷积神经网络)主 导,而Transformer凭借着自注意力机制,表现出了巨大的性能提升。根据微软亚洲研究院,Transformer在图像分类、物 体检测等任务中刷新了测评记录,例如2020年Transformer被首次应用于图像分类任务,结合海量的预训练数据,ViT在 ImageNet-1K的validation评测集上取得88.55%的准确率。Transformer也在视频动作识别、视觉自监督学习、图像复原、 图像分割等视觉任务中取得优异成绩。谷歌提出的ViT-MoE模型目前在参数量上领先,达到了150亿。
Transformer支撑下GPT有望走向多模态,构筑AIGC领域核心基石
GPT有望基于Transformer延伸至多模态,构筑AIGC核心基石,GPT-4或实现领跑。当前,基于Transformer的多模态学 习成为AI领域的研究热点,研究者们提出了大量的Transformer变体。鉴于Transformer具有较少的特定于模态的架构假 设,以及生成式预训练、大模型&大数据路线的成功,Transformer能够联动CV与NLP,通过联合建模完成,打破CV与 NLP领域之间的壁垒。微软亚洲研究院2022年推出BEiT-3预训练模型,在目标检测、实例分割、语义分割、视觉推理、 图片描述生成等任务上取得了SOTA的迁移性能。我们认为,基于Transformer架构,GPT未来有望延伸至多模态,助力 内容创作由UGC、PGC全面走向AIGC,赋能通用领域以及金融、教育、医疗、传媒等垂直行业。
3.通用与垂直场景多点开花,GPT变革内容生成与交互方式
通用场景:搜索引擎—GPT+文本&图像&视频重塑搜索结果呈现方式
搜索引擎接入GPT后结果呈现方式大为变化,或影响行业盈利模式与竞争格局。用户使用传统的搜索引擎时,需要手动 翻阅搜索结果,判断是否为所需要的信息;而当搜索引擎接入GPT后,用户可直接获得答案集合。尽管受制于训练语料、 成本等因素,答案准确性有待商榷,但在结果呈现方式上实现了变革,未来或与传统的搜索引擎相结合。如进一步实现多 模态,搜索结果将更加丰富。微软在Bing中上线ChatGPT能力并开启测试,以聊天方式展示搜索结果,并可在对话中推 荐广告。微软必应官方博客宣布,目前Bing日活突破1亿,集成搜索+聊天功能的Bing预览版自推出以来总聊天次数已超 过4500万次。鉴于微软可能掀起搜索行业的第二次变革并颠覆此前的盈利模式,谷歌在2月初展示由大型语言模型LaMDA 驱动的类ChatGPT应用——Bard,并计划大范围推广。
通用场景:办公软件—GPT+文本&图像打造效率型生产力工具
GPT有望融入办公流程,率先推动办公软件转型为智能办公平台。微软将于3月16日召开名为“Future of Work with AI” 的发布会,预计将展示ChatGPT类技术在Teams、Word、Outlook等生产力套件中的应用。我们认为,在GPT的赋能之 下,办公软件作为效率型生产力工具的属性将更加突出,功能上将更加智能化,用户有望享受到智能办公平台所带来的便 利性与效率大幅提升。例如,在Word中,GPT将能够帮助用户生成文本,或将文档集汇总为关键点,使得用户快速理解 和分析信息;在Outlook中,GPT可以处理收件箱文本,帮助用户更快捷地撰写或回复电子邮件;在Excel中,能够根据提 示提取数据,如要求“按照利润列出世界前五大公司”后,生成Excel公式或制作可视化图表。
垂直场景:教育—GPT+文本&对话&翻译催化启发式、个性化教学
GPT有望催化“启发式”教学模式,加快教育领域的个性化、多样化变革探索。ChatGPT可以理解为一名“全能教 师” ,即便是小众、冷门的领域,也能够给出相对有逻辑的回答。我们认为,GPT技术将催化“启发式”教学模式,引导 学生更加积极主动地进行思考、发问,并与“全能教师”进行对话探讨,这有别于传统的应试教学模式。
垂直场景:金融—GPT+文本&对话赋能客户服务、投研支持
GPT有望对金融行业的经营、管理、产品营销及客户服务等方面产生巨大影响。近年来,金融机构在合规趋严、人力成 本上升等因素的影响下,对于数字化建设的意愿强烈。考虑到ChatGPT在内容生成等方面的突出表现,我们认为,GPT 有望率先落地对外的客户服务与对内的投研支持。以银行业为例,电子客服仍处于AB判断阶段,引入GPT将更好地服务 于客户需求;在证券、基金业,个人投资者存在的大量疑惑将可通过GPT解决,机构投资者在投研中也将获得来自GPT 的协作。GPT有望重构金融行业客户服务端,也有望进一步增强机构内部的投研能力,助力经营效率提升与成本优化。
垂直场景:医疗—医疗信息化厂商卡位核心系统,助力构建GPT能力
医疗信息化公司作为医疗机构信息化底座提供者,有望助力构建GPT能力。根据复旦大学附属华山医院信息中心主任黄 虹在接受第一财经采访时透露的情况,医院内部落地GPT的场景包括:就医导诊,以提升医疗效率;构建内部知识库,以 提升临床研究效率;汇集历史病历,辅助医生提升电子病历书写效率。考虑到医院本身在信息化能力上的相对薄弱,我们 认为以创业慧康、卫宁健康、医渡等为代表的医疗信息化公司作为医院内部系统的供应商,有望帮助医院构建GPT能力。
互联网医疗平台卡位线上问诊,GPT有望助力问诊效率大幅提升。2020年疫情爆发以来,互联网医院凭借着突破时空限 制、免接触等优势,迎来快速发展。平安好医生、阿里健康、京东健康等平台搭建了轻问诊模式,主要通过自有医生、外 部签约医生提供问诊服务。我们认为,GPT可以用于在线问诊支持,为用户提供基本的、常规化的问诊服务。这将助力互 联网医疗平台实现问诊效率的大幅提升,问诊服务的供给能力将不再受制于链接的医生数量。
垂直场景:图像视频—GPT+图像&视频强化内容智能化生产与处理
GPT有望改变图像视频领域内容生产模式,多模态提高信息输出丰富度。图像视频行业新老业态交织,构成相对多元, 以生产和传播文字、图像、艺术、影像、声音等形式存在,包括报纸、图书、广播、电影、电视、动漫等诸多细分领域。 从产业链条来看,图像视频行业主要涉及信息采集、制作、分发、传播等,我们认为GPT将主要影响产业链前端的采集、 制作。结合中国信通院《AIGC白皮书》,我们预计在GPT赋能之下,特别是对多模态的延伸,图像视频行业有望进一步 提高写稿机器人、采访助手、视频智能剪辑、合成主播等新兴应用的供给能力,既改变内容生产模式,也满足信息接收者 对丰富内容的需求。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
- 鹰普精密公司研究报告:再论鹰普在AIDC发电领域的预期差.pdf
- 计算机行业年度策略:国产算力全面突破,AI应用即将爆发.pdf
- 消费行业专题:AI让人类数字世界范式重构,物理世界率先繁荣,看全球消费机遇演绎——港股行业深度报告.pdf
- AI行业用友BIP大型企业财务数智化整体解决方案:AI共生,财务价值进化.pdf
- 解决AI时代数据中心的挑战.pdf
- ChatGPT技术分析.pdf
- 华为ChatGPT技术分析报告.pdf
- 超越Chatgpt的AI agent综述.pdf
- 浙江大学DS系列专题:DeepSeek技术溯源及前沿探索.pdf
- Manus AI:Agent应用的ChatGPT时刻.pdf
- 相关标签
- 相关专题
- 相关文档
- 相关文章
- 全部热门
- 本年热门
- 本季热门
- 1 人工智能AI产业链全景图.pdf
- 2 铀行业专题报告:AI时代的关键资源品,全球核电复兴,铀矿景气反转.pdf
- 3 元宇宙177页深度报告:人类的数字化生存,进入雏形探索期.pdf
- 4 智慧城市专题研究:AIoT时代的智慧城市跃迁.pdf
- 5 2024年AI医学影像行业发展现状与未来趋势蓝皮书.pdf
- 6 中国AI智慧操场行业研究报告.pdf
- 7 人工智能行业专题报告:从CHAT~GPT到生成式AI(Generative AI)-人工智能新范式,重新定义生产力.pdf
- 8 5G+AI的杀手级应用:VR+AR深度研究报告.pdf
- 9 埃森哲人工智能应用之道(92页).pdf
- 10 新能源行业深度研究报告:新能源+AI三大方向展望,加速增长期来临.pdf
- 1 中国AI智慧操场行业研究报告.pdf
- 2 新能源行业深度研究报告:新能源+AI三大方向展望,加速增长期来临.pdf
- 3 金域医学研究报告:数据资产价值重估,AI技术驱动创新应用场景拓展.pdf
- 4 MIM(金属粉末注射成型)行业专题报告:MIM在机器人、AI、消费电子领域应用前景广阔:破界生长,智领未来.pdf
- 5 AI的宏观悖论与社会主义全球化.pdf
- 6 洞隐科技2025中国物流与供应链领域AI应用研究报告.pdf
- 7 电力设备与新能源行业深度报告:AI动力打造固态电池发展新引擎.pdf
- 8 2025年金融服务业中国AI现状与趋势.pdf
- 9 人工智能行业分析:AI新纪元,砥砺开疆·智火燎原.pdf
- 10 雷神科技公司研究报告:“电竞+信创”双轮驱动,积极推出AI PC和AI智能眼镜产品.pdf
- 1 讯飞医疗科技公司研究报告:AI医疗先行者,贯通式布局医疗信息化.pdf
- 2 医药生物行业医疗器械2026年度策略:把握出海陡峭曲线,卡位AI医疗商业化落地.pdf
- 3 艾瑞咨询:2025年中国企业级AI应用行业研究报告.pdf
- 4 新经济中工作的四大未来:2030年的AI与人才(英译中).pdf
- 5 2026年物理AI白皮书-塑造自己的下一个版本2026前沿科技趋势.pdf
- 6 2026年半导体设备行业策略报告:AI驱动新成长,自主可控大时代.pdf
- 7 青矩技术公司研究报告:全过程工程咨询服务领军者,积极布局AI推行数智化咨询新模式.pdf
- 8 高频选股因子周报:高频整体表现优异,多粒度因子维持正收益。AI增强组合超额持续回撤.pdf
- 9 专题报告:个人AI助理OpenClaw部署及其在金融投研中的应用研究——AIAgent赋能金融投研应用系列之二.pdf
- 10 AI医疗行业专题报告:AI重构医疗,从场景落地到变现讨论.pdf
- 全部热门
- 本年热门
- 本季热门
- 1 2026年计算机行业年度策略:国产算力全面突破,AI应用即将爆发
- 2 2026年消费行业专题:AI让人类数字世界范式重构,物理世界率先繁荣,看全球消费机遇演绎——港股行业深度报告
- 3 2026年计算机行业“十五五”规划纲要计算机行业解读:智能经济启航,AI Agent主导未来五年AI叙事
- 4 2026年机械设备行业“十五五”规划纲要解读(机械篇):自主可控、AI融合、外拓升级
- 5 2026年东阳光公司研究报告:全链AI算力领军平台扬帆
- 6 2026年第11周传媒行业周报:迎AI智能代理新阶段AppStore中国区佣金调整
- 7 2026年科技行业2月AI月报:OpenClaw生态升温,Agent再提速
- 8 2026年电子行业深度:AI引爆供需缺口,光芯片迎黄金机遇
- 9 2026年固收深度报告:债券“科技板”他山之石,海外科技巨头债券融资路径演变对我国非国有科技企业有何启示?(AI、半导体、新能源)
- 10 2026年特斯拉深度研究系列(2):欲上青天揽明月——在SpaceX上市前从与SpaceX及xAI协同的更高维度视角理解特斯拉
- 1 2026年计算机行业年度策略:国产算力全面突破,AI应用即将爆发
- 2 2026年消费行业专题:AI让人类数字世界范式重构,物理世界率先繁荣,看全球消费机遇演绎——港股行业深度报告
- 3 2026年计算机行业“十五五”规划纲要计算机行业解读:智能经济启航,AI Agent主导未来五年AI叙事
- 4 2026年机械设备行业“十五五”规划纲要解读(机械篇):自主可控、AI融合、外拓升级
- 5 2026年东阳光公司研究报告:全链AI算力领军平台扬帆
- 6 2026年第11周传媒行业周报:迎AI智能代理新阶段AppStore中国区佣金调整
- 7 2026年科技行业2月AI月报:OpenClaw生态升温,Agent再提速
- 8 2026年电子行业深度:AI引爆供需缺口,光芯片迎黄金机遇
- 9 2026年固收深度报告:债券“科技板”他山之石,海外科技巨头债券融资路径演变对我国非国有科技企业有何启示?(AI、半导体、新能源)
- 10 2026年特斯拉深度研究系列(2):欲上青天揽明月——在SpaceX上市前从与SpaceX及xAI协同的更高维度视角理解特斯拉
- 1 2026年计算机行业年度策略:国产算力全面突破,AI应用即将爆发
- 2 2026年消费行业专题:AI让人类数字世界范式重构,物理世界率先繁荣,看全球消费机遇演绎——港股行业深度报告
- 3 2026年计算机行业“十五五”规划纲要计算机行业解读:智能经济启航,AI Agent主导未来五年AI叙事
- 4 2026年机械设备行业“十五五”规划纲要解读(机械篇):自主可控、AI融合、外拓升级
- 5 2026年东阳光公司研究报告:全链AI算力领军平台扬帆
- 6 2026年第11周传媒行业周报:迎AI智能代理新阶段AppStore中国区佣金调整
- 7 2026年科技行业2月AI月报:OpenClaw生态升温,Agent再提速
- 8 2026年电子行业深度:AI引爆供需缺口,光芯片迎黄金机遇
- 9 2026年固收深度报告:债券“科技板”他山之石,海外科技巨头债券融资路径演变对我国非国有科技企业有何启示?(AI、半导体、新能源)
- 10 2026年特斯拉深度研究系列(2):欲上青天揽明月——在SpaceX上市前从与SpaceX及xAI协同的更高维度视角理解特斯拉
- 最新文档
- 最新精读
- 1 中国重汽公司深度研究:从周期到周期成长,中国重汽H的盈利中枢与全球视野下的价值重估.pdf
- 2 新城控股公司研究报告:双轮驱动战略笃行,商业竞争力与财务稳健性巩固.pdf
- 3 石油加工行业大炼化周报:炼厂保护性降负,推动能化产品价格价差上行.pdf
- 4 汽车和汽车零部件行业周报:“十五五”规划发布,战略发展智能汽车+具身智能.pdf
- 5 耐用消费产业行业周报:新型烟草多政策利好渗透率提升,拓竹发布首份消费级3D趋势报告.pdf
- 6 正泰电器公司研究报告:如何看正泰电器出口能力和空间?.pdf
- 7 策略周报:聚焦中东局势和原油走势,A股震荡分化.pdf
- 8 基础材料能源行业月报:供给持续优化下26年景气有望上行.pdf
- 9 信用债周策略:同业存款自律管理升级对短债有何影响?.pdf
- 10 机械行业周机汇0314:从特斯拉看北美光伏产业链发展.pdf
- 1 2026年商业航天行业深度:行业现状、市场规模、产业链及相关公司深度梳理
- 2 2026年国产算力行业深度:驱动因素、政策支持、产业进程、突破方向及相关公司深度梳理
- 3 2025年商品半年度报告_原油:供给逐渐过剩,油价下探仍未结束
- 4 2026年汽车行业:空间、格局及竞争优势探究—两轮车、全地形车及低速四轮车赛道对比
- 5 2026年汽车行业:关注整车预期筑底后结构性α行情,特斯拉Optimus明确今夏量产
- 6 2026年日本资本市场展望:如何看待高市时代下的日本?
- 7 2026年公募REITs春季策略展望:存量重构开新局,REITs蓝海向未来
- 8 2026年从风险识别到价值挖掘:中小银行二永债投资策略分析
- 9 2026年ROE稳定与ROE提升下的两类策略构建
- 10 2026年春季黄金投资策略展望:已凌千峰凭栏望,犹有青云万里程
