OpenAI发展历程、管理团队及业务布局分析

OpenAI发展历程、管理团队及业务布局分析

最佳答案 匿名用户编辑于2024/02/04 16:18

全球领先的 AI 初创企业。

1.发展历程:从非营利开端到向营利性全面转型

OpenAI 是美国一家人工智能(Artificial Intelligence,AI)研究实验室,由非营利组织 OpenAI 和其营利组织子公司 OpenAI LP 所组成,公司致力于构建安全的通用人工智能(Artificial General Intelligence,AGI)以造福人类。 非营利开端:硅谷大牛云集,创建非营利组织以促进 AI 发展。非盈利性的 AI 项目 OpenAI 于 2015 年宣布正式启动,由许多硅谷大牛共同创建,例如硅谷创业孵化器 Y Combinator CEO 的 Sam Altman、Google Brain 的 Ilya Sutskever、时任互联网支付处理平台 Stripe CTO 的 Greg Brockman 以及特斯拉的 CEO Elon Musk 等,许多创始人都曾是被誉为“深度学 习教父”Geoffrey Hinton 教授的学生。公司把生成式预训练模型(Generative Pre-trained Transformer,GPT)确定为主要研究方向,先后推出并开源预训练 NLP 模型 GPT-1,以 及采用迁移学习技术、能实现多个 NLP 任务的 GPT-2。

向营利性转型:与微软深度绑定,推出掀起生成式 AI 浪潮的 ChatGPT。2018 年,由于 Elon Musk 担任 CEO 的 Tesla 等公司也在开发 AI 技术,为避免潜在的利益冲突,Elon Musk 辞去 OpenAI 董事会席位。为支撑大模型训练的高算力和资金需求,同年,有限营利公司 OpenAI LP 成立。2019 年,OpenAI LP 接受微软 10 亿美元投资,与其达成独家合作伙伴 关系。在强大算力和充足资金的助力下,OpenAI 沿着 GPT 路线持续发力,2020 年推出拥 有小样本泛化能力的 GPT-3,2022 年推出加入指示学习(Instruction Learning)和人工反 馈的强化学习(Reinforcement Learning from Human Feedback,RLHF)的 InstructGPT, 并于 2022 年发布产品化的 ChatGPT,掀起了一股席卷全球的生成式 AI 浪潮。 全面转型:加快商业化步伐,构建生态圈。2023 年 1 月,微软宣布与 OpenAI 长期合作伙 伴关系进入第三阶段,将继续向 OpenAI 投资数十亿美元,并加速产品与技术的整合。2023 年 3 月,OpenAI 发布工程化的多模态 GPT-4,并与各个领域的软件开展合作;同月,OpenAI 发布 ChatGPT Plugins(ChatGPT 插件集),将 GPT 大模型能力与面向用户的第三方应用 程序互联,应用空间想象力广阔.

2.团队:年轻、背景豪华且高度聚焦技术

OpenAI 有着一支高人才密度、高效率的“特种兵”创始人团队。首席执行官兼联合创始人 Sam Altman,曾任硅谷创业孵化器 Y Combinator 的 CEO,于 2015 年带领创建了 OpenAI, 致力于构建安全且人类级别 AI,是一位有着卓越的商业头脑和战略思维的领导者。总裁兼 联合创始人 Greg Brockman,曾任互联网支付处理平台 Stripe 的 CTO,在 OpenAI 曾用九 个月时间从“零”学起成为一名 1 顶 10 的 AI 工程师,是技术产品化的第一推手。首席科 学家兼联合创始人 Ilya Sutskever,曾就职于 Google Brain,参与了深度学习框架 TensorFlow、生成式对抗网络(GAN)和序列到序列(Seq2Seq)模型的研究,在 OpenAI 领导了 GPT-1/2/3、DALLE 以及 ChatGPT 等模型的研发。 微软的 AI 研究实验室(Microsoft Research AI)是推进 AI 研究的主力团队。实验室于 2017 年成立,隶属于微软研究院,凝聚了来自感知、学习、推理和自然语言处理等多个 AI 研究 子领域的顶尖科学家,旨在将不同学科结合起来以推进 AGI 技术研发。

ChatGPT 团队由一群年轻、背景豪华、经验丰富且高度聚焦技术研发的人员组成。AMiner 与智谱研究发布的报告显示,团队规模虽不足百人(共 87 人),但有着以下显著特征:1) 平均年龄 32 岁,“90 后”是主力军;2)学术能力和业界经验均突出,其中有 10 人来自谷 歌;3)技术人员近九成,高度聚焦技术研发;4)LLM 领域的经验丰富,1/4 团队成员曾 参与 Codex 项目。

3.算力:强大的算力支撑 GPT 释放大模型潜能

大模型的训练和推理对算力消耗提出高要求,AI 超级算力集群有力推动 GPT 系列发展。 2020 年,微软为 OpenAI 专属打造拥有超过 28.5 万张 CPU、1 万张 GPU 的 AI 超级计算 机,通过 Azure 云平台给予其算力支持,并保证该部分算力不会被 Azure 其他服务占用, 为 OpenAI 的大模型训练配置强大且灵活的计算资源和基础设施。此外,芯片龙头企业 NVIDIA也与OpenAI保持紧密合作,供应最先进的GPU以支持GPT系列模型的加速计算, 例如 2021 年 OpenAI 将 NVIDIA 全球首款 DGX AI 超级计算机用以训练 GPT-3.5。 微软正在自研 AI 芯片,首要目标便是为 OpenAI 提供算力。2023 年 4 月,据 The Information 报道,微软正在秘密研发自己的 AI 芯片,代号雅典娜(Athena)。雅典娜芯片由台积电代 工,采用 5nm 先进制程,首个目标便是为 OpenAI 提供算力引擎,以替代昂贵的英伟达 A100/H100,节省成本。微软从 2019 年就开始研发这款芯片,目前已在测试阶段。

4.模型:坚持 GPT 技术路径,持续探索生成式 AI 潜力

OpenAI 从 18 年起一直沿着 GPT 路线持续发力,通过 GPT1/2/3/3.5/4 等模型不断地进行 技术探索。 在模型架构上,GPT 是侧重生成的单向模型。模型的基础架构是 Transformer 的解码器, 解码器的第一个自注意力层加入了掩蔽机制,使得句子的未来信息被隐藏,由于只能通过 学习当前和历史的文本信息,来对下一个字进行预测,因此属于单向的生成式模型。生成 式模型相比理解式模型通常具有更高的灵活性和更强的泛化能力,在应用时更具通用性。

不断扩大数据量和参数量进一步提升模型的表现。GPT 系列模型结构秉承了不断堆叠 Transformer 的思想,通过不断提升训练语料的规模、网络的参数数量来完成 GPT 系列的 迭代更新。

InstructGPT 极大地提升了通用 AI 系统与人类意图的对齐能力。InstructGPT 基于 GPT-3 的架构,引入了指示学习(Instruction Learning)来使得 AI 系统更遵循人类指令,减少产 生有害或错误内容的可能性;同时,引入人类反馈的强化学习(Reinforcement Learning with Human Feedback,RLHF)训练机制,通过强化学习范式让生成式 AI 产出的内容更符合 人类意图。 多模态能力和预测扩展工具让 GPT-4 与万物互联。2023 年 3 月,OpenAI 发布 GPT-4,模 型支持文本和图像输入的多模态能力,应用空间想象力巨大,有望重塑从浏览器到文档智 能等的软件交互。同时,OpenAI 推出具备预测扩展性的深度学习堆栈,用极小算力成本就 能可靠预测 GPT-4 在下游垂直领域应用的性能,让小成本广泛试用成为可能。在选择合适 的大模型后,模型微调让通用基础模型在细分领域的表现进一步提升。

5.应用:以产品为导向形成数据飞轮,逐步构建生态圈

推动技术商业化,形成模型调用、用户数据反馈和模型迭代的正反馈循环。OpenAI 始终以 产品为导向,积极推出产品以迅速获取用户,从而得到用户反馈数据来训练出更好的模型。 2020 年,OpenAI 在发布 GPT-3 后快速开放商用 API 服务,让下游客户通过 API 调用模型 能力。在 ChatGPT 的训练过程中,则融入用户数据反馈:1)采用 GPT-3 API 获取的真实 用户请求微调基础模型;2)引入 RLHF 训练机制,采用人工标注的数据,通过人类的反馈进行强化学习,针对性地进行模型优化。这使得ChatGPT在多个自然语言任务如文书写作、 代码生成与修改、多轮对话等中展现出远超 GPT-3 的优秀能力,并让有害和不真实输出有 效减少。

技术与产品的整合进一步推动数据飞轮的运转。当前,微软将把 OpenAI 的技术与旗下各 应用生态的产品整合,涵盖企业级云计算、办公、底层代码生成和娱乐交互等各个应用层 面。

GPT-4 开始构建生态圈,与各个领域的软件开展合作。Be My Eyes 是一款帮助全世界的盲 人以及低视力人群的产品,通过 GPT-4 的视觉输入功能,Be My Eyes 能够大幅度提高 Virtual Volunteer 对图片的理解程度。语言学习软件 Duolingo 推出 GPT-4 驱动的 Duolingo Max,能够辅助用户解释答案对错,以及陪同用户进行角色扮演式地练习。随着 AI 工具在 C 端渗透率逐步提升,各行业生态中的数据反馈越来越丰富和庞大,进一步推动数据飞轮 的快速运转。

参考报告

AI大模型行业专题报告:AI大模型企业是如何炼成的.pdf

AI大模型行业专题报告:AI大模型企业是如何炼成的。OpenAI与微软是目前AI大模型技术水平、产品化落地最为前沿的领军者。复盘OpenAI发展历程,我们认为以下特质和战略选择至关重要:1)高人才密度,内部坚定信仰AGI;2)把握正确的技术路线不动摇,Transformer架构诞生后快速选择,并坚定其中的解码器路线;3)与微软合作,解决算力不足问题;4)推动产品落地,形成模型调用、数据反馈和模型迭代的正反馈循环。目前,微软已经将OpenAI的大模型能力整合至其办公软件、搜索、操作系统、云服务等各ToB、ToC产品或服务中。谷歌:技术储备丰厚&AI可落地业务生态广阔,目前产品化生态化加速...

查看详情
相关报告
我来回答