OpenAI GPT-4有哪些方面的升级？

提问时间：2023/10/26
浏览次数：254
提问者：匿名用户
举报
分享微信 QQ 微博

标签

OpenAI

共有1个回答
关注问题
我来回答

最佳答案由匿名用户编辑于2023/10/26 14:03

GPT-4正式发布，多模态能力带来更多应用想象。

1、OpenAI发布GPT-4，能力全面升级

GPT-4 正式发布，性能全面升级。2023 年 3 月 15 日凌晨，OpenAI 正式发布了 GPT-4 预训练大模型，相比于 GPT-3.5 模型进行了全方位的升级。实际上在半年前 OpenAI 就已经完成了 GPT-4 的模型，随后又采用对抗性测试对 GPT-4 进行了 6 个月的迭代调整，保证其在真实性、可操作性和安全方面达到最好。GPT-4 仍为 Transformer 架构的预训练模型，与 ChatGPT 类似，同样采用了基于人类反馈的强化学习（RLHF）方法，在一些专业和学术领域上已经达到了人类水平，是 OpenAI 在人工智能领域的又一里程碑。

GPT-4 相比 GPT-3.5 具有四方面的能力提升： 1) GPT-4 具有一定的多模态能力，能够进行图文结合输入的分析。GPT-4 是一个多模态模型，它能够接受图片和文本输入，并输出文本回复，相比 GPT-3.5 增加了对图像模态的分析推理能力。与业界之前的预测不同，GPT-4 并不具备多模态的生成能力，即无法从文本输入中得到图片（类似于 DALL-E），只能对图片的输入进行分析，并且图片输入目前仍处于研究预览阶段，还未对公众开放。根据 OpenAI 显示，GPT-4 对图片的处理分析能力达到了很高的水准，这相当于机器拥有了视觉并且能够进行思考，在应用层面有非常广的空间。比如，完全可以成为视力障碍人群的眼睛，给出题目的图片能够直接进行解题步骤的输出等，在教育领域有广泛的落地场景。

2) GPT-4 在复杂专业领域的性能表现大幅超过 GPT-3.5 和当下的 SOTA 大模型。据 OpenAI 显示，GPT-4 和 GPT-3.5 在一些普通的谈话测试中的性能区别不大，但是在处理较为复杂和专业的任务上，GPT-4 相比 GPT-3.5 则表现更优。在美国律师资格考试测试中，GPT-4 的成绩可以达到前 10%，而 GPT-3.5 只能达到后 10%的水平。与 SOTA 模型（state-of-theart model，目前最好的模型）相比，GPT-4 也展现出了更好的性能。

3) GPT-4 能够处理更长的文本，具有更好的创作能力和逻辑推理能力。ChatGPT 处理的文本字数上限为 3000 字，而 GPT-4 可以处理超过 25000 字的长文本，支持内容创作、对话拓展和文档分析等功能。在创造性方面，GPT-4 可以辅助用户进行生成、处理和迭代创意工作，例如创作歌曲、编写剧本或学习用户的写作风格。与 ChatGPT 相比，GPT-4 的逻辑推理能力更进一步，在复杂的推理问题中表现更佳。4) GPT-4 支持用户自定义 AI 的对话风格。在 OpenAI 的开发者直播中可以初步窥视 GPT-4 的页面布局，用户可以左侧的 System 栏中输入命令来定义 GPT-4 的交互对话风格，而不是像 ChatGPT 一样只有一种风格。我们认为，自定义 AI 对话风格对于基于 GPT-4 的二次开发应用来说是非常方便的，开发者可以轻松地创造出具有个人独特风格的 AI 应用。

GPT-4 已开放给 ChatGPT Plus 用户使用，并且开放了 GPT-4 API 使用申请，使用成本大幅提升。据 OpenAI 显示，目前仅有 ChatGPT Plus 的订阅会员用户能够访问 GPT-4，但存在容量上限，OpenAI 会对此进行持续扩展和优化，未来可能会推出免费的 GPT-4 试用版和更高级的订阅版本以供用户获得更多的使用容量。OpenAI 同时开放了 GPT-4 API 的使用申请，开发者可以申请进入 GPT-4 API 的等待列表，OpenAI 会逐步邀请开发人员开始试用 API。目前提供给开发者的 API 只能进行文本的输入，分为 8k 和 32k token 两个版本，最便宜的 8k-prompt 版本的定价为 0.03 美元/1k tokens，相比于之前发布的 GPT-3.5-turbo 的 0.002 美元/1k tokens 要贵十倍以上。

2、GPT-4有望带来多场景智能化升级

GPT-4 已在多领域落地，微软官宣证实 New Bing 背后的大模型就是 GPT-4。伴随着 GPT-4 的发布，OpenAI 也给出了 GPT-4 的 6 个应用实例，涵盖了教育、金融和政府领域。例如在 Duolingo 里加入 AI 与用户进行日常聊天，加速用户对语言的学习；摩根士丹利采用 GPT-4 来对其知识库进行管理，帮助员工快速访问想要的内容。微软也在 GPT-4 发布后官宣，New Bing 背后的模型就是 GPT-4，并且将随着 GPT-4 的更新持续迭代。我们在之前的报告中已多次提到，大模型的能力将对产业智能化带来重大影响。随着 GPT-4 的发布以及性能飞跃，大模型在各领域有望迎来进一步的落地应用。考虑到其对话交互的特性，我们看好 GPT-4 在如下几个领域的应用。

1) 教育场景：GPT-4的自定义AI风格能力与其连续对话交互能力与教育场景十分契合，对不同性格的学生采用不同风格的AI作为虚拟导师，回答学生的问题、提供个性化的学习建议和教育资源、分析学生的学习进展等，达成对学生进行个性化教育的目标，使得每个学生都能以最大化的效率进行学习。此外GPT-4还能作为教师的辅助教学工具，帮助教师更好地管理教学过程和学生。例如，教师可以使用 AI 来分析学生的学习数据，针对不同的学生制定更加个性化的教学计划和评估学生的学习成果。GPT-4的图片分析能力还能够辅助教学过程中的阅卷工作，实现对主观题的评分，减轻教师工作负担，提高阅卷的公正性与准确性。

2) 医疗场景：GPT-4 丰富的专业知识使其能够做好辅助诊断的工作，通过分析医疗记录、病历资料、诊断报告等数据，提供有关疾病诊断、治疗方案和药物处方等方面的建议和指导，帮助医生更加准确地诊断和治疗疾病，提高医疗质量和治疗效果。在医学影像领域，GPT-4 新增的图片分析能力也可以用于CT等图像的诊断，智能标记出存在症状的图像区域。将GPT4 与可穿戴设备结合，可实现对重症患者的全天候健康监测，进行实时健康风险评估，帮助患者做好健康管理等。

3) 企业经营管理办公场景：GPT-4 的对话交互特性与逻辑分析能力可以助力企业经营管理办公全流程的效率提升。在企业的 OA 系统中，GPT-4 可以辅助员工快速智能地进行流程办理；在企业 ERP 系统中，GPT-4 可以通过数据分析来辅助企业进行经营决策；在办公环节， GPT-4 的长文本理解能力有望对会议、文档和邮箱场景带来效率提升。 4) 工业设计场景：GPT-4 在复杂专业领域的性能以及其多模态分析能力可以成为良好的工业设计辅助工具。例如在 CAD、CAE、EDA 等工业设计软件领域，GPT-4 可以作为其中的插件来进行模型的辅助设计、图纸生成等。清华大学土木工程系的陆新征课题组已经将生成对抗网络技术应用到了结构设计中，能够自动为剪力墙进行配筋，结果基本和普通的结构设计软件给出的配筋结果一致。能力更强的大模型在这方面的应用更加值得期待。

参考报告

人工智能行业专题报告：大模型应用百花齐放，AI发展进入新时代.pdf

人工智能行业专题报告：大模型应用百花齐放，AI发展进入新时代。OpenAI正式发布GPT-4，具有多模态能力，应用范围更广。3月15日，OpenAI正式发布GPT-4预训练大模型，相比于GPT-3.5性能表现显著提升，在一些专业和学术领域上已经达到了人类水平。GPT-4具有一定的多模态能力，能够接收图文结合的输入，并输出文本回复，应用范围得到进一步拓展。基于GPT-4对话交互的特性，我们认为，GPT-4将率先在教育、医疗、企业经营管理办公等领域实现落地，场景与人工智能的结合方式值得期待。百度的对话式大模型“文心一言”正式发布，多模态生成能力亮眼。3月16日下午，百度正式...

查看详情

OpenAI GPT-4有哪些方面的升级？

1、OpenAI发布GPT-4，能力全面升级

2、GPT-4有望带来多场景智能化升级

人工智能行业专题报告：大模型应用百花齐放，AI发展进入新时代.pdf

OpenAI经营看点在哪？

OpenAI算力建设、需求与财务分析

OpenAI o3与o4-mini核心看点在哪？

OpenAI Operator智能体看点在哪？

Openai发布会梳理

OpenAI发布会深度总结

OpenAI o1能给AI带来什么？

OpenAI模型进展如何？

OpenAI Sora亮点在哪？

OpenAI用户市场空间及成本分析

商业火箭目前发展到什么阶段了？

康耐特光学有哪些业务布局？

AI眼镜行业规模、需求、成长性、格局及竞争要素在哪？

康耐特光学发展历程、股权结构及收入分析

中宠股份经营看点在哪？

中宠股份发展历程、股权结构及营收分析

赛微电子发展历程、股权结构、主营业务、研发及财务分析

梦百合内外销业务进展如何？

沃巴查芒

每日新报

StartYourFinance

999感冒灵

王中王