OpenAI GPT-4有哪些方面的升级?

OpenAI GPT-4有哪些方面的升级?

最佳答案 匿名用户编辑于2023/10/26 14:03

GPT-4正式发布,多模态能力带来更多应用想象。

1、OpenAI发布GPT-4,能力全面升级

GPT-4 正式发布,性能全面升级。2023 年 3 月 15 日凌晨,OpenAI 正式发布了 GPT-4 预训练大 模型,相比于 GPT-3.5 模型进行了全方位的升级。实际上在半年前 OpenAI 就已经完成了 GPT-4 的模型,随后又采用对抗性测试对 GPT-4 进行了 6 个月的迭代调整,保证其在真实性、可操作性 和安全方面达到最好。GPT-4 仍为 Transformer 架构的预训练模型,与 ChatGPT 类似,同样采用 了基于人类反馈的强化学习(RLHF)方法,在一些专业和学术领域上已经达到了人类水平,是 OpenAI 在人工智能领域的又一里程碑。

GPT-4 相比 GPT-3.5 具有四方面的能力提升: 1) GPT-4 具有一定的多模态能力,能够进行图文结合输入的分析。GPT-4 是一个多模态模型, 它能够接受图片和文本输入,并输出文本回复,相比 GPT-3.5 增加了对图像模态的分析推理 能力。与业界之前的预测不同,GPT-4 并不具备多模态的生成能力,即无法从文本输入中得 到图片(类似于 DALL-E),只能对图片的输入进行分析,并且图片输入目前仍处于研究预 览阶段,还未对公众开放。根据 OpenAI 显示,GPT-4 对图片的处理分析能力达到了很高的 水准,这相当于机器拥有了视觉并且能够进行思考,在应用层面有非常广的空间。比如,完 全可以成为视力障碍人群的眼睛,给出题目的图片能够直接进行解题步骤的输出等,在教育 领域有广泛的落地场景。

2) GPT-4 在复杂专业领域的性能表现大幅超过 GPT-3.5 和当下的 SOTA 大模型。据 OpenAI 显示,GPT-4 和 GPT-3.5 在一些普通的谈话测试中的性能区别不大,但是在处理较为复杂 和专业的任务上,GPT-4 相比 GPT-3.5 则表现更优。在美国律师资格考试测试中,GPT-4 的成绩可以达到前 10%,而 GPT-3.5 只能达到后 10%的水平。与 SOTA 模型(state-of-theart model,目前最好的模型)相比,GPT-4 也展现出了更好的性能。

3) GPT-4 能够处理更长的文本,具有更好的创作能力和逻辑推理能力。ChatGPT 处理的文本 字数上限为 3000 字,而 GPT-4 可以处理超过 25000 字的长文本,支持内容创作、对话拓展 和文档分析等功能。在创造性方面,GPT-4 可以辅助用户进行生成、处理和迭代创意工作, 例如创作歌曲、编写剧本或学习用户的写作风格。与 ChatGPT 相比,GPT-4 的逻辑推理能 力更进一步,在复杂的推理问题中表现更佳。4) GPT-4 支持用户自定义 AI 的对话风格。在 OpenAI 的开发者直播中可以初步窥视 GPT-4 的 页面布局,用户可以左侧的 System 栏中输入命令来定义 GPT-4 的交互对话风格,而不是像 ChatGPT 一样只有一种风格。我们认为,自定义 AI 对话风格对于基于 GPT-4 的二次开发应 用来说是非常方便的,开发者可以轻松地创造出具有个人独特风格的 AI 应用。

GPT-4 已开放给 ChatGPT Plus 用户使用,并且开放了 GPT-4 API 使用申请,使用成本大幅提 升。据 OpenAI 显示,目前仅有 ChatGPT Plus 的订阅会员用户能够访问 GPT-4,但存在容量上 限,OpenAI 会对此进行持续扩展和优化,未来可能会推出免费的 GPT-4 试用版和更高级的订阅 版本以供用户获得更多的使用容量。OpenAI 同时开放了 GPT-4 API 的使用申请,开发者可以申 请进入 GPT-4 API 的等待列表,OpenAI 会逐步邀请开发人员开始试用 API。目前提供给开发者 的 API 只能进行文本的输入,分为 8k 和 32k token 两个版本,最便宜的 8k-prompt 版本的定价为 0.03 美元/1k tokens,相比于之前发布的 GPT-3.5-turbo 的 0.002 美元/1k tokens 要贵十倍以上。

2、GPT-4有望带来多场景智能化升级

GPT-4 已在多领域落地,微软官宣证实 New Bing 背后的大模型就是 GPT-4。伴随着 GPT-4 的 发布,OpenAI 也给出了 GPT-4 的 6 个应用实例,涵盖了教育、金融和政府领域。例如在 Duolingo 里加入 AI 与用户进行日常聊天,加速用户对语言的学习;摩根士丹利采用 GPT-4 来对 其知识库进行管理,帮助员工快速访问想要的内容。微软也在 GPT-4 发布后官宣,New Bing 背 后的模型就是 GPT-4,并且将随着 GPT-4 的更新持续迭代。我们在之前的报告中已多次提到,大 模型的能力将对产业智能化带来重大影响。随着 GPT-4 的发布以及性能飞跃,大模型在各领域有 望迎来进一步的落地应用。考虑到其对话交互的特性,我们看好 GPT-4 在如下几个领域的应用。

1) 教育场景:GPT-4的自定义AI风格能力与其连续对话交互能力与教育场景十分契合,对不 同性格的学生采用不同风格的AI作为虚拟导师,回答学生的问题、提供个性化的学习建议 和教育资源、分析学生的学习进展等,达成对学生进行个性化教育的目标,使得每个学生都 能以最大化的效率进行学习。此外GPT-4还能作为教师的辅助教学工具,帮助教师更好地 管理教学过程和学生。例如,教师可以使用 AI 来分析学生的学习数据,针对不同的学生制 定更加个性化的教学计划和评估学生的学习成果。GPT-4的图片分析能力还能够辅助教学过 程中的阅卷工作,实现对主观题的评分,减轻教师工作负担,提高阅卷的公正性与准确性。

 

2) 医疗场景:GPT-4 丰富的专业知识使其能够做好辅助诊断的工作,通过分析医疗记录、病历 资料、诊断报告等数据,提供有关疾病诊断、治疗方案和药物处方等方面的建议和指导,帮 助医生更加准确地诊断和治疗疾病,提高医疗质量和治疗效果。在医学影像领域,GPT-4 新 增的图片分析能力也可以用于CT等图像的诊断,智能标记出存在症状的图像区域。将GPT4 与可穿戴设备结合,可实现对重症患者的全天候健康监测,进行实时健康风险评估,帮助 患者做好健康管理等。

3) 企业经营管理办公场景:GPT-4 的对话交互特性与逻辑分析能力可以助力企业经营管理办公 全流程的效率提升。在企业的 OA 系统中,GPT-4 可以辅助员工快速智能地进行流程办理; 在企业 ERP 系统中,GPT-4 可以通过数据分析来辅助企业进行经营决策;在办公环节, GPT-4 的长文本理解能力有望对会议、文档和邮箱场景带来效率提升。 4) 工业设计场景:GPT-4 在复杂专业领域的性能以及其多模态分析能力可以成为良好的工业设 计辅助工具。例如在 CAD、CAE、EDA 等工业设计软件领域,GPT-4 可以作为其中的插件 来进行模型的辅助设计、图纸生成等。清华大学土木工程系的陆新征课题组已经将生成对抗 网络技术应用到了结构设计中,能够自动为剪力墙进行配筋,结果基本和普通的结构设计软 件给出的配筋结果一致。能力更强的大模型在这方面的应用更加值得期待。

参考报告

人工智能行业专题报告:大模型应用百花齐放,AI发展进入新时代.pdf

人工智能行业专题报告:大模型应用百花齐放,AI发展进入新时代。OpenAI正式发布GPT-4,具有多模态能力,应用范围更广。3月15日,OpenAI正式发布GPT-4预训练大模型,相比于GPT-3.5性能表现显著提升,在一些专业和学术领域上已经达到了人类水平。GPT-4具有一定的多模态能力,能够接收图文结合的输入,并输出文本回复,应用范围得到进一步拓展。基于GPT-4对话交互的特性,我们认为,GPT-4将率先在教育、医疗、企业经营管理办公等领域实现落地,场景与人工智能的结合方式值得期待。百度的对话式大模型“文心一言”正式发布,多模态生成能力亮眼。3月16日下午,百度正式...

查看详情
相关报告
我来回答