Openai发布会梳理

Openai发布会梳理

最佳答案 匿名用户编辑于2025/01/13 13:32

OpenAI从12月5日连续12个工作日每天公布一个新应用或功能。

发布三大基础模型,模型性能跨越式提升。12天的发布会中,OpenAI推出了三款基础模型,分别是增强的ChatGPT o1模型、Sora视频生成模型、o3模型,新的模型在数学和科学领域均有着卓越表现,同时也意味着openai在推理能力方面迈出了重要一步。 o3模型的发布,更是标志着AI在编程、科学推理等领域的巨大进步。o3模型接近通用人工智能(AGI)的标准,为复杂决策和高端问题解决提供了新的技术基础。 Sora的发布将极大降低内容创作的成本和时间。为营销、培训、市场等各领域提供AI生成的高质量视频,有望成为企业未来内容创作的新标准。

强化微调技术,提升垂直行业模型能力 。用户可以根据极少量的数据,训练特定领域的专家模型。这意味着企业构建定制化的AI模型,不再需要大量的特定数据集标注。定制化能力: 相较于通用AI,强化微调技术为企业提供了更灵活的定制化路径。企业可以通过这一技术打造专属的AI助手,在提高生产效率的同时,提供更具个性化的服务,从而有效地提升用户体验。 例如,个性化推荐、AI诊疗系统、AI审查工具等特定场景均都可以通过这一技术快速部署。

多款ai智能体升级,大幅提升用户体验。发布会发布了集智能写作&代码协作于一身的ai工作台、新的桌面应用、高级语音模式、通话访问模式等多款ai agent产品,标志着ChatGPT从简单的会话助手向更强大的代理工具的转变,从而可以代表客户执行更多任务,为用户带来全新的便捷体验。

DAY1:完整版o1发布。正式发布完整版o1,性能大幅提升。在今年9月份,OpenAI发布o1-preview,对模型的技术思路进行了改进:将更多算力运用于推理侧,o1是使用大规模强化学习训练并使用思维链进行推理的系列模型。今年12月,OpenAI正式发布了o1完整版,o1完整版在数学、编程、博士阶段科学问题(困难问题)领域的性能远超GPT4o,在科学问题领域超越人类专家,并在数学、编程领域的性能较o1-preview有了大幅提升。 相较于o1-preview,OpenAI对o1进行了使用体验方面的改进:o1目前对于简单问题能够回答更加迅速,OpenAI测试目前o1较o1-preview重大错误率降低了34%,速度提升50%。 目前o1已面向所有Plus订阅用户推出,用于替代o1-preview,并将上线后续推出的Pro订阅。

支持多模态,可处理模糊问题。 OpenAI对o1进行了改进,目前支持图像、文本两种输入方式。在演示中,对于一张手绘的太空太阳能驱动的数据中心示意图,o1估计出了其散热器表面积并解答了两个问题:如何处理太阳和深空环境,以及这里如何体现了热力学第一定律,整个推理过程仅需10秒钟。 在示例中,OpenAI故意省略了冷却面板的温度等关键数据,用以测试o1在处理模糊问题时的能力。示例中o1自行识别了关键参数缺失,并选择了合理的温度范围进行后续的推理,输出了合理结果。OpenAI表示,o1未来还会添加网页浏览、文件上传等功能,以及引入API,具体上线时间未知。

推出PRO订阅。OpenAI发布最新订阅选项ChatGPT Pro,定 价200美金/月,在这个套餐里,OpenAI 提 供了o1 pro mode,这个模式中o1处理非常 难的题目时,用户可要求o1 pro获得更多算 力,并强化思考。o1 pro mode在数学、编 程、科学问题领域性能较o1均有提升,但重 点在于o1 pro mode的连续性。 OpenAI设计了“四次测试”评估:模型需要 连续四次都答对同一个问题才算通过。在这 种条件下,o1 pro模式保持了相当高的可靠 性:在竞赛数学中达到80%,编程测试中达 到74.9%,科学问题中达到74.2%。远超普 通版o1。这说明o1 pro能提供更佳的稳定性 和一致性,对于需要AI协助完成重要工作的 专业人士来说能够有更好的保障。 同时,ChatGPT Pro订阅计划能无限制访问 OpenAI o1,以及o1-mini、GPT-4o和 Advanced Voice。

o1 pro拥有更强的推理能力。在示例中,OpenAI的研究员要求o1找到一种符合六个标准的特定蛋白质。这个问题的挑战在于,需要模型回忆起相当专业的化学领域知识,而对于任何给定的标准,可能会有数十种蛋白质符合该标准。所以模型必须全面考虑所有候选者,然后检查它们是否符合所有标准。 o1-preview在此问题经常出错,而示例中o1 pro仅使用53秒便准确回答了相关问题,并可查看详细的思考过程。在思考困难问题时,目前o1模型的思考时间可达几分钟,因此OpenAI为模型添加了思考进度条,以直观展示目前模型的进程。

DAY2:强化微调技术。强化微调后在特定领域性能明显提升。 在官方演示里,OpenAI设置了一个实验:在给定症状列表的情况下,用模型预测可能导致罕见遗传疾病的基因,并让模型解释为什么选这些基因。实验人员使用三种模型进行对比:o1 mini、o1完整版、o1 mini强化微调版。对于o1 mini强化微调版,实验人员汇集了大约1100个病例报告作为训练和验证的数据集,在使用训练数据集对模型进行训练后,上传验证数据集对模型推理能力进行反复测试和调整,同时保证验证数据集和训练数据集之间的正确基因没有重叠,以防模型作弊。评估结果时,实验人员设置了三项指标:1)模型一次答对的概率;2)模型前五次预测中有正确答案的概率;3)模型预测中有正确答案的概率。 结果显示,经过强化微调的o1 mini在一次答对的准确率上跃升180%达到了31%,各方面全面超越了o1。强化微调技术将使开发者能够通过更快、成本更低的o1 mini模型获得超越o1的专业性能,将极大促进AI在各领域的应用。

DAY3:视频大模型Sora发布。正式发布视频大模型Sora。文本/图像生成视频:Sora用户可以使用文本、图像来提示Sora生成相关视频。 时间线编辑:全新推出的故事板工具让用户可以精准地指定每个帧的输入和生成视频的内容,并轻松进行视频剪辑,用户指令越少,Sora会尝试填充更多细节,用户指令越详细,Sora会尝试遵循要求方向生成视频。用户可在Sora中保存自己喜欢的风格,并在后续视频生成任务中重复调用。高分辨率、多种格式支持:Sora可以生成480p-1080p分辨率、5-20秒、宽屏、竖屏或方形的视频。并且用户可以利用资源进行扩展、remix(用户只需描述对视频的更改,Sora将自行完成)和融合。对于同一指示,Sora可生成多个不同视频方向的变体,供用户选择。

DAY4:Canvas协作平台发布。Canvas主要功能 。用户编辑文字:在使用Canvas工具后,交互页面将被分为两部分,左侧为与模型的对话,右侧为用户可直接编辑的文档,用户可直接在Canvas工具中删除、添加、修改ChatGPT回复的内容,以及进行加粗等格式调整。不论是写信、写公文还是论文,这种新生成模式都可以大幅提升效率。同时OpenAI在Canvas工具右下角集成了部分快捷工具,用户只需点击即可实现包括询问模型反馈(Suggest edits)、文档长度调整(Adjustthe length)、语言风格转化(Reading level)、文档润色(Add final polish)、添加表情(Add emojis)这些用户在处理文档时的常用功能。审稿:很多人使用ChatGPT帮助写作,但以前一问一答的形式非常繁琐,现在用户只需要把文章复制粘贴到ChatGPT的文本框中,通过文本输入让其给出修改建议,大模型给出的建议会以逐条批注的形式出现。用户可在页面中对应位置看到ChatGPT给出的修改建议,并决定是否根据批注进行润色,之后关闭建议,或者直接选择Apply,让ChatGPT自行对内容进行修改。这使用户可以更直观的使用模型帮助自己审阅文章,并给出建议。

DAY5:Chatgpt进一步集成到Apple生态系统。Day5,苹果公司发布了其iPhone、iPad和Mac软件的更新(iOS和iPadOS 18.2),将ChatGPT进一步嵌入苹果系统当中,此次更新包括在Siri、写作工具和视觉智能中与ChatGPT的集成。 据彭博社消息,ChatGPT在回答问题时的准确率比Siri高出25%,且能回答30%更多的问题,苹果选择与OpenAI合作,将ChatGPT整合进iOS、iPadOS和macOS系统将极大提升其智能体验。 目前,在iPhone、Mac、iPad等设备中,新版的苹果智能已经包含ChatGPT拓展功能,用户可在设置中自行选择是否调用ChatGPT。

DAY6:增强版高级语音模式发布。增强版高级语音模式。 增强版高级语言模式具备屏幕共享和视觉功能,ChatGPT可以协助理解手机摄像头以及屏幕上所查看的内容。这些功能在高级语音模式已有的基础上进一步增强,目前ChatGPT支持像人类的自然对话对话,同时对话可以被中断,具有多轮交互,并理解非线性的思维过程。实时视频通话:用户现在可以使用视频与ChatGPT进行交流,这使得沟通更加直观和生动。在官方展示案例中,OpenAI的工作人员通过ChatGPT的视频功能现场获取了如何制作一杯咖啡的指引。当演示者按照步骤操作时,ChatGPT会同时口头提供见解和指导。 实时屏幕共享:用户可以将自己的屏幕内容分享给ChatGPT,以获取ChatGPT提供的技术支持或协助处理屏幕内容。在官方演示中,OpenAI的工作人员通过与ChatGPT共享屏幕,获得了关于如何回复其消息的建议。

DAY7:Projects对话管理工具上。Projects in ChatGPT。 可以将ChatGPT的各种功能整合至一处,便于用户创建并管理各类项目,不仅支持Canvas界面,还能通过ChatGPT Search轻松接入互联网资源。 分项目管理ChatGPT:Projects赋予用户将聊天与数据分组的能力,从而使用户能够依据自身需求更加便捷地定制ChatGPT。在创建Projects的过程中,用户可以在界面内设定标题、自定义文件夹的颜色、上传与项目相关的文件,并编写说明来指导ChatGPT如何最高效地协助用户完成项目。在项目内部,用户可以即刻开启聊天,并通过侧边栏轻松地将过往的聊天记录添加到项目中,同样支持利用上下文信息来回答问题。聊天内容能够保存在项目中,便于支持用户稍后继续对话,并清楚地知道在哪里查找所需内容。

DAY8:ChatGPT搜索功能更新。搜索功能全新升级 。全方位体验升级:用户现在可以直接访问嵌入式YouTube视频、图片、电影资源,还能便捷地使用商业地图和餐厅导航。在官方演示中,演示者只需与ChatGPT自然对话,ChatGPT便可自行判断是否需要调用ChatGPT search,同时,用户也可以选择开启ChatGPT search功能。ChatGPT search将自动根据要求总结网页内容,并允许用户追溯网站来源。 移动设备的优化体验:针对移动设备,OpenAI根据用户反馈优化了聊天搜索的体验。在官方演示中,演示者搜索了Mission附近的墨西哥餐厅,ChatGPT search可自行进行筛选,并展示了路线、网站、电话和营业时间等详细信息。用户可进一步提问哪些餐厅支持室外用餐,ChatGPTsearch可自行进行下一步筛选,并列示符合要求的选项,用户可点击商家地址,即可调用苹果地图规划路线。在Advance Voice模式中集成:可以在高级语音模式中使用搜索,通过语音命令访问最新的网络信息,增强了ChatGPT的交互性和便利性。在官方演示中,演示者通过语音向ChatGPT提问在12月23日苏黎世有什么活动,ChatGPT可在搜索后语音进行回复,并支持用户对感兴趣的活动进一步提问,如举办时间、地点、活动举办当天的天气等。

DAY9:o1正式版API全面上线。实时API集成WebRTC(网页实时通信)。实时API现在支持WebRTC,这将简化实时语音体验的构建,使得在各类平台(包括基于浏览器的应用、移动客户端、物联网设备或直接的服务器到服务器部署)上构建和扩展实时语音产品更加容易。通过WebRTC,现在只需几行Javascript代码,开发者就能为应用添加实时功能。WebRTC提供了许多优势,例如更好的网络适应性、回声消除和更简单的代码实现。以及将GPT-4o音频价格降低60%,同时将RealtimeAPI测试版中引入GPT-4o mini。 在官方演示中,演示者只需极短的代码,就可以在网页端构建一个语音助手。同时,仅需将网页端与带有音频交互功能的玩具连接,就可实现玩具的语音交互功能。演示者提到,后续开发者可自行将Realtime交互的应用场景扩展到可穿戴设备、摄影等领域。

DAY10:ChatGPT通话访问模式。ChatGPT通话开放:目前美国用户可通过电话与ChatGPT沟通,具体号码为:1-800-242-8478,用户可将其添加为手机联系人,通话会被审查以确保安全。在官方演示中,演示者通过直接拨入电话的方式接入ChatGPT,并提问在旧金山的280号洲际公路上看到的圆顶房子是什么,ChatGPT准确回复房子的名字,并进行了简短介绍,同时支持用户对问题进行进一步沟通。用户可以通过任何设备拨号连接ChatGPT,包括非智能手机、固定电话等,这意味着老年人也可以通过其老年机接入ChatGPT,并获得相应回复。 WhatsApp聊天:全球范围内,用户可在WhatsApp上与ChatGPT聊天,用户可以像与联系人中的任何人一样,通过文本输入问题,即可获得基于4o-mini模型生成的回复。在官方演示中,演示者通过WhatsApp询问ChatGPT意面香蒜酱的制作方法,ChatGPT可生成详细的制作方法,包括原材料、制作步骤等。同时,ChatGPT能根据用户的不同要求(如素食、特定饮食偏好等)更新食谱,并回复相应配菜建议。

参考报告

人工智能行业专题:Openai发布会梳理.pdf

人工智能行业专题:Openai发布会梳理。发布三大基础模型,模型性能跨越式提升:12天的发布会中,OpenAI推出了三款基础模型,分别是增强的ChatGPTo1模型、Sora视频生成模型、o3模型,新的模型在数学和科学领域均有着卓越表现,同时也意味着openai在推理能力方面迈出了重要一步。o3模型的发布,更是标志着AI在编程、科学推理等领域的巨大进步。o3模型接近通用人工智能(AGI)的标准,为复杂决策和高端问题解决提供了新的技术基础。Sora的发布将极大降低内容创作的成本和时间。为营销、培训、市场等各领域提供AI生成的高质量视频,有望成为企业未来内容创作的新标准。

查看详情
相关报告
我来回答