下面将从几个不同的角度对 GPT4 与 GPT3.5和 ChatGPT进行比较。
一、GPT4 与 GPT3.5
1、模型规模。相较于 GPT3.5 的 1750 亿个参数,GPT4 的参数达到了 5000 亿个(也有报道为 1 万亿),GPT4 的规模比 GPT3.5 更大。更大的规模通常意味 着更好的性能,能够生成更复杂、更准确的语言。
2、训练数据。GPT3.5 使用了来自维基百科、新闻报道、网站文章等互联网 上的大量文本数据,大小为 45TB 左右。而 GPT4 则使用了更大量的网页、书籍、 论文、程序代码等文本数据,同时还使用了大量的可视数据。尽管无法考究具体数 值,但毫无疑问,GPT4 的训练数据比 GPT3.5 更丰富。这使得 GPT4 具备更广 泛的知识,回答也更具针对性。
3、模态与信息。GPT3.5 是基于文本的单模态模型,无论是图像、文本、音频, 用户只能输入一种文本类型的信息。而 GPT4 是一个多模态模型, 可以接受文本和 图像的提示语(包括带有文字和照片的文件、图表或屏幕截图)。这使得 GPT4 可 以结合两类信息生成更准确的描述。在输入信息长度方面,与 GPT3.5 限制 3000 个字相比,GPT4 将文字输入限制提升至 2.5 万字。文字输入长度限制的增加,也 大大扩展了 GPT4 的实用性。例如可以把近 50 页的书籍输入 GPT4 从而生成一 个总结概要,直接把 1 万字的程序文档输入给 GPT4 就可直接让它给修改 Bug, 极大提高工作生产效率。
4、模型功能。GPT3.5 主要用于文字回答和剧本写作。而 GPT4,除文字回答 和剧本写作外,还具有看图作答、数据推理、分析图表、总结概要和角色扮演等更 多功能。
5、模型性能。虽然 GPT3.5 已经表现出很强大的性能,但 GPT4 在处理更复 杂的问题方面表现得更好。例如,在多种专业和学术基准方面,GPT4 表现出近似 人类水平;在模拟律师考试方面,GPT4 可以进入应试者前 10% 左右,而 GPT3.5 则在应试者倒数 10% 左右;在 USABO Semifinal Exam 2020(美国生物奥林匹克 竞赛)、GRE 口语等多项测试项目中,GPT4 也取得了接近满分的成绩,几乎接近 了人类水平。
6、安全性和可靠性。GPT4 改进了对抗生成有毒或不真实内容的策略,以减 少误导性信息和恶意用途的风险,提高其安全性和可靠性。特别地,GPT4 在事实 性、可引导性和拒绝超范围解答(非合规)问题方面取得了有史以来最好的结果 (尽管它还不够完美)。与 GPT3.5 相比,在生成的内容符合事实测试方面,GPT4 的得分比 GPT3.5 高 40%,对敏感请求(如医疗建议和自我伤害)的响应符合政 策的频率提高 29%,对不允许内容的请求响应倾向降低 82%。
总体来说,GPT4 比 GPT3.5 更可靠,更有创造力,能够处理更细微的指令。
二、GPT4 与 ChatGPT
ChatGPT 是基于 GPT3.5 的 AI 聊天机器人。但在对话方面,GPT4 已表现 出更好的连贯性和语境理解能力:不仅可以生成流畅、准确和有逻辑的文本,还可 以理解和回答各种类型的问题,甚至还可以与用户进行创造性和技术性的写作任 务。其中,比较突出的应用能力体现如下。
1、新增的图片辨识和分析能力。与 ChatGPT 相比,GPT4 除了可以支持文 字输入以外,还新增了图片辨识和分析功能,即能辨识图片(输出对图片的内容描 述)、分析图表(类似 EXCEL 中的图表分析)、发现图片中的不常之处(对图片 中异常现象进行辨识)、阅读文件并总结概要(如对 PDF 文件内容进行归纳总结) 等。甚至只需要在纸上画一个网站的草稿图,拍一张照片上传给 GPT4,模型便可 生成网站代码。
2、更先进的推理能力。相比 ChatGPT 只能在一定程度上进行简单和直接的 推理,GPT4 可以进行复杂和抽象的思考,能解决更复杂的问题。如前所述,GPT4在多个专业和学术领域都已表现出人类的水平,如美国的律师考试已经达到了前 10% 的标准,法学院的入学考试也达到了 88% 的成绩,SAT 大学入学考试也达到 了 90% 的成绩。特别是 ChatGPT 不擅长的数学解题能力,GPT4 有了大幅提升, 在美国高校入学考试 SAT 数学考试中,获得了 800 分中的 700 分。
3、更高水平的创造力和协作性。与 ChatGPT 只能在一定范围内进行有限的 创造和协作不同,GPT4 可以与用户进行创造性和技术性的写作任务,例如创作歌 曲、编写剧本或者学习用户的风格和偏好,还可以生成、编辑和迭代各种类型和风 格的文本,并且能够根据用户的反馈和建议来改进其输出。
4、更广泛的应用前景。GPT4 凭借接近人类水平的语言理解和生成能力以及 其他方面的优势,可在各种领域和场合中发挥重要作用。例如,GPT4 可以作为一 个智能助理、教育工具、娱乐伙伴和研究助手,为 Office 办公软件、搜索引擎、虚 拟导师应用等提供使能。据公开资料报道,微软已将 GPT4 接入 Office 套件从而 推出全新的 AI 功能 Copilot,也已将 GPT4 接入 Bing 以提供定制化搜索服务;摩 根士丹利正在应用 GPT4 进行财富管理部市场信息的分类和检索;Doulingo 将使 用 GPT4 进行角色扮演以增进语言的学习;BeMyEyes 正在运用 GPT4 将视觉型 图片转成文字帮助盲人理解;可汗学院也已使用 GPT4 作为虚拟导师 Khanmigo 等等。
可以预见,GPT4 将会接入越来越多的行业,从而促进社会生产力和创造力的 提升,为人类带来便利和价值。与此同时,伴随着 GPT4 的应用拓展和深入,GPT4 将从人类反馈中进行更多、更快的学习,其模型迭代升级的速度也将随之加快,更 多的功能、更强的性能将会呈惊现于世。