GPT-5 即将登场

阅读时长 16 分钟

在AI领域的最新浪潮中,OpenAI即将推出备受期待的GPT-5,一种超越前代的革命性语言模型。本文揭露了GPT-5的开发旅程,从OpenAI首席执行官Sam Altman最初的保守态度到项目逐步揭晓的神秘面纱。GPT-5不仅预示着多模态能力的飞跃,如处理语音、图像和视频,还承诺解决现有AI模型中的幻觉问题。在技术巨头们的市场竞争中,GPT-5的出现无疑加剧了这场AI军备竞赛。本文不止关于一种技术的进步,也探讨了GPT-5可能对整个人工智能领域未来走向的深远影响。

01 什么是 GPT-5

GPT-5 是 OpenAI 公司万众瞩目的下一代人工智语言模型,也就是 GPT-4 这个大语言模型的新版本。

02 犹抱琵琶半遮面的 GPT-5

image.png

去年 4 月份的时候,也就是 ChatGPT-4 发布一个月之后,OpenAI 的首席执行官奥尔特曼(Sam Altman ),在麻省理工学院的一次活动上,在被问到是否正在训练 GPT-5 的时候,奥尔特曼就曾公开表示:“我们现在不会,一段时间内也不会这样做”。我们当然无从得知,奥尔特曼当时是否所言非虚,但是三个月之后,事情似乎开始朝另外一个方向在发展。

去年7月,OpenAI 提交了 GPT-5 商标申请,似乎在表明奥尔特曼(Sam Altman)所说的「未来一段时间」,指的是三个月。

image.png

而在去年 9 月, Digital Trends 和 Windows Central 等可靠来源一直流传着谣言,暗示 GPT-5 将于 去年 12 月发布。但 OpenAI 的态度始终保持暧昧,没有官方正面承认。

时间来到 11月,在 OpenAI 的开发者大会上,OpenAI的首席执行官奥尔特曼重申 GPT-5 尚未明确的研发时间表,他表示,在训练GPT-5 这个模型之前,OpenAI 仍然有许多问题需要解决,比如困难的科学问题,和更多的计算能力,似乎在表示 GPT-5 还很遥远,但就在同月早些时候,OpenAI 宣布推出名为 GPT-4 Turbo 的大模型语言的新版本。

然后紧接着奥尔特曼在当周接受英国《金融时报》采访时开始透露,「某些更具变革性的东西,也在研发中,即 GPT-5」,但他不愿意透露更多的细节,只是说「我们正在努力做得更好」

image.png

也许有人会对奥尔特曼态度转变之快而感到惊讶,这与微软和谷歌的前世恩怨情仇有关,想了解更多的话,可以阅读下面这篇博文。

如果我们把时间拨回 2022年的 3月,也许谜团就会层层拨开。在那个时候,也就是 ChatGPT 刚推出的时候,AI 的风暴席卷了全网,全球进入了一场人工智能的狂欢,OpenAI 更是通过 ChatGPT-4 的发布,迅速占领了全球的 AI 市场,在此之前,这个领域还是一片空白。之后Google、 Facebook 等公司紧随其后相继推出了自己的大语言模型 Bard 和 LLaMA,之后大语言模型犹如雨后春笋,遍地发芽,但由于 ChatGPT 那让人惊讶的性能和叹为观止的人机会话能力,让 OpenAI 的江湖地位,似乎依然无人可以撼动。

image.png

然而就在一个月之后,Google 宣布 Gemini 面世,号称各项性能和多模态能力碾压 ChatGPT-4 。

OpenAI + 微软 vs 谷歌的军备竞赛的大幕,就此拉开。

03 横梗在 GPT-5 面前的障碍

据Altman介绍,GPT-5将是一个多模态模型,支持语音、图像、代码和视频,并在个性化和定制化功能方面实现重大更新,具备更强的推理能力和更高的准确性。当前大模型的通病——幻觉问题也将在GPT-5中得到解决。

image.png
来源:OpenAI

更多更好的数据。

根据 OpenAI 的报告,GPT-4 的幻觉远低于 GPT-3 但是这还不够。

image.png

要解决人工智能的通病——撒谎问题,关键在于需要更高质量更多的数据。奥尔特曼告诉英国《金融时报》,需要更多的数据。这些数据将来自公共的在线资源,和专有的私人数据集,这与 OpenAI 呼吁各组织在私人数据集上进行合作的工作一致。研究人员去年估计,可公开访问的高质量在线数据的供应将在 2026 年耗尽。这也另一个传言相互印证:OpenAI 部署了一个新的网络爬虫 GPTBot,通过从互联网收集公开信息来扩展其数据集。

更强的算力和天量资金。

DALL·E 2024-01-24 15.07.09 - On the left side of the image, there is a female robot with a face very similar to a human, eyes closed as if sleeping, yet with distinct robotic feat.png

奥尔特曼曾经公开抱怨资源匮乏,图形处理单元的市场由 Nvidia主导。OpenAI 公司从 2022年开始就在探索制造自己的人工智能芯片,甚至评估了潜在的收购目标,来解决训练 AI 模型所依赖的芯片短缺的问题。

根据未经证实的消息,GPT-4 拥有惊人的 1.8 万亿参数,训练使用了 25,000个 Nvidia H100 GPU。毫无疑问,训练 GPT-5 这个更为庞大的模型,需要消耗更为巨大的算力。
Nvidia 也非常适时的宣布推出 H200,号称是 H100 的升级版,计算速度是 H100的两倍,而 H100 芯片的成本在 25,000 到 40,000美元之间,保守估计,光是采购训练 GPT-4 用的芯片所需要的成本就高达 7.5 亿美元。训练 GPT -5 的消耗只会更多。

另一方面,运行 ChatGPT 也非常的昂贵。根据 Bernstein 分析师 Stacy Rasgon 的分析,每次查询的成本约为 4 美分,如果 ChatGPT 对话速度增长到 Google 搜索规模的十分之一,则每年运行的开销就达到惊人的 160亿美元,如果同时运行 GPT -4 和 GPT-5,简直不可想象。

安全的隐忧

clint-patterson-dYEuFB8KQJk-unsplash (2).jpg

根据著名的网络安全团队 Check Point Research 对 ChatGPT的测试结果,他们发现可以绕过 GPT-4 模型的防御,从而突破模型的安全边界。另一方面,安全专家甚至发现可以利用 GPT-4 来构建漏洞,甚至是被用于创建武器购物清单。能否在 GPT-5 解决这些问题,还是个未知数。

04 另一种可能性

DALL·E 2024-01-24 15.35.39 - Three adorable robot dogs joyfully running and chasing each other. The robot dog in the lead has 'GPT-4' printed on its body, the one in the middle ha.png

种种信息透露出,微软或许并不希望 GPT-5 尽快面世。

OpenAI 的大股东,微软创始人比尔 · 盖茨,在去年 10 月份接受德国商业报纸采访的时候,就曾经表示生成式人工智能基本已经达到了上限,自己并不期待 GPT-5 比 GPT-4 会好多少。目前我们能够看到的是,OpenAI 发布 GPT-4之后,他们正在不断的挖掘 GPT-4 的潜力,例如增加 ChatGPT 的插件功能,推出 ChatGPT Store,微软也将自家系统不断接入 ChatGPT ,所以更有可能的是,OpenAI 将会推出一个中间过渡版本,可以与 Gemini 一较高下的新版本,也许是 GPT-4.5。再以后,也许是 GPT-4.6。

但是毫无疑问的是,就如同 Iphone 不断受到来自安卓世界的挑战一样,苹果公司为了捍卫自己的市场份额,哪怕是一点点升级,也必须不断推出自己新的升级款产品,就如同奥尔特曼自己说的那样「实现下一步变革的技术尚未诞生」,但是也必须不断推出新的智能手机,毕竟新一代要比上一代要更好,人工智能这片蓝海的市场份额也要求他必须这样去做。

05 GPT-5 的未来

就如同 Iphone ,每一代只是变得更快更薄,屏幕也更大一样,虽然 OpenAI 也承认尚不知道如何对 GPT 进行“指数级的强大改进”,但是 OpenAI 作为估值超过 1000亿美元的公司,盈利的压力也同样巨大,所以即便只有稍微的改进,OpenAI 也必将全力以赴为新一轮的迭代创造盈利增长点。

或许会成长为通用人工智能?

image.png

虽然奥尔特曼明确表示,自己和自己的团队对通用人工智能很感兴趣,自己也希望有一天创建具有 AGI (通用人工智能)的系统,但大多数人工智能专家估计,离真正开发出通用人工智能,还有非常大的鸿沟,至少需要数年甚至数十年的时间努力。

更为强大的多模态能力

这几乎已经是板上钉钉的事情,Google 的 Gemini 号称在多模态方面已经超过了 ChatGPT-4,那么未来的 GPT-5,必然全面实现多模态能力(OpenAI 目前将这个能力较给 GPT’s 和 GPT-4 的插件来实现),也就是说以后我们将不用插件,就可以使用 GPT-5 原生就拥有的文本、图像、音频、视频 和 3D模型 等内容。虽然尚未由确凿的证据,但接受这些多介质的输入,并且按照人类的需求进行相应的格式输出,必将是 GPT-5 带来的一种非常丰富的交互式体验,让人类与机器的交互在后 Web2.0时代,再上一个台阶。

更经济更有效的扩展

随着 Claude Pro 的发布,Anthropic 重新定义了上下文的长度,它一次性处理的令牌(token)达到了 20万个,是 GPT-4 那 3.2 万个的6倍,刷新了行业的认知,也树立了新的榜样。使得很多利用生成式人工智能工具进行代码编写的工作,得到足够的代码上下文,同时也为论文写作等需要撰写和阅读长文的工作,提供了更大更好的支撑。

面对这样的挑战,OpenAI 自然也不会落后,他们必将提出更高的行业标准,从而持续让自己保持行业领头羊的位置。同时他们需要降低自己的训练费用,让自己始终在创新和商用性上保持一个可以持续发展的平衡。

同时 GPT 应用商店的推出,必将鼓励更多的借助 GPT 的平台进行更有创意的开发,或许 GPT Store 将成为继苹果的 App Store 和 Google Play 的第三个让个人开发者狂欢的自由软件交易市场。

image.png

06 新的变革

无论是谷歌、OpenAI、Facebook(Meta)或者是其他号称要干掉 OpenAI 成为新的科技界江湖大佬的公司,目前均在大预言模型的赛道上进行角逐,比拼财力、算力、更好的安全性、更低的训练和使用成本,就如同埃隆 · 马斯克开辟了电动汽车的赛道,他们也必将在这个赛道上进行生死竞速,直到人工智能的领域内出现新的赛道,或者中途有人退出。在这场全力以赴的角逐中,你认为谁会笑到最后呢?