OpenAI 的多云未来:携手 AWS 与 Google Cloud

深入解析 OpenAI 为降低风险、获得竞争优势而进行的多云基础架构战略转型。

Kyle ChungKyle Chung

为什么 OpenAI 要在多云领域分散投资,以及为什么你也应该这样做

OpenAI 最近备受瞩目的云计算协议,包括与亚马逊网络服务(AWS)达成的 380 亿美元巨额交易,标志着一项至关重要的战略演变:向多云基础设施的刻意转型。虽然其与微软 Azure 的基础合作关系仍然是基石,但 OpenAI 正通过整合 AWS 和谷歌云等主要参与者,积极实现其计算骨干的多样化。

这种多云战略不仅仅是增加更多服务器;这是一个经过深思熟虑的举措,旨在确保其未来、规避巨大风险并加速实现通用人工智能(AGI)的竞赛。

主要观点

  • 风险规避: 避免供应商锁定和单点故障。如果一个供应商出现故障,可以在其他平台上继续运营。
  • 硬件多样性: 可以从不同的供应商那里获得专门的硬件(如谷歌的 TPU),从而可以为特定任务选择性能最佳、成本效益最高的选项。
  • 谈判能力: 将支出分散到多个供应商可以获得更好的定价、条款和灵活性,以适应技术的发展。

多云策略的核心驱动力

这种昂贵的多样化背后的核心驱动力是对计算能力永不满足且不断增长的需求。正如 OpenAI 首席执行官 Sam Altman 所说:"扩展前沿人工智能需要大规模、可靠的计算能力。"

训练和运行下一代人工智能模型的复杂性需要任何单一供应商都无法独家提供的基础设施规模。这促使 OpenAI 将其庞大的基础设施投资(据报道是 1.4 万亿美元更大承诺的一部分)分散到行业巨头之间。


为何这对开发者很重要:与 Zeabur 的理念一致

尽管 Zeabur 所需的计算能力不像 OpenAI 那样庞大,但其一些理念与 OpenAI 是一致的,以下是这些一致之处:

1. 降低风险和避免供应商锁定

这是 Zeabur 最关键、最有价值的方面——战略性风险规避。仅仅依赖单一云供应商会造成单点故障和巨大的依赖性。

通过引入 AWS 和谷歌云,OpenAI 确保自己不会受制于任何一个合作伙伴的能力、定价或技术路线图。这种多样化可以增强弹性:如果一个供应商遇到停机或供应链问题,OpenAI 的运营可以在其他平台上继续。

Zeabur 也提供同样的优势。 如果某个地区的云供应商服务器宕机,你可以一键复制整个项目并将其重新部署到另一个适用的地区或云供应商。

2. 接触多样化且具竞争力的硬件生态系统

不同的云供应商提供独特的优势和专门的硬件。例如,谷歌云提供为人工智能工作负载优化的 TPU,而其他供应商则在不同领域表现出色。这使得 OpenAI 可以为特定任务选择性能最佳、成本效益最高的硬件。

Zeabur 通过在多个地区和供应商提供不同的 VPS 选项,为开发人员带来了同样的优势,使用户能够将应用程序部署在最适合其需求的基础设施上——无论是优先考虑性能、成本还是地理位置。

3. 获得战略优势和灵活性

在多云环境中运营赋予了 OpenAI 巨大的谈判能力。通过分散其巨额支出,它可以从合作伙伴那里获得更好的定价和条款。这种新获得的灵活性使这家人工智能领导者能够更加敏捷,随着其模型的发展以及不同云供应商提供新技术而调整其基础设施。

同样,Zeabur 与包括 DigitalOcean 在内的多家云供应商合作,使我们能够代表用户谈判更好的条款和定价。这种多供应商方法确保 Zeabur 用户能够从有竞争力的定价中受益,并利用不同云平台的优势。


结论

虽然与微软的合作对 OpenAI 的崛起至关重要,但转向包括 AWS、谷歌云、甲骨文等在内的多云战略是一次必要且战略性的成熟。这是对前沿人工智能开发巨大需求的清醒回应,旨在确保弹性、促进创新,并保障构建智能未来所需的庞大计算能力。