Anthropic、OpenAI双双节衣缩食!AI巨头砍项目、限token、丢客户

2026-04-13 2 0

国外苹果ID 🔒点击进入购买✅ 海外各种账号

编译 | 佳扬

编辑 | 云鹏

智东西4月13日消息,据华尔街日报报道,随着全球AI热潮持续升温,算力供给正日益趋紧。

行业头部的Anthropic,不仅陷入系统频繁宕机、服务稳定性大幅下滑的困境,还出现用户投诉、部分企业客户流失的问题。截至4月8日,Anthropic公司的Claude API在过去90天内的正常运行时间为98.95%低于软件公司通常向客户承诺的99.99%

Claude API服务中断时间(来源:华尔街日报)

华尔街日报3月29日的报道曾指出,OpenAI因算力紧张被迫收缩业务战线,放弃此前备受市场关注的Sora视频生成应用,将有限算力集中投入至代号“Spud”的新AI模型研发中,优先保障核心业务的稳步推进。

与此同时,高端GPU租赁价格迎来惊人涨幅,租用英伟达最先进的Blackwell系列芯片,每小时费用已达4.08美元,较两个月前的2.75美元上涨48%,短短两个月内涨幅接近五成

一、AI巨头纷纷约束算力

算力短缺已成为头部AI企业发展的核心阻碍,多家巨头不得不通过收缩业务、限制用户资源等方式应对危机。Anthropic首席财务官莎拉·弗莱尔在近期投资者访谈中直言,“我确实花了很多时间寻找任何可用的临时计算资源。目前,由于计算资源不足,我们不得不做出一些非常艰难的取舍,放弃一些我们正在推进的项目。”

算力需求的爆发式增长是这场危机的直接推手。数据显示,OpenAI API的token使用量从去年10月的每分钟60亿次,飙升至今年3月下旬的150亿次,短短五个月内增幅达150%。为应对算力缺口,OpenAI已放弃此前备受市场关注的Sora视频生成应用,将有限的算力集中投入到代号为“Spud”的新AI模型及企业级产品开发中,优先保障核心业务推进。

作为OpenAI的主要竞争对手,Anthropic也面临着相似问题。Anthropic的营收预期一路飙升,从最初预计2025年底实现90亿美元年化收入,到今年2月攀升至140亿美元,两个月后更是翻倍至300亿美元。

但3月下旬,Anthropic被迫出台限制措施,宣布在太平洋时间工作日早5点至11点的高峰时段,限制用户可使用的token数量。这一举措引发用户广泛不满,多位用户在X论坛上抱怨资源消耗过快,有用户表示,此前数周都未用完的token上限,如今仅45分钟就已耗尽。对此,Claude Code创始人兼负责人Boris Cherny在X上回应称,公司正全力应对Claude持续增长的需求,产能作为核心资源需谨慎管理,未来将优先保障核心用户与API使用者的体验。

二、越来越贵的算力

纽约数据提供商Ornn的数据显示,近几个月来,英伟达全系列GPU产品的现货市场价格大幅上涨,尤其是数据中心云端访问的GPU价格,涨幅尤为明显。

算力需求的激增,直接推动行业定价机制调整与长期合同绑定。去年年底,全球最大上市AI云公司之一的CoreWeave将GPU租赁价格上调20%以上,同时将小型客户的服务合同期限从1年延长至至少3年。上月底,美国银行分析师恢复对CoreWeave的“买入”评级,并预测至少到2029年,该公司的算力服务需求仍将持续超过供给,算力紧张局面难以缓解。

具体来看,高端GPU的租赁价格涨幅惊人。根据Ornn计算的价格指数,租用英伟达最先进的Blackwell系列芯片一小时的费用已达4.08美元,较两个月前的2.75美元上涨48%,短短两个月内接近2倍涨幅,凸显算力资源的稀缺性。

“我经营这家公司五年多来,从未见过如此严重的容量短缺。”云基础设施公司Vultr首席执行官JJ Kardwell直言,算力短缺的核心症结并非企业不愿部署更多设备,而是交付周期过长。数据中心建设耗时久,且截至2026年的可用电力已被全部预订一空,短期内无法通过新增设备缓解缺口。

三、算力短缺导致AI服务质量低,客户流失

算力短缺不仅推高成本,更直接影响AI服务的稳定性,甚至导致企业客户流失。自2月中旬以来,Anthropic的系统故障愈发频繁,部分企业客户已开始转向其他AI模型提供商。软件开发平台Retool创始人兼首席执行官David Hsu表示,他此前一直倾向于使用Anthropic的Opus 4.6模型驱动公司AI代理工具,认为其最适配企业级应用,但近期因Anthropic服务器频繁不稳定,已转而采用OpenAI的模型

互联网核心服务的可靠性通常以“9”为衡量标准,四个“9”(99.99%的正常运行时间)是软件公司向客户承诺的常规标准,但截至4月8日,Anthropic的Claude API在过去90天内的正常运行时间仅为98.95%。

“这不正常。”人工智能推理初创公司Baseten联合创始人兼首席技术官Amir Haghighat评价道,AWS、数据库、RDS或Stripe等核心服务,均需保障极高的弹性和正常运行时间,而当前AI行业的服务质量与之相差甚远,“没有企业愿意为应用程序的智能服务,选择稳定性如此之差的提供商”。

结语:AI的算力竞争

当技术突破的速度超越基础设施建设的步伐,最终考验的不仅是企业的技术实力,更是整个产业链在算力供需失衡下的应变能力。

对于押注AI的科技巨头而言,如何在项目取舍、成本控制与服务质量之间找到平衡,是下一步的关键问题。

相关文章

万兴剧厂闪电上线满血版Seedance2.0全能力 万兴科技卡位AI视频工业化开拓新曲线
新一代理想L9无伪实车曝光:整体变圆润 首次用上双色车漆
消息称三星电子2nm当前良率在55%上下:无法竞争大型代工订单
亚马逊又拿到船票了,这次是芯片
一场黑客松背后,上海正形成更多AI创业“连接器”
从搜索框到对话框 当AI深入工作和生活,谁来为它的答案负责?

发布评论