护航MiniMax、驯服小龙虾,腾讯云的AI Agent“数字总部”亮了

2026-04-12 3 0

国外苹果ID 🔒点击进入购买✅ 海外各种账号

作者|三北

编辑|漠影

2026年开年,开源AI Agent框架OpenClaw火遍全球。它像一只不知疲倦的“龙虾”——有记忆、能动手、低门槛,让无数人第一次直观感受到AI真的能干活。

然而,当企业从“请几只试试”到“入职几万只”,画风突变。这些能力强但没受过规训的Agent,在共享的企业基础设施上7×24小时自主行动,带来的是失控的恐惧:升级失忆、密钥泄露、脚本失控、预算超限……

用马斯克的话来说,这就好比把上膛的枪交给了一只猴子去用。

马斯克X发文截图

面对龙虾“横爬”的难题,腾讯云提供了新解法——为Agent打造专属“数字办公环境”——Agent Runtime沙箱方案,试图为每只“龙虾”装上“防爆箱”和“交通规则”,让企业能够在不削弱龙虾能力的前提下,实现安全可控的大规模部署。

该技术目前已在多家头部企业落地,比如其已在知名大模型公司MiniMax的强化学习训练等场景验证,支持十万级并发、百万级吞吐零事故训练。

其助力MiniMax的强化学习框架Forge,在大规模Agent训练场景下做到“环境秒开、用完即删”,让训练更快、更稳、成本更低,为“龙虾军团”的企业级落地,写下了坚实的技术注脚。

腾讯云已宣布将Agent Runtime底层沙箱技术Cube开源,为企业提供更灵活的部署服务。

一、打通三道坎,让企业真正接得住、管得好AI员工

OpenClaw这类AI Agent正快速被员工自发用起来,企业也看到了规模化打造“AI员工”的契机。但真要让几万只“龙虾”安全上岗,迎面就是三道躲不开的课题。

第一,现有基础设施敢不敢接?Agent有状态、能动手、7×24小时自主行动,几万个实例跑在共享环境里,状态怎么管?行为怎么控?出了事怎么溯源?密钥和高危权限散落各处,风险谁来兜?

第二,跑了半年对企业有什么沉淀?技能、记忆、协作关系都锁在个人实例里,人走茶凉,Agent之间互不认识,没法协同。企业投入了算力,最后什么都没留下。

第三,组织真能用起来吗?哪些操作要审批、流程怎么改、Token花了多少值不值、Agent 之间怎么协作——这些问题不解决,AI就永远是“玩具”。

腾讯云Agent Runtime的企业级Agent治理方案,正是为了打通这三道坎,让企业真正接得住、管得好AI员工。

1、让基础设施扛得住

这里解决的是“敢不敢接”的问题,核心是两件事Agent状态管理行为治理

状态管理方面,Agent不是无状态服务,它会积累依赖、缓存、上下文。一直跑着成本太高,销毁又丢状态。Agent Runtime把状态和算力拆开。空闲时释放算力,请求来时原地恢复整个文件系统,不需要预设 Agent 把东西写在哪。再加上任意时刻可做快照,一个调教好的 Agent能随时克隆成一百个,经验可复制、可继承。

行为治理方面,每个Agent跑在独立VM沙箱里,彼此隔离,一个出问题不影响其他。凭证从不落地,由网关按需注入、用完即销毁;所有外部访问统一过网关,高危操作可配置审批或拦截。全链路审计记录每一步谁调了什么模型、花了多少Token。这样一来,Agent的能力不削弱,但每一步都运行在可控、可追溯的边界里。

2、数据资产留得下

人走了,经验不能丢;框架换了,积累不能废。

Agent Runtime让技能(Skill)、记忆(Memory)、协作关系这三类资产从第一天起就独立于框架存储:技能以制品形式入库,版本管理、权限可控,任意实例可引用;记忆从本地同步上云,跨实例共享,新Agent能继承老员工的积累;协作关系通过 Gateway做服务发现和路由,不依赖框架私有协议。

老张离职了,他调教好的合同审核技能和行业经验还在,新人入职直接继承。知识和能力跟着企业走,不跟着个人或某个开源项目走。

3、组织接得住用得好

技术能跑通是一回事,组织真能用起来是另一回事。

Agent Runtime为企业提供了全局管控的能力。平台团队可以把Agent的初始化脚本、镜像、配置封装成模板,统一管理版本变更;通过策略控制所有Agent的工具调用、数据访问、LLM调用等行为边界;按实例、用户、组织三层设置Token额度,成本一目了然。

但这只是起点,Agent之间怎么协同、工作流程怎么改、考核和预算怎么跟上,不同行业还在探索。Runtime先把底座搭好,让组织先“接得住”,后续才能“用得好”。

有了这三大特性,企业才敢让几万只“龙虾”安心上岗——不是削掉它们的能力,而是让每一步都运行在可管、可控、可继承的底座上。

二、百万级吞吐、十万级并发,MiniMax“尝鲜”实证

腾讯云Agent Runtime沙箱产品早已获得外部头部厂商认可,比如已率先在MiniMax等知名大模型厂商的核心训练场景中成功落地。

自2022年初成立起,MiniMax自研了MiniMax M2.7、Hailuo 2.3等多模态大模型,并推出Forge智能体强化学习框架,提升模型复杂任务能力。AGI发展关键期,Agentic RL需海量交互试错,对计算资源的安全沙箱、弹性调度与并发能力提出极高要求。

为此,MiniMax与腾讯云深度合作,基于腾讯云Agent Runtime沙箱搭建Agent Infra,实现大规模交互环境高效调度与安全隔离,显著提升Forge训练效率与稳定性。

Forge: 大规模原生Agent RL系统-MiniMax News

从场景痛点来看,Agent强化学习训练面临极致挑战:MiniMax的“Forge” Agentic RL框架进行大规模强化学习训练时,需要模拟海量并发交互环境,让Agent在真实、可交互的执行环境中进行探索、试错与交互。这种高强度的智能体自主进化,要求底层计算资源必须具备高并发、绝对安全隔离的沙箱环境,这对基础设施的弹性调度、安全隔离与大规模并发性能提出了前所未有的要求。

Agentic RL对Infra的四大核心诉求

之所以被MiniMax选中,腾讯云Agent沙箱在此场景中展现出突出的优势:

1、毫秒级启动:80ms极速启动,P99延迟

资源池化与快照恢复:80ms交付可用沙箱

2、百万级吞吐、十万级并发:每分钟可并发创建六十万沙箱实例,成功率高达99.99%,完美承载Agentic RL的海量试错需求。依托腾讯云百万核资源池,系统可每分钟扩容超十万实例,从容应对高并发挑战。

腾讯云Agent Runtime支持每分钟60W沙箱创建

3、复杂环境模拟:支持代码、浏览器甚至OSWorld等全场景沙箱,为模型训练提供媲美真实世界的“练兵场”。无论是Browser Use Agent的网页操作,还是Computer Use Agent的桌面办公,都能在安全隔离的环境中模拟。

4、Agent First工具链:提供对外开源的SDK、API、CLI、Cookbook,兼容E2B协议,并深度集成主流训练框架,让MiniMax团队能无缝对接。

MiniMax Agent首席架构师阿岛提到:“腾讯云的沙箱产品,一开始就是面向我们这样的场景去设计的。”

“一开始我们在K8s上跑,发现真的不行,并发完全起不来。后来我们和腾讯云走到一起,有了沙箱方案。这就是产业、行业在最前沿的AI技术上,需要的基础设施和能力。”阿岛称,“在M2.7开始,我们已经能让Agent自主驱动绝大部分Agentic RL过程。这里面任何一个环节卡住,最有可能卡住的就是沙箱环节,它就会极大的影响我的模型的迭代。腾讯云的沙箱高性能、高稳定性、低延迟,对我们的训练迭代速度至关重要。”

MiniMax的案例证明,腾讯云Agent Runtime一方面是支持Agent运行的“数字总部”,更深层次,其是支持最前沿AI技术训练的生产级基础设施。

四类沙箱×多种交互方式,覆盖主流Agentic RL场景

无论是企业里成千上万只OpenClaw的日常上岗,还是Agentic RL场景下百万级吞吐、十万级并发的极限训练,其实都在验证同一件事,Agent时代需要一种不同于传统云计算的新型运行底座。

结语:AI Agent加速普及,可控、可用是关键

OpenClaw的爆火,证明了AI Agent的生产力价值,也提醒我们安全可控的重要性。让每一只龙虾都在“跑得稳、管得住、看得清、养得起”的规矩下安全运行,企业才能真正从“试用AI”走向“与AI协同工作”。

从护航MiniMax模型训练,到给OpenClaw龙虾上规矩,腾讯云正以扎实的底层能力,为智能体时代铺就安全可控的基础设施。当每一只AI龙虾都能在“防爆箱”中安心工作,企业大规模拥抱AI的爆发时刻,才真正到来。

相关文章

加密货币深夜全线跳水
中科院系AI企业中科闻歌港股IPO备案通过,决策智能市占率领先
比特币跌破71000美元
小K快评:汪滔不必为员工离职创业焦虑,该去的去,该来的来
AI语聊软件暗藏大尺度色情内容,境外涉黄AI软件绕过监管流入国内
凌晨,奥特曼豪宅被炸!他发照片了

发布评论