护航MiniMax、驯服小龙虾，腾讯云的AI Agent“数字总部”亮了纸飞机TG账号批发老号购买-TG账号自助发货平台

作者｜三北

编辑｜漠影

2026年开年，开源AI Agent框架OpenClaw火遍全球。它像一只不知疲倦的“龙虾”——有记忆、能动手、低门槛，让无数人第一次直观感受到AI真的能干活。

然而，当企业从“请几只试试”到“入职几万只”，画风突变。这些能力强但没受过规训的Agent，在共享的企业基础设施上7×24小时自主行动，带来的是失控的恐惧：升级失忆、密钥泄露、脚本失控、预算超限……

用马斯克的话来说，这就好比把上膛的枪交给了一只猴子去用。

马斯克X发文截图

面对龙虾“横爬”的难题，腾讯云提供了新解法——为Agent打造专属“数字办公环境”——Agent Runtime沙箱方案，试图为每只“龙虾”装上“防爆箱”和“交通规则”，让企业能够在不削弱龙虾能力的前提下，实现安全可控的大规模部署。

该技术目前已在多家头部企业落地，比如其已在知名大模型公司MiniMax的强化学习训练等场景验证，支持十万级并发、百万级吞吐零事故训练。

其助力MiniMax的强化学习框架Forge，在大规模Agent训练场景下做到“环境秒开、用完即删”，让训练更快、更稳、成本更低，为“龙虾军团”的企业级落地，写下了坚实的技术注脚。

腾讯云已宣布将Agent Runtime底层沙箱技术Cube开源，为企业提供更灵活的部署服务。

一、打通三道坎，让企业真正接得住、管得好AI员工

OpenClaw这类AI Agent正快速被员工自发用起来，企业也看到了规模化打造“AI员工”的契机。但真要让几万只“龙虾”安全上岗，迎面就是三道躲不开的课题。

第一，现有基础设施敢不敢接？Agent有状态、能动手、7×24小时自主行动，几万个实例跑在共享环境里，状态怎么管？行为怎么控？出了事怎么溯源？密钥和高危权限散落各处，风险谁来兜？

第二，跑了半年对企业有什么沉淀？技能、记忆、协作关系都锁在个人实例里，人走茶凉，Agent之间互不认识，没法协同。企业投入了算力，最后什么都没留下。

第三，组织真能用起来吗？哪些操作要审批、流程怎么改、Token花了多少值不值、Agent 之间怎么协作——这些问题不解决，AI就永远是“玩具”。

腾讯云Agent Runtime的企业级Agent治理方案，正是为了打通这三道坎，让企业真正接得住、管得好AI员工。

1、让基础设施扛得住

这里解决的是“敢不敢接”的问题，核心是两件事：Agent状态管理和行为治理。

状态管理方面，Agent不是无状态服务，它会积累依赖、缓存、上下文。一直跑着成本太高，销毁又丢状态。Agent Runtime把状态和算力拆开。空闲时释放算力，请求来时原地恢复整个文件系统，不需要预设 Agent 把东西写在哪。再加上任意时刻可做快照，一个调教好的 Agent能随时克隆成一百个，经验可复制、可继承。

行为治理方面，每个Agent跑在独立VM沙箱里，彼此隔离，一个出问题不影响其他。凭证从不落地，由网关按需注入、用完即销毁；所有外部访问统一过网关，高危操作可配置审批或拦截。全链路审计记录每一步谁调了什么模型、花了多少Token。这样一来，Agent的能力不削弱，但每一步都运行在可控、可追溯的边界里。

2、数据资产留得下

人走了，经验不能丢；框架换了，积累不能废。

Agent Runtime让技能（Skill）、记忆（Memory）、协作关系这三类资产从第一天起就独立于框架存储：技能以制品形式入库，版本管理、权限可控，任意实例可引用；记忆从本地同步上云，跨实例共享，新Agent能继承老员工的积累；协作关系通过 Gateway做服务发现和路由，不依赖框架私有协议。

老张离职了，他调教好的合同审核技能和行业经验还在，新人入职直接继承。知识和能力跟着企业走，不跟着个人或某个开源项目走。

3、组织接得住用得好

技术能跑通是一回事，组织真能用起来是另一回事。

Agent Runtime为企业提供了全局管控的能力。平台团队可以把Agent的初始化脚本、镜像、配置封装成模板，统一管理版本变更；通过策略控制所有Agent的工具调用、数据访问、LLM调用等行为边界；按实例、用户、组织三层设置Token额度，成本一目了然。

但这只是起点，Agent之间怎么协同、工作流程怎么改、考核和预算怎么跟上，不同行业还在探索。Runtime先把底座搭好，让组织先“接得住”，后续才能“用得好”。

有了这三大特性，企业才敢让几万只“龙虾”安心上岗——不是削掉它们的能力，而是让每一步都运行在可管、可控、可继承的底座上。

二、百万级吞吐、十万级并发，MiniMax“尝鲜”实证

腾讯云Agent Runtime沙箱产品早已获得外部头部厂商认可，比如已率先在MiniMax等知名大模型厂商的核心训练场景中成功落地。

自2022年初成立起，MiniMax自研了MiniMax M2.7、Hailuo 2.3等多模态大模型，并推出Forge智能体强化学习框架，提升模型复杂任务能力。AGI发展关键期，Agentic RL需海量交互试错，对计算资源的安全沙箱、弹性调度与并发能力提出极高要求。

为此，MiniMax与腾讯云深度合作，基于腾讯云Agent Runtime沙箱搭建Agent Infra，实现大规模交互环境高效调度与安全隔离，显著提升Forge训练效率与稳定性。

Forge: 大规模原生Agent RL系统-MiniMax News

从场景痛点来看，Agent强化学习训练面临极致挑战：MiniMax的“Forge” Agentic RL框架进行大规模强化学习训练时，需要模拟海量并发交互环境，让Agent在真实、可交互的执行环境中进行探索、试错与交互。这种高强度的智能体自主进化，要求底层计算资源必须具备高并发、绝对安全隔离的沙箱环境，这对基础设施的弹性调度、安全隔离与大规模并发性能提出了前所未有的要求。

Agentic RL对Infra的四大核心诉求

之所以被MiniMax选中，腾讯云Agent沙箱在此场景中展现出突出的优势：

1、毫秒级启动：80ms极速启动，P99延迟

资源池化与快照恢复：80ms交付可用沙箱

2、百万级吞吐、十万级并发：每分钟可并发创建六十万沙箱实例，成功率高达99.99%，完美承载Agentic RL的海量试错需求。依托腾讯云百万核资源池，系统可每分钟扩容超十万实例，从容应对高并发挑战。

腾讯云Agent Runtime支持每分钟60W沙箱创建

3、复杂环境模拟：支持代码、浏览器甚至OSWorld等全场景沙箱，为模型训练提供媲美真实世界的“练兵场”。无论是Browser Use Agent的网页操作，还是Computer Use Agent的桌面办公，都能在安全隔离的环境中模拟。

4、Agent First工具链：提供对外开源的SDK、API、CLI、Cookbook，兼容E2B协议，并深度集成主流训练框架，让MiniMax团队能无缝对接。

MiniMax Agent首席架构师阿岛提到：“腾讯云的沙箱产品，一开始就是面向我们这样的场景去设计的。”

“一开始我们在K8s上跑，发现真的不行，并发完全起不来。后来我们和腾讯云走到一起，有了沙箱方案。这就是产业、行业在最前沿的AI技术上，需要的基础设施和能力。”阿岛称，“在M2.7开始，我们已经能让Agent自主驱动绝大部分Agentic RL过程。这里面任何一个环节卡住，最有可能卡住的就是沙箱环节，它就会极大的影响我的模型的迭代。腾讯云的沙箱高性能、高稳定性、低延迟，对我们的训练迭代速度至关重要。”

MiniMax的案例证明，腾讯云Agent Runtime一方面是支持Agent运行的“数字总部”，更深层次，其是支持最前沿AI技术训练的生产级基础设施。

四类沙箱×多种交互方式，覆盖主流Agentic RL场景

无论是企业里成千上万只OpenClaw的日常上岗，还是Agentic RL场景下百万级吞吐、十万级并发的极限训练，其实都在验证同一件事，Agent时代需要一种不同于传统云计算的新型运行底座。

结语：AI Agent加速普及，可控、可用是关键

OpenClaw的爆火，证明了AI Agent的生产力价值，也提醒我们安全可控的重要性。让每一只龙虾都在“跑得稳、管得住、看得清、养得起”的规矩下安全运行，企业才能真正从“试用AI”走向“与AI协同工作”。

从护航MiniMax模型训练，到给OpenClaw龙虾上规矩，腾讯云正以扎实的底层能力，为智能体时代铺就安全可控的基础设施。当每一只AI龙虾都能在“防爆箱”中安心工作，企业大规模拥抱AI的爆发时刻，才真正到来。

护航MiniMax、驯服小龙虾，腾讯云的AI Agent“数字总部”亮了

相关文章

发布评论取消回复

护航MiniMax、驯服小龙虾，腾讯云的AI Agent“数字总部”亮了

相关文章

发布评论 取消回复

发布评论取消回复