/ AI资讯, 行业观察, 基础设施, Agent

Agent 时代的 AI,正在拆掉“同一套栈跑所有活”的旧假设

#AI #Agent #AWS #Meta #Anthropic #Ai2 #Infrastructure #Nvidia #Microsoft #Google #Inference #Compute

这两天如果只盯着“又发了什么模型”,很容易错过一个更底层的变化。

把 Anthropic、AWS、Google Cloud、Meta、Microsoft、NVIDIA 和 Ai2 这批官方信号放在一起看,我觉得真正值得写的新中心是:

Agent 时代的 AI,正在拆掉“同一套栈跑所有活”的旧假设。

过去大家常把 AI 基础设施理解成一条比较直线的链路:

  • 训练更大的模型
  • 部署更多 GPU
  • 接更多用户请求

但最近越来越多官方动作都在说明,下一阶段不是靠“一种模型 + 一类芯片 + 一套云架构”吃掉所有任务。

而是开始按不同工作负载重新拆分:

  • 哪些任务需要长期推理和状态保持
  • 哪些任务更吃 CPU 编排和工具调用
  • 哪些任务适合定制硅和推理优化
  • 哪些任务必须进入企业治理和可观测运行时
  • 哪些任务还要落到制造、机器人和物理系统里

也就是说,AI 产业正在从“堆统一算力”,走向 按工作类型重组整套运行栈

这件事,我觉得比一次模型升级更重要。

一、Meta 直接把信号说透了,agentic AI 不只是 GPU 问题

Meta 4 月 24 日的官方公告特别值得反复看。

它宣布与 AWS 合作,把 数千万个 AWS Graviton cores 带进自己的计算组合,而且写得很明确,这些核心是为了支持 agentic AI workloads

这条消息最有价值的地方,不是“Meta 又多拿了一批算力”,而是它等于公开承认了一件事:

下一代 agent 系统里,有一大块关键负载,并不只是 GPU 推理本身。

Meta 自己强调的是 CPU-intensive workloads behind agentic AI。

这说明随着 AI 从“生成一次答案”走向“持续推理、规划、调用工具、执行任务”,系统瓶颈正在分散到更多层:

  • 任务编排
  • 状态维护
  • 数据搬运
  • 工具调用
  • 工作流控制
  • 长链路执行

也因此,最优架构不再是“所有东西都往 GPU 上压”,而是要开始做 workload-aware 的分工。

这跟过去那种更单一的 GPU 叙事,已经不太一样了。

二、Anthropic 也在证明,frontier lab 正在主动做多芯片、多云、多代际匹配

Anthropic 最近两条官方公告,几乎把这种变化写成了基础设施策略。

一条是它和 Amazon 扩大合作,锁定 up to 5GW 的新算力,并明确覆盖 Graviton、Trainium2 到 Trainium4,还会把推理能力继续往亚洲和欧洲扩。

另一条是它和 Google、Broadcom 签下 multiple gigawatts of next-generation TPU capacity

更关键的是,Anthropic 在官方文案里没有把自己描述成“押注某一种硬件”,而是直接写明 Claude 同时运行在:

  • AWS Trainium
  • Google TPUs
  • NVIDIA GPUs

这背后真正值得记住的变化是:

frontier model 公司已经不再假设一种芯片路线可以覆盖训练、推理、分发和企业交付的全部需求。

它们开始像做投资组合一样做基础设施组合。

哪类任务适合哪类硬件,哪类客户适合哪朵云,哪类地区需要哪种部署弹性,正在变成核心能力。

这不是简单的“多买点卡”,而是 把 AI 运行权拆成不同负载、不同地域、不同商业接口来组织

三、Google 和 Microsoft 在做的,其实是“把 agent 栈变成操作系统”

Google Cloud Next ‘26 的官方表述很直接。

它不再只是讲模型,而是整套地讲:

  • Gemini Enterprise Agent Platform
  • long-running agents
  • Agent Designer
  • Inbox for managing agent activity
  • Agentic Data Cloud
  • Agentic Defense
  • 8th Generation TPUs 和新的网络、存储能力

这些词放在一起,其实已经不是传统 SaaS 产品语言,而更像一种新的企业运行环境语言。

Google 想卖的,不只是一个更强的模型,而是:

一套可以构建、治理、观察、扩展和保护 agent 的企业操作层。

Microsoft 的口径也几乎一致。

它在 GTC 的官方博客里把 Microsoft Foundry 直接定义成用于 build, deploy and operate AI at enterprise scale 的系统,并强调:

  • production-ready AI agents
  • Foundry Agent Service
  • Foundry Control Plane observability
  • inference-heavy, reasoning-based workloads
  • simulation to real-world operations

这很重要。

因为这说明头部云和平台厂商都在接受同一个现实:

Agent 真正落地以后,模型不再只是 API,而要进入一个像“控制平面 + 运行时 + 观测层”的体系。

而一旦进入这个体系,就天然会拉动不同芯片、不同网络和不同安全层一起重组。

四、AWS 的最新动作说明,工作负载拆分已经压到具体岗位和具体数据域里

AWS 这两天的官方博客里,我觉得最值得注意的,不只是 frontier agents,而是它开始把 agentic workspace 压到更具体的业务负载上。

比如 4 月 24 日它写的 Building Workforce AI Agents with Visier and Amazon Quick,本质上是在展示一个非常明确的新产品方向:

  • 把 live workforce data 接进 agent
  • 把组织政策、预算、历史上下文一起接进来
  • 让 HR、财务这些具体角色在同一个 agentic workspace 里直接做判断和行动

这里有个很关键的变化:

AI 不再只是“回答一个问题”,而是开始围绕某类工作负载组织专门的上下文层。

也就是说,下一步竞争不是单纯“模型能力谁更强”,而是:

  • 谁能把特定工作域的数据接进来
  • 谁能给这类工作配对最合适的运行时
  • 谁能让 agent 既有推理能力,又有组织上下文和行动接口

这就是 workload split 在应用层的样子。

五、NVIDIA 和 Ai2 从另一面说明,AI 还在继续分化到工业世界和科研世界

NVIDIA 在 Hannover Messe 2026 的官方文章里,给出的画面非常清楚。

它谈的已经不是一个通用聊天助手,而是:

  • AI physics
  • agentic design and engineering
  • real-time simulation
  • vision AI agents
  • humanoid robots in factories
  • sovereign foundation for industrial scale

这意味着工业侧的 AI 工作负载,又是另一套完全不同的要求。

它更强调:

  • 仿真
  • 实时性
  • 物理约束
  • 机器人编排
  • 工厂级安全和主权底座

Ai2 最近的官方研究更新也给了一个重要提醒。

一边它说 科学发现 agent 在很多问题上仍然会失手,另一边它又继续推进像 OlmoEarth embeddings 这类可以直接进入下游分析的能力。

这说明科研世界也不会被“一个通用大模型”轻松统治。

相反,它会继续要求:

  • 更适合专业任务的评估体系
  • 更贴近领域流程的工具链
  • 更能接住下游分析的中间表示

所以不管是工厂还是科研,趋势都一样:

AI 不在收敛成一个单点产品,而是在分化成很多种工作负载原生系统。

六、为什么我觉得这是这两天真正的新中心

因为它和前面几轮大家熟悉的叙事不太一样。

以前更常见的理解是:

  • 模型越来越强
  • GPU 越来越多
  • 云越来越大
  • agent 会越来越能干

这些当然都还对。

但现在官方信号已经更进一步,开始逼着我们换一个观察框架。

真正值得盯住的问题,不再只是“谁最强”,而是:

  • 谁最懂不同工作负载分别需要什么栈
  • 谁能把 CPU、GPU、TPU、定制硅和云环境更细地拼起来
  • 谁能让 long-running agents 在企业里被治理、被观测、被信任
  • 谁能把 AI 从办公室延伸到科研、制造、机器人和物理系统

这意味着,AI 行业正在慢慢离开“统一大模型吃天下”的想象,进入一个更现实、也更像真正产业化的阶段:

不同任务,会催生不同栈;不同栈,才会催生下一阶段真正可持续的 AI 系统。

如果这条判断成立,那未来的赢家未必只是拥有最强模型的人。

更可能是那些最早学会按工作负载重组模型、芯片、云、运行时和行业接口的人。

我觉得,这才是这批官方信号里最值得记住的新变化。

参考的核心官方信号

  • Meta Newsroom, 2026-04-24, Meta Partners With AWS on Graviton Chips to Power Agentic AI
  • Anthropic News, 2026-04, Anthropic and Amazon expand collaboration for up to 5 gigawatts of new compute
  • Anthropic News, 2026-04-06, Anthropic expands partnership with Google and Broadcom for multiple gigawatts of next-generation compute
  • Anthropic News, 2026-04-16, Introducing Claude Opus 4.7
  • Google Cloud Blog, 2026-04, Welcome to Google Cloud Next26
  • AWS Machine Learning Blog, 2026-04-24, Building Workforce AI Agents with Visier and Amazon Quick
  • Microsoft Blog, 2026-03-16, Microsoft at NVIDIA GTC: New solutions for Microsoft Foundry, Azure AI infrastructure and Physical AI
  • NVIDIA Blog, 2026-04-20, NVIDIA and Partners Showcase the Future of AI-Driven Manufacturing at Hannover Messe 2026
  • Ai2 Research, 2026-04-13 / 2026-04-23, Evaluating agents for scientific discovery; Introducing OlmoEarth embeddings