NVIDIA把芯片设计交给了AI,华为云说Token该工业化生产了——同一周,企业AI的下半场正式开打

事情是从6月1日开始的。

那天NVIDIA发出了一纸公告:Cadence的芯片设计AI超级智能体开始工作了。不是"辅助设计师画图",是"自己设计芯片"。7×24小时。NVIDIA自己是第一个客户——它用这个AI验证自己的芯片设计。

然后是6月2日,北京。BCS 2026网络安全大会上,一份叫"中国AI智能体领航者"的榜单发了。100多家企业的AI智能体,从银行风控到高速巡检再到猪群健康监测,覆盖了你能想到的几乎所有行业。

到了6月5日,上海。华为云CEO周跃峰站在INSPIRE创想者大会的台上,说了一句很华为风格的话:Agentic AI时代来了,Token要工业化生产。背后的数字是:200 EFLOPS算力集群、10万张卡、每千卡每秒500万Tokens的吞吐量。

五天之内,三件事。但把它们放在一起看,你会发现讲的其实是同一件事:AI正在从"有人盯着用的工具"变成"没人盯也自己干活的数字同事",而企业IT基础设施的底层逻辑也跟着全变了。

NVIDIA这次没讲显卡,讲了"数字同事"

先看NVIDIA干了什么。它发布的不是一个产品,是一个工具箱——Agent Toolkit。里面四样东西:

NemoClaw蓝图——开源的智能体构建框架。原本企业搭一个能编排多工具工作流的AI智能体,可能要好几周。NVIDIA说用NemoClaw,几小时。

Nemotron 3 Ultra模型——5500亿参数的混合专家模型,专门为长时间运行的AI智能体设计的。同类模型里推理快5倍,成本低30%。6月4日起开源。

OpenShell安全运行时——这是被很多人低估但可能是最重要的一个。AI智能体要在企业环境里"自主行动",安全边界在哪?OpenShell提供了一个答案:隐私策略、查询脱敏、本地/混合/多云部署都支持。微软、Canonical、红帽、SAP已全部接入。

CUDA-X库变智能体技能——cuDF做数据处理、cuOpt做路径优化、AI-Q做知识检索、PhysicsNeMo做工程仿真。这些库原本是给人调API用的,现在直接给AI智能体当"技能包"。

真实落地的场景已经出来了:


一个信号非常明确:AI正在从"回答你的问题"变成"替你干活"。而且不是一般的话——是设计芯片、运行工厂、修复安全漏洞这种级别的活儿。

华为云的同一天:Token工业化

如果把NVIDIA的发布理解为"给AI智能体配齐了工具箱",那华为云INSPIRE大会干的则是另外一个事:告诉你说,这堆工具跑起来需要什么底座。

周跃峰的原话是"Agentic AI时代正在引发计算范式的根本性跃迁"——这句话可以翻译成:"以前我们是堆机器跑模型,现在AI智能体每一秒钟都在不停地产出和消费Token,这个规模跟以前不是一个量级。"

华为云端出来的四款新品,逻辑很清楚:

AICS灵衢智算集群——200 EFLOPS总算力,10万卡级规模,Token生成时延低于10毫秒,每千卡每秒500万Tokens。这不是实验室指标,是在讲"如果你企业要大规模跑智能体,我能给你稳定生产Token"。在线可用性做到99.95%。

AMS Agentic记忆存储——PB级超大记忆空间,KV Cache分层池化,智能体可以跑"天级"长任务而不会忘事。这个解决的是一个问题:目前的AI智能体大多只能处理"单次对话"级别的任务,一旦要跑几小时甚至几天的业务流程,上下文记忆就成了瓶颈。

CCE VolcanoNext通智一体化调度——通用算力和智能算力统一调度,每分钟百万级并发。企业不会只跑一个Agent,几十上百个Agent同时在跑的时候,调度效率直接决定用户体验。

AgentSphere运行环境——给智能体一个安全的"房间"。某种程度上,这和NVIDIA的OpenShell是对标的:企业需要知道它们的AI在做什么、能做什么、不能做什么。

华为云的目标数字是:企业日消耗Tokens 100万亿,每瓦Token成本降10倍,每分钟百万级并发,长期记忆从128K扩展到100M。

我翻了翻现场数据:华为云现在有850万开发者、5万+合作伙伴。云南交投已经在用了——交通流量预测和拥堵识别精度提升了9.91%,开发了20多个细分场景智能体。

这两家做的事其实高度互补。NVIDIA给智能体"配齐了大脑和手脚",华为云给智能体"铺好了路和电网"。一个在做能力层,一个在做基础设施层。但都指向同一个结论:AI不再是工具,是同事。

企业CIO真正要关心什么

五天内三件大事摆在这里。对企业数字化负责人来说,有几件事情是绕不开的:

第一,你的IT基础设施设计逻辑要变了。以前企业IT是"应用-数据库-服务器"三层。现在要加一层"Agent运行时"。智能体不是一段代码,是一个持续运行的、有记忆的、会自己做决定的软件实体。它的计算资源需求不是"请求-响应"模式,是"持续对话+持续推理"模式。你现在的服务器架构撑不住。

第二,安全边界要重画。这是BCS 2026和NVIDIA OpenShell同时指向的问题。当AI可以自主操作企业系统——发邮件、改配置、审批流程——安全就不再是"防外部攻击"那一套了。你需要能实时看到Agent在干什么、能随时关停、能基于策略做权限管控。OpenShell和AgentSphere的出现说明业界已经在认真对待这个问题了。

第三,准备接受一个更根本的变化:你的团队成员会有"数字人"。Cadence已经在用AI设计芯片了,NVIDIA自己就是客户。富士康的工厂里有MoMClaw在看传感器数据做决策。这不是远景,是正在发生的事情。企业组织架构、绩效考核、人机协作流程——这些都要重新想一遍。

第四,但别忘了IDC那个提醒。同一周,IDC发了《中国AI增强的企业级ERP市场份额,2025》报告。60%以上制造企业已经把AI能力纳入ERP选型标准。但报告里有一句被很多人忽略的话:先评估你的数据基础扎实程度,再决定AI-ERP从哪个模块切入。立高食品上了用友YonSuite后生产订单效率提升81.5%,但这个的前提是它先把主数据管清楚了。

200 EFLOPS华为云AICS总算力10万张单集群最大卡数500万/秒千卡Token吞吐量100万亿/天Agent时代Token需求目标

写到这里我想到一句话:2024年大家在讨论"AI能干什么",2025年大家在讨论"AI该不该进企业",到了2026年6月,话题变成了"AI已经在企业里自主干活了,你的基础设施跟不跟得上"。

这个变化的速度比大多数人预料的快得多。

关于我们

​我们致力于帮助中小企业实现数字化转型,我们的团队由一群充满激情和创新思维的专业人士组成,他们具备丰富的行业经验和技术专长。

扫一扫获取顾问以及手册

归档
Sign in to leave a comment
100个AI智能体进了企业核心流程,但智谱上市还在烧钱——AI落地这一周,冰火两重天