经观App

理性 建设性
打开

“苏妈”上海行:Agent时代CPU不够用了

原创郑晨烨

2026-05-19 21:02:34

在苏姿丰看来,数据中心里CPU与GPU的配比正在从过去的1:4甚至1:8,向1:1靠拢。

经济观察报记者 郑晨烨

“过去的大语言模型,你问它问题,它给你回答,这很酷。但这个阶段正在过去。”5月19日,美国超微半导体公司(AMD.US,下称AMD)董事会主席、CEO苏姿丰在上海的AMD AI开发者日上说。

在半导体行业,CEO们大多有自己的绰号,英伟达的黄仁勋被称为“黄教主”,苏姿丰则被叫作“苏妈”。苏姿丰2014年出任AMD CEO时,这家公司已濒临破产,市场普遍认为AMD已经没有翻身机会,12年后的今天,AMD市值接近7000亿美元。

苏姿丰认为AI正在进入Agent(智能体)时代,Agent需要自主拆解任务、规划步骤、调用外部工具、处理数据、检查结果,这些编排和调度工作全部由CPU完成,GPU只负责其中“调用模型做推理”的环节。

在苏姿丰看来,数据中心里CPU与GPU的配比正在从过去的1:4甚至1:8,向1:1靠拢。

两周前的5月6日,AMD发布了超出市场预期的2026年一季度业绩:当季营收约103亿美元,同比增长38%;其中数据中心业务收入57.75亿美元,同比增长57%。同期,英特尔(INTC.US)数据中心收入51亿美元。

根据市场研究机构Mercury Research发布的2026年一季度数据,AMD在全球服务器CPU市场的营收份额达到46.2%,创历史新高。

在2026年一季度业绩交流会上,AMD把2030年全球服务器CPU市场规模预期上调到1200亿美元以上,对应年复合增速从此前的18%提升至超过35%。

从1:4到1:1

事实上,在2025年11月的一场投资者交流活动中,AMD给出的CPU市场年复合增速预期还只是18%。但在2026年5月6日的一季度业绩交流会上,苏姿丰表示,基于当前观察到的需求信号,公司已将这个预期增速上调至超过35%。

在上述业绩交流会上,苏姿丰认为,服务器CPU的需求可以分成三类。第一类是传统的通用计算需求,增速相对温和。第二类是作为GPU头节点的CPU。在数据中心的服务器集群里,通常需要CPU来管理和调度旁边的GPU运算,这颗CPU就是“头节点”。第三类是专门为Agent工作流服务的CPU,负责任务编排、数据处理和工具调用。

苏姿丰表示,在上述三类CPU中,增速最快的是第三类,即专门为Agent工作流服务的CPU。

5月19日,苏姿丰在上海又谈到了这个趋势。她说,未来每个人可以同时拥有5个、10个甚至100个Agent,“想想你能多做多少事”。

每个Agent运行的时候,都在持续调度CPU。Agent执行任务的流程大致如下:先把目标拆分成若干子任务,然后依次调用不同的AI模型做推理,模型和模型之间需要传递数据,中间可能还要去调用搜索引擎或者从企业内部的数据库获取额外信息,拿到结果后做汇总检查,如果发现结果不对,就重新规划再来一轮。

在上述Agent执行任务的流程中,GPU只在“调用模型做推理”这一步起作用。其余每一步,分配任务、搬运数据、调用外部工具、检查结果、重新规划,都由CPU完成。

也就是说,Agent处理的任务越复杂,中间来回的步骤越多,CPU的工作量越大。

在AMD的上海活动现场,零一万物CEO李开复在与苏姿丰的对话中亦提到,2024年行业关心的是AI能不能通过考试,2025年是能不能完成工作流,2026年是能不能代替一家公司的某个职能部门。

李开复认为,Agent经济本质上是推理经济。和大模型训练不同,推理对延迟极其敏感,多个Agent之间协作时,响应时间需要控制在100毫秒以内才会流畅。他说,单个Agent的能力有上限,真正的方向是多智能体架构,让擅长规划的、擅长执行的、擅长风控的多个Agent分工协作,像一个委员会一样运转。

李开复还说了一句:如果你的AI部署没有改变公司季报上的某个数字,那你做的只是在运营一个AI实验室。

根据Mercury Research 2026年一季度数据,AMD EPYC(霄龙)服务器CPU按营收计算的全球市场份额达到46.2%,按出货量计算为33.2%,两项均创历史新高。营收份额比出货量份额高出13个百分点,原因是面向AI和云计算场景的高端EPYC 服务器CPU全球出货占比在提升,拉高了单颗CPU的均价。

2026年一季度,AMD服务器CPU收入同比增长超过50%。苏姿丰在上述业绩会上给出的二季度指引更高——同比增速超过70%。她同时表示,这个增长势头会延续到2026年下半年和2027年。

值得注意的是,CPU需求的快速增长并非AMD的一家之言。英特尔CEO陈立武在2026年一季度业绩电话会上也表示,CPU与GPU的比例正在从1:8向1:4走,还会继续向1:1方向发展。

虽然眼下GPU仍然是AI算力的核心需求,但CPU正在成为AI基建中增速最快的品类之一。

中国机会

李开复在与苏姿丰的对话中还提及,中国开发者和大模型公司承受不起美国闭源模型所需的算力成本,“出于绝对的必要性,找到了一条路”,即用工程效率和开源协作来弥补硬件资源的不足。

李开复说,中国企业对数据主权的要求很高,不愿意把核心业务数据发送到云端,AMD本地化部署的方案“契合了中国企业的需求”。

对本地部署和数据主权的需求,是AMD在中国市场看到的机会所在。对此,苏姿丰强调“中国是驱动我们产品路线图的核心部分”,AMD在北京、上海、深圳和中国台北设有研发中心,中国团队超过4000名工程师,上海研发中心是AMD全球规模最大的研发基地之一,EPYC处理器目前为中国主要云服务商的超过700个云实例提供支撑。

值得一提的是,上海这场AI开发者日是AMD首次在北美以外地区举办的AI开发者日,现场来了超过2000名开发者。AMD在活动上还宣布,面向中国AI开发者推出免费的GPU开发者计划,同时与阿里云旗下的魔搭社区(ModelScope)进行合作。

魔搭社区是中国规模最大的开源AI模型托管和开发平台之一,开发者可以直接在社区的在线开发环境里选用AMD GPU运行AI任务,不需要自己装驱动或做额外配置。

阶跃星辰是当天活动上另一个值得关注的参与者,该公司由前微软全球副总裁姜大昕创立,总部位于上海,是国内头部大模型公司之一。该公司核心管理层包括董事长印奇(旷视科技创始人)、CEO姜大昕、首席科学家张祥雨和CTO朱亦博。

朱亦博在当天活动上分享了阶跃星辰与AMD的合作进展,该公司今年2月发布的Step 3.5模型大约2000亿参数,专门针对Agent任务优化。这个模型经过压缩处理后,体积大幅缩小,可以在搭载AMD Ryzen AI Max处理器、配备128GB统一内存的笔记本电脑上完整运行,推理速度接近每秒100个token。

每秒100个token是什么概念?这个速度接近甚至超过很多云端大模型在线服务的响应速度,而它跑在一台可以装进背包的笔记本上。朱亦博说,未来的方向是端云协同——日常的、对隐私敏感的任务在本地跑,只有特别复杂的任务才需要调用云端大模型,本地推理的token成本趋近于零。

AMD工程师刘畅当天在一台搭载Ryzen AI Max处理器的笔记本电脑上做了现场演示,用本地部署的通义千问大模型运行了三个Agent协同工作的医疗问诊辅助系统,全程没有连接网络。

他还演示了开发者的“晨间简报”Agent,在人睡觉时自动从GitHub、掘金等技术社区抓取当天的重要信息并按优先级排序,GitHub是全球最大的开源代码托管平台,掘金是国内开发者常用的技术内容社区。

刘畅说,同样的工作如果调用云端API每天至少花25元人民币,本地运行不花钱。

发力GPU

除了越来越乐观的关于CPU需求的预期,在GPU方面,AMD也在加速推进。

英伟达在数据中心GPU市场的份额目前超过90%,但AMD正在拿到越来越多的大客户订单。

AMD的GPU产品线面向数据中心的品牌叫Instinct,对应英伟达的A100、H100等产品。目前AMD即将量产的最新一代数据中心AI芯片是MI450,AMD的服务器CPU产品线品牌叫EPYC(霄龙)。

今年2月,Meta与AMD签了覆盖多代产品、总计6吉瓦算力的订单,包含基于MI450架构的定制GPU和第六代EPYC服务器CPU。此前,AMD还分别与OpenAI、甲骨文达成大规模算力部署合作,其中甲骨文已宣布将部署MI450 GPU。

MI450计划今年三季度开始向客户交付,四季度进入大规模出货。

苏姿丰在2026年一季度业绩会上就曾表示,AMD对2027年数据中心AI业务“实现数百亿美元年收入充满信心”。她还透露,AMD计划在下半年启动Helios的量产。

Helios是AMD新推出的机架级AI计算系统,把自家的Instinct AI芯片和EPYC服务器CPU装进同一套机架里统一调度,和英伟达目前最高端的NVL72机架方案属于同类产品。

郑晨烨

深圳采访部记者 关注新能源、半导体、智能汽车等新产业领域, 有线索欢迎联系:zhengchenye@eeo.com.cn 微信:zcy096x

相关推荐

同泰慧择混合基金净值腰斩背后:一家“个人系”公募的发展难题

中国网民AI认知报告:把AI视为伙伴,呼吁共建治理生态

武汉市商务局、武汉海关联合发布35条跨境贸易便利化政策措施

免责声明:本文观点仅代表作者本人,供参考、交流,不构成任何建议。