过去谈 AI 芯片,大家最关注先进制程、GPU 架构和算力。但进入大模型时代后,另一个环节变得同样关键:如何把 GPU、HBM 和多个芯粒高效地放在一起,并让它们以极高带宽通信。
如果说 HBM 是 AI 芯片的“高速记忆系统”,那么 CoWoS 就是把计算芯片和高速内存连接在一起的“高密度封装底座”。CoWoS,全称 Chip-on-Wafer-on-Substrate,通常译为“晶片-晶圆-基板封装”。它是台积电推出的 2.5D 先进封装平台,主要面向高性能计算、AI 加速器、数据中心 GPU 和网络芯片等应用。
- 把 GPU、AI ASIC、Chiplet 等逻辑芯片放到中介层上;
- 通过硅中介层或 RDL/LSI 结构,实现超短距离、高密度互连。
AI 芯片的核心矛盾,是算力增长很快,但数据搬运越来越困难。大模型训练和推理需要在 GPU 与 HBM 之间持续传输海量数据,如果内存离计算核心太远,带宽、功耗和延迟都会成为瓶颈。
HBM 本身带宽很高,但它必须靠近 GPU 才能发挥价值。CoWoS 通过 2.5D 集成,把 HBM 堆栈与 GPU 放在同一个封装内,显著缩短信号路径。HBM 依赖超宽接口传输数据。传统 PCB 走线难以承载如此高密度互连,而 CoWoS 的中介层可以提供更细、更密、更短的互连路径。随着 AI GPU 从单颗大芯片走向多芯粒架构,封装不再只是保护芯片的外壳,而变成系统集成平台。CoWoS 可以把多个逻辑芯片、HBM 和辅助芯片组合成一个高性能系统级封装。从结构上看,CoWoS 不是单一工艺,而是一个平台:它把芯片设计、晶圆工艺、封装、测试、热管理和系统集成连接到一起。四、CoWoS-S、CoWoS-R、CoWoS-L 有什么区别?
CoWoS 并不是只有一种形态。台积电目前公开介绍的主要路线包括 CoWoS-S、CoWoS-R 和 CoWoS-L。
从趋势看,AI 芯片系统越来越大,互连越来越复杂,CoWoS 也从传统硅中介层方案,逐步扩展到更多混合型、模块化方案。HBM 解决“内存带宽”问题,CoWoS 解决“如何把 HBM 与计算芯片高密度连接起来”的问题。
HBM 是高速内存,CoWoS 是连接高速内存与计算芯片的先进封装平台。没有 HBM,AI 芯片会被内存带宽限制;没有 CoWoS,HBM 很难以足够高的带宽、足够低的功耗和足够短的距离服务 GPU。这也是为什么高端 AI GPU 的讨论,经常同时出现三个关键词:GPU、HBM、CoWoS。CoWoS 难在“系统级复杂度”。它不是普通封装线简单扩产就能解决的问题,而是牵涉多个高精度环节:
因此,在 AI 需求爆发时,限制 AI 芯片出货的往往不只是先进制程晶圆,还包括 HBM 和 CoWoS 等先进封装能力。- 中介层面积大:高端 AI GPU 往往需要集成多个 HBM 堆栈,封装面积随之增大。
- 互连密度高:GPU 与 HBM 之间需要大量高速、低损耗连接。
- 良率挑战高:逻辑芯片、HBM、中介层、基板任一环节出现问题,都会影响最终良率。
- 供应链协同难:先进封装需要晶圆厂、存储厂、基板厂、封测厂和系统客户紧密协同。
这意味着 CoWoS 的价值不只是“封装加工费”,而是整个 AI 芯片系统能否成型的关键能力。CoWoS 的崛起,说明半导体竞争正在从“单颗芯片性能”转向“系统级集成能力”。
过去,先进制程是芯片性能提升的主线;现在,先进封装正在成为第二条主线。尤其在 AI 芯片中,制程、Chiplet、HBM、CoWoS、互连和散热必须一起优化。未来高端 AI 芯片竞争,很可能不只是看谁有更先进的 GPU 架构,也要看谁能获得足够的:CoWoS 的下一步,不只是把芯片放得更近,而是把系统做得更大、更复杂、更像一个“封装内计算系统”。
更多 Chiplet 化:把计算、I/O、缓存、网络等功能模块化。封装与系统协同设计:从单颗芯片优化走向整机柜、整系统优化。先进制程决定单颗芯片晶体管能力,HBM决定数据供给能力,CoWoS决定计算芯片与高带宽内存能否高效集成。
- 它是 AI 芯片连接 GPU 与 HBM 的先进封装平台;
- 它正在成为高端 AI 芯片供应链中的关键瓶颈和战略资源。
AI 芯片背后,不只有先进制程,还有先进封装。CoWoS 的重要性,正在从“幕后工艺”变成“前台竞争力”。