Society

物理小白也能懂:三步驟看懂台積電 CoWoS 封裝背後的熱力學,為什麼你的 AI 晶片正在「發燒」?

Editorial TeamApril 30, 20265 min read
物理小白也能懂:三步驟看懂台積電 CoWoS 封裝背後的熱力學,為什麼你的 AI 晶片正在「發燒」?

你的 AI 晶片每秒鐘都在打一場熱力學的仗。台積電的 CoWoS 先進封裝把數十億顆電晶體塞進指甲大小的空間,但熱力學第二定律不會因為工程師很厲害就放你一馬。本文用三個步驟——從焦耳熱、到熱傳導方程、再到熵的宿命——帶你看懂為什麼封裝技術是 AI 時代最被低估的戰場。

你手上那張 NVIDIA H100 顯示卡,滿載的時候功耗大約 700 瓦。

700 瓦是什麼概念?大概等於你同時開七台電暖器的發熱量,全部集中在一塊比你手掌還小的矽晶片上。想像一下,七台電暖器擠在你的掌心。燙不燙?燙死了。

但問題來了——這還只是今天的狀況。下一代的晶片只會更熱、更擠、更瘋狂。而台積電的 CoWoS 封裝技術,正是這場熱力學戰爭的最前線。

老實說,我第一次讀到 CoWoS 的技術規格時,腦子裡想的不是半導體製程,而是波茲曼和克勞修斯——那些十九世紀就在跟「熱」搏鬥的物理學家。因為說白了,CoWoS 面對的核心難題,跟一百五十年前蒸汽機工程師的困境,本質上是同一件事。

所以,讓我用三個步驟帶你看懂這件事。不需要微積分,不需要半導體背景。你只需要記得一件事:宇宙討厭秩序,而且它會用「熱」來告訴你這件事。

第一步:搞懂「熱」從哪裡來——焦耳熱的詛咒

電流通過任何有電阻的材料,都會產生熱。這叫焦耳熱,公式簡單到不行:Q = I²R。電流的平方乘以電阻。

注意那個平方。電流加倍,發熱量是四倍,不是兩倍。

CoWoS 的全名是 Chip-on-Wafer-on-Substrate,基本概念是把好幾顆不同功能的晶片(GPU 運算核心、HBM 記憶體)像拼樂高一樣,透過一片矽中介層(interposer)黏在同一塊基板上。這樣做的好處是資料傳輸距離極短,頻寬極大,延遲極低。AI 訓練需要的就是這個——瘋狂搬資料。

但代價呢?你把幾十億個電晶體擠在大約 2500 平方毫米的面積裡(大概就是一張信用卡的一半),每個電晶體開關切換時都在執行焦耳熱的詛咒。數十億個微小的「電暖器」同時運作。

這裡有個物理學上殘酷的事實:電磁力是四大基本力中第二強的(僅次於強核力),而我們整個半導體產業,就是建立在操控電磁力上面。你操控得越精密、越密集,電磁力回饋給你的熱就越猛烈。

宇宙是公平的。算力不是免費的午餐。

第二步:搞懂「熱」怎麼散——傅立葉定律與熱傳導的瓶頸

熱產生了,下一個問題是:怎麼把它帶走?

熱傳導的基本定律叫傅立葉定律:q = -k∇T。翻成白話就是——熱量流動的速度,跟溫度差成正比,跟材料的導熱係數 k 成正比。導熱係數越高,散熱越快。溫度差越大,熱流越猛。

(這裡要提醒一下,這個公式是巨觀近似,在奈米尺度下會出現偏差,因為聲子的平均自由路徑可能比元件本身還長。但對我們理解概念來說夠用了。)

矽的導熱係數大約 150 W/(m·K),還算不錯。但 CoWoS 的中介層裡面佈滿了密密麻麻的微凸塊(microbump)和矽穿孔(TSV),這些界面——金屬跟矽的交界、焊料跟銅的接合處——每一個都是熱阻。你可以想像成高速公路上的收費站,每經過一個,車流(熱流)就被擋一下。

更麻煩的是,HBM 記憶體本身是好幾層 DRAM 晶片堆疊起來的(HBM3E 已經堆到 12 層了),熱從最上層要傳到最底下的基板,中間得穿過無數層界面。就像你住在一棟十二樓的公寓,但每層樓之間的逃生梯都窄得要命——底下失火了,逃得出去嗎?

坦白講,這就是為什麼台積電一直在研發 SoIC(System on Integrated Chips)混合鍵合技術,試圖減少這些界面熱阻。工程的進步,本質上就是在跟傅立葉定律的物理極限搏鬥。

第三步:搞懂「熱」的終極宿命——熱力學第二定律不跟你談判

這是最關鍵的一步,也是大多數科技媒體不會告訴你的。

熱力學第二定律說:封閉系統的熵永遠不會減少。白話翻譯——你不可能百分之百把電能轉換成有用的運算,總會有一部分變成廢熱。而且,系統越複雜、運算越密集,產生的熵就越多。

這不是工程限制。這是宇宙的基本規則。

你可以換更好的材料、設計更聰明的散熱鰭片、用液冷甚至浸沒式冷卻——這些都有用,但它們都只是在「管理」熵的增加,不是消除它。就像你可以用更大的冰箱保存食物,但食物最終還是會壞掉。熱力學第二定律不跟你談判。

所以,當你看到台積電、NVIDIA、AMD 在拼命發展先進封裝和散熱技術的時候,你看到的其實是人類在跟物理定律的邊界賽跑。每一代 CoWoS 封裝的進步——從 CoWoS-S 到 CoWoS-L 再到未來的 CoWoS-R——本質上都在問同一個問題:我們還能把多少算力塞進熱力學允許的空間裡?

這讓我想到一件有趣的事。宇宙學裡有個概念叫「熱寂」(heat death),是指宇宙最終會達到熱力學平衡——所有能量均勻分佈,不再有溫度差,不再有任何有意義的事情發生。某種意義上,每一顆 AI 晶片都是一個微型宇宙,不斷地從有序(電能、運算指令)走向無序(廢熱、熵)。

我們建造的每一座 AI 資料中心,都在加速自己的微型「熱寂」。

這不是悲觀。這是物理。而物理的美妙之處在於,它告訴你限制在哪裡——然後你才知道,真正的創新應該往哪裡去。

所以下次你看到「台積電 CoWoS 產能不足」這種新聞,別只想到供應鏈。想想焦耳熱、傅立葉定律、還有那個永遠在背後微笑的熱力學第二定律。

它們才是真正的主角。