
隨著深度學(xué)習(xí)、仿真、BIM設(shè)計、AEC行業(yè)在各行各業(yè)應(yīng)用的發(fā)展,在AI技術(shù)虛擬GPU技術(shù)的加持之下,需要強大的GPU算力解析。無論是GPU服務(wù)器,還是GPU工作站都趨向于小型化、模塊化、高集成度設(shè)計方向發(fā)展。熱流密度經(jīng)常達到傳統(tǒng)風(fēng)冷GPU服務(wù)器設(shè)備的7-10倍,由于采用模塊集中安裝方案,擁有數(shù)量眾多且發(fā)熱量大的NVIDIA英偉達GPU顯卡,因此散熱問題非常突出。過去常用的散熱設(shè)計技術(shù)已經(jīng)無法滿足新系統(tǒng)的使用要求,傳統(tǒng)的水冷GPU服務(wù)器還是液冷GPU服務(wù)器都離不開風(fēng)扇的加持,今天我們就來解析一下熱虹吸管散熱技術(shù)。
目前市場上的熱虹吸散熱技術(shù)主要還是利用柱型或板型散熱器為體,在散熱器底部穿入熱媒管,殼體內(nèi)注入工質(zhì),并建立真空環(huán)境,這是一種常溫重力式熱管。工作過程如下:在散熱器底部,供熱系統(tǒng)通過熱媒管將殼體內(nèi)的工質(zhì)加熱,在工作溫度范圍內(nèi),工質(zhì)沸騰,蒸汽上升至散熱器上部凝結(jié)放熱,凝結(jié)液沿散熱器內(nèi)壁回流至加熱段被再次加熱蒸發(fā),熱量通過工質(zhì)的不斷循環(huán)相變由熱源傳遞至熱沉,達到供熱、加熱的目的。
1熱虹吸散熱在GPU工作站上的運用
每一代CPU散熱器是如何一步步走向當(dāng)代的理論性能的極限。從最原始的鋁制散熱片到現(xiàn)在,它都是不錯的選擇。大家可能想既然一些小鰭片就這么好用,那更多更大的鰭片是不是更好用?然而結(jié)果并非如此。鰭片離熱源距離越遠,鰭片溫度就越低。當(dāng)溫度降低至周圍空氣的溫度時,無論將鰭片做的多長,熱傳遞也不會繼續(xù)增加。

當(dāng)現(xiàn)代GPU計算功耗進入75至350瓦區(qū)間甚至更高時,熱設(shè)計工程師們轉(zhuǎn)而研發(fā)新的散熱方法。熱管本身并沒有增強散熱器的散熱能力。它的作用是同時利用熱傳導(dǎo)和熱對流,來實現(xiàn)遠高于金屬本身的熱傳遞效率。
早在1937年就有熱虹吸技術(shù)出現(xiàn),正常運行時熱管內(nèi)部的液體會沸騰,蒸汽通過蒸汽腔到達冷凝端,蒸汽變回液體后再通過管芯返回?zé)嵩,管芯通常是燒結(jié)上去的金屬內(nèi)層,可如果熱管吸收太多熱量,則會出現(xiàn)“熱管干涸”的現(xiàn)象。液體不僅在蒸汽腔內(nèi)變成蒸汽,同時也會在管芯內(nèi)變成蒸汽,導(dǎo)致其無法變回液體返回?zé)嵩,大幅增加了熱管的熱阻?/p>

現(xiàn)在我們的重頭戲來了——熱虹吸。熱虹吸散熱不像熱管,用管芯將液體帶回蒸發(fā)端,而是僅僅利用重力,再加上一些巧妙的設(shè)計形成循環(huán),把液體蒸發(fā)過程當(dāng)水泵用。這并不是新技術(shù),在放熱量大的工業(yè)應(yīng)用中很常見。
一般來說,GPU內(nèi)部制冷劑會沸騰,向上流動到里面的冷凝端內(nèi),變回液體并返回蒸發(fā)端。理論上有兩大優(yōu)勢:
1. 避免熱管干涸,可用于超頻超高性能芯片
2. 因為不需要水泵,所以可靠性優(yōu)于傳統(tǒng)一體式水冷
熱虹吸散熱現(xiàn)在最重要的一點是它的厚度將會從傳統(tǒng)的103毫米減少到僅僅30毫米(減到三分之一以下),外形相對小巧,不會損害性能。熱虹吸散熱的器材為了便于加工,目前廠家使用鋁材質(zhì)居多。也有使用銅制,溫度可能還能再降5-10度,僅針對發(fā)熱量較大的GPU服務(wù)器。
敲黑板 敲黑板 敲黑板
劃重點-小藍用實驗數(shù)據(jù)來結(jié)束這次的重點。小藍測試的三種不同的英偉達GPU卡,普通風(fēng)扇和熱虹吸散熱器在同等4卡水冷GPU服務(wù)器下的散熱數(shù)據(jù):
圖一是RTX A6000功率為300瓦
圖二是RTX 3090,功率約350瓦
圖三是NVIDIA A100,功率約為400瓦


|