
隨著深度學習、仿真、BIM設計、AEC行業(yè)在各行各業(yè)應用的發(fā)展,在AI技術虛擬GPU技術的加持之下,需要強大的GPU算力解析。無論是GPU服務器,還是GPU工作站都趨向于小型化、模塊化、高集成度設計方向發(fā)展。熱流密度經(jīng)常達到傳統(tǒng)風冷GPU服務器設備的7-10倍,由于采用模塊集中安裝方案,擁有數(shù)量眾多且發(fā)熱量大的NVIDIA英偉達GPU顯卡,因此散熱問題非常突出。過去常用的散熱設計技術已經(jīng)無法滿足新系統(tǒng)的使用要求,傳統(tǒng)的水冷GPU服務器還是液冷GPU服務器都離不開風扇的加持,今天我們就來解析一下熱虹吸管散熱技術。
目前市場上的熱虹吸散熱技術主要還是利用柱型或板型散熱器為體,在散熱器底部穿入熱媒管,殼體內注入工質,并建立真空環(huán)境,這是一種常溫重力式熱管。工作過程如下:在散熱器底部,供熱系統(tǒng)通過熱媒管將殼體內的工質加熱,在工作溫度范圍內,工質沸騰,蒸汽上升至散熱器上部凝結放熱,凝結液沿散熱器內壁回流至加熱段被再次加熱蒸發(fā),熱量通過工質的不斷循環(huán)相變由熱源傳遞至熱沉,達到供熱、加熱的目的。
1熱虹吸散熱在GPU工作站上的運用
每一代CPU散熱器是如何一步步走向當代的理論性能的極限。從最原始的鋁制散熱片到現(xiàn)在,它都是不錯的選擇。大家可能想既然一些小鰭片就這么好用,那更多更大的鰭片是不是更好用?然而結果并非如此。鰭片離熱源距離越遠,鰭片溫度就越低。當溫度降低至周圍空氣的溫度時,無論將鰭片做的多長,熱傳遞也不會繼續(xù)增加。

當現(xiàn)代GPU計算功耗進入75至350瓦區(qū)間甚至更高時,熱設計工程師們轉而研發(fā)新的散熱方法。熱管本身并沒有增強散熱器的散熱能力。它的作用是同時利用熱傳導和熱對流,來實現(xiàn)遠高于金屬本身的熱傳遞效率。
早在1937年就有熱虹吸技術出現(xiàn),正常運行時熱管內部的液體會沸騰,蒸汽通過蒸汽腔到達冷凝端,蒸汽變回液體后再通過管芯返回熱源,管芯通常是燒結上去的金屬內層,可如果熱管吸收太多熱量,則會出現(xiàn)“熱管干涸”的現(xiàn)象。液體不僅在蒸汽腔內變成蒸汽,同時也會在管芯內變成蒸汽,導致其無法變回液體返回熱源,大幅增加了熱管的熱阻。

現(xiàn)在我們的重頭戲來了——熱虹吸。熱虹吸散熱不像熱管,用管芯將液體帶回蒸發(fā)端,而是僅僅利用重力,再加上一些巧妙的設計形成循環(huán),把液體蒸發(fā)過程當水泵用。這并不是新技術,在放熱量大的工業(yè)應用中很常見。
一般來說,GPU內部制冷劑會沸騰,向上流動到里面的冷凝端內,變回液體并返回蒸發(fā)端。理論上有兩大優(yōu)勢:
1. 避免熱管干涸,可用于超頻超高性能芯片
2. 因為不需要水泵,所以可靠性優(yōu)于傳統(tǒng)一體式水冷
熱虹吸散熱現(xiàn)在最重要的一點是它的厚度將會從傳統(tǒng)的103毫米減少到僅僅30毫米(減到三分之一以下),外形相對小巧,不會損害性能。熱虹吸散熱的器材為了便于加工,目前廠家使用鋁材質居多。也有使用銅制,溫度可能還能再降5-10度,僅針對發(fā)熱量較大的GPU服務器。
敲黑板 敲黑板 敲黑板
劃重點-小藍用實驗數(shù)據(jù)來結束這次的重點。小藍測試的三種不同的英偉達GPU卡,普通風扇和熱虹吸散熱器在同等4卡水冷GPU服務器下的散熱數(shù)據(jù):
圖一是RTX A6000功率為300瓦
圖二是RTX 3090,功率約350瓦
圖三是NVIDIA A100,功率約為400瓦


|