行業(yè)新聞
Nvidia近日宣布,其新推出的機(jī)架級系統(tǒng)將配備一種新型電源供應(yīng)單元,具備儲能功能,旨在平滑電力波動并降低高達(dá)30%的峰值電網(wǎng)需求。這一新技術(shù)將隨Nvidia最新的GB300 NVL72平臺以及GB200 NVL72系統(tǒng)一同推出,盡管公司發(fā)言人未透露具體的發(fā)布時間和更多細(xì)節(jié)。
這項技術(shù)被認(rèn)為是針對人工智能(AI)工作負(fù)載在電力消耗方面的重大進(jìn)展。喬治亞理工學(xué)院電氣與計算機(jī)工程教授圣地亞哥·格里哈瓦指出,Nvidia在這一領(lǐng)域的主導(dǎo)地位使得這一技術(shù)具有一定的重要性,但其解決方案僅限于Nvidia的高端系統(tǒng),與特斯拉的冷卻技術(shù)和Meta的硬件優(yōu)化競爭,提供的是對現(xiàn)有電力管理技術(shù)的顯著但非顛覆性改進(jìn)。
與傳統(tǒng)數(shù)據(jù)中心不同,運(yùn)行AI工作負(fù)載的數(shù)據(jù)中心在電力需求上表現(xiàn)出快速波動,德克薩斯州可靠性機(jī)構(gòu)的可靠性服務(wù)主任將其與鋼鐵廠的負(fù)載模式進(jìn)行了比較。這給電網(wǎng)運(yùn)營商和需要電力的大型數(shù)據(jù)中心帶來了挑戰(zhàn)。Nvidia表示,其新系統(tǒng)能夠通過多種機(jī)制來應(yīng)對這一挑戰(zhàn),涵蓋了啟動、穩(wěn)態(tài)和關(guān)機(jī)三個主要操作階段。
在工作負(fù)載開始時,電源限制功能將限制電力消耗,隨后逐步增加。當(dāng)達(dá)到穩(wěn)態(tài)操作后,儲能裝置將被部署以控制短期電力波動。在關(guān)機(jī)階段,GPU可以采用特殊的電力燃燒模式,以確保平穩(wěn)過渡,而不是突然下降。值得注意的是,該儲能機(jī)制僅用于優(yōu)化電網(wǎng)的負(fù)載特性,而不向公用事業(yè)提供能量。
Nvidia指出,以前設(shè)施需要根據(jù)最大瞬時電力消耗進(jìn)行配置,而有了有效的儲能技術(shù)后,配置可以更接近目標(biāo)平均消耗,這將允許在同一電力預(yù)算內(nèi)增加更多機(jī)架,或減少總體電力分配。格里哈瓦同意,AI的電力消耗問題至關(guān)重要,而先進(jìn)的能源管理和儲能確實有助于解決這一問題。
然而,他也指出,Nvidia的系統(tǒng)并未解決如何將大量電力傳輸?shù)綌?shù)據(jù)中心的問題。此外,隨著學(xué)習(xí)模型的不斷演變,電力消耗模式也在變化,未來的AI推理數(shù)據(jù)中心將面臨不同的需求。因此,解決方案需要具備高度的靈活性和前瞻性,以應(yīng)對未來可能出現(xiàn)的各種情況。返回搜狐,查看更多
掃一掃,添加微信
熱線電話:
0553-3025696