中國(guó)儲(chǔ)能網(wǎng)訊:隨著AI與大模型的爆發(fā)式增長(zhǎng),算力成為數(shù)據(jù)中心的“新石油”,全球的算力需求迎來(lái)指數(shù)級(jí)增長(zhǎng)。
據(jù)Uptime Institute報(bào)告顯示,數(shù)據(jù)中心停機(jī)60s造成的直接經(jīng)濟(jì)損失平均超過(guò)5萬(wàn)美元。對(duì)AI集群而言,因電力供應(yīng)不穩(wěn)定引發(fā)的算力中斷,將直接讓算力芯片陷入“空轉(zhuǎn)”狀態(tài),難以發(fā)揮芯片應(yīng)有的經(jīng)濟(jì)效能。
科華數(shù)據(jù)始終以技術(shù)創(chuàng)新回應(yīng)行業(yè)痛點(diǎn),重磅推出適配AI場(chǎng)景的兆瓦級(jí)UPS——MR33系列1.2MW UPS,打造兼具極致高密與極致可靠的算力底座。
如何突破功率密度天花板
“少即是多” 構(gòu)筑多重可靠保障
依托質(zhì)量可靠、過(guò)程可控、結(jié)果可溯的全流程管理,科華數(shù)據(jù)嚴(yán)選每一個(gè)元器件,這是器件可靠的根本所在。
根據(jù)FIT與MTBF計(jì)算理論,器件數(shù)量越少,故障點(diǎn)越少,系統(tǒng)可靠性就越高。科華深度踐行“少即是多”的設(shè)計(jì)理念,通過(guò)模塊器件精簡(jiǎn)、減少并聯(lián)模塊、精準(zhǔn)環(huán)流控制等,以多重路徑提升可靠性。
配合集成化封裝設(shè)計(jì),精簡(jiǎn)無(wú)源器件數(shù)量。最終實(shí)現(xiàn)MR33系列1.2MW UPS單機(jī)開(kāi)關(guān)管數(shù)量減少57%,故障率減少47.2%,從根源筑牢可靠性基礎(chǔ)。

在并聯(lián)架構(gòu)與環(huán)流控制上,得益于單模塊功率密度的大幅提升,系統(tǒng)所需的并聯(lián)模塊數(shù)量遠(yuǎn)少于行業(yè)同類產(chǎn)品,從結(jié)構(gòu)上降低了環(huán)流控制難度。
同時(shí),MR33系列1.2MW UPS搭載自主研發(fā)的高精度數(shù)字環(huán)流控制技術(shù),精準(zhǔn)監(jiān)測(cè)并調(diào)控模塊之間的電壓幅值與相位,有效抑制環(huán)流產(chǎn)生,最終實(shí)現(xiàn)模塊并聯(lián)運(yùn)行環(huán)流值在3%以內(nèi),保障系統(tǒng)高效穩(wěn)定運(yùn)行。
如何將高密度熱點(diǎn)各個(gè)擊破
“三位一體”全鏈路驗(yàn)證
科華數(shù)據(jù)MR33系列1.2MW UPS占地面積僅0.8㎡,功率密度高達(dá)1.5MW/㎡,遠(yuǎn)超行業(yè)平均水平。
高密UPS的散熱效率與器件壽命、系統(tǒng)可靠性息息相關(guān)??迫A數(shù)據(jù)依托“三位一體”全鏈路驗(yàn)證體系,層層攻克高密度散熱難點(diǎn)。

針對(duì)200kW高密UPS模塊,科華數(shù)據(jù)重構(gòu)模塊獨(dú)立熱分區(qū)。風(fēng)機(jī)搭載智能調(diào)速算法,通過(guò)實(shí)時(shí)采集各區(qū)域溫度,動(dòng)態(tài)調(diào)整轉(zhuǎn)速。當(dāng)區(qū)域溫度接近告警閾值時(shí),風(fēng)扇快速提升轉(zhuǎn)速,確保每個(gè)器件的安全熱余量。
針對(duì)核心熱源,創(chuàng)新性設(shè)計(jì)密齒型鰭片,通過(guò)優(yōu)化鰭片間距與高度,在有限空間內(nèi)最大化增大換熱面積。在鰭片表面采用親風(fēng)導(dǎo)流結(jié)構(gòu),降低氣流阻力的同時(shí)提升熱交換效率,確保核心器件產(chǎn)生的熱量能快速、均勻排出,保障散熱穩(wěn)定性。
在整機(jī)設(shè)計(jì)上,采用三維立體風(fēng)道+冷熱隔離,通過(guò)CFD仿真對(duì)風(fēng)道進(jìn)行優(yōu)化,冷風(fēng)精準(zhǔn)覆蓋匯流銅排、工程接線腔等高熱區(qū)域,構(gòu)建嚴(yán)格的隔離通道,阻斷熱空氣回流現(xiàn)象。

如何適配AI負(fù)載特性
以高峰均功率比為設(shè)計(jì)基準(zhǔn)
AI集群的負(fù)載特性與通算數(shù)據(jù)中心存在本質(zhì)差異。IDC《AI算力基礎(chǔ)設(shè)施白皮書(shū)》明確指出,大模型訓(xùn)練階段的負(fù)載呈現(xiàn)“脈沖式高過(guò)載”特征,單節(jié)點(diǎn)負(fù)載可在10ms內(nèi)從30%躍升至超過(guò)150%,峰值功率最大持續(xù)時(shí)間可達(dá)30ms。
加載快、高過(guò)載、高頻次的負(fù)載沖擊,對(duì)UPS的過(guò)載能力、動(dòng)態(tài)響應(yīng)速度提出了遠(yuǎn)超傳統(tǒng)場(chǎng)景的嚴(yán)苛要求。
對(duì)此,科華數(shù)據(jù)MR33系列1.2MW UPS在硬件設(shè)計(jì)階段,將高峰均功率比作為設(shè)計(jì)基準(zhǔn),從器件選型到電路架構(gòu)全方位強(qiáng)化過(guò)載能力,可支撐超額定180%過(guò)載300ms。

在選型上,采用高性能第三代半導(dǎo)體器件,其電壓、電流耐受能力是傳統(tǒng)硅基器件的2-3倍,輕松化解脈沖式高過(guò)載沖擊。
通過(guò)冗余熱設(shè)計(jì),充分預(yù)留熱量緩沖區(qū),緩沖AI集群并發(fā)性訓(xùn)練產(chǎn)生的瞬時(shí)熱沖擊,避免器件熱失效。
全新升級(jí)高帶寬數(shù)字控制算法,提高電流環(huán)采樣頻率與電壓環(huán)帶寬,確保實(shí)時(shí)、精準(zhǔn)捕捉負(fù)載突變信號(hào),避免調(diào)控滯后。搭配高速響應(yīng)的器件與全鏈路低阻抗設(shè)計(jì),保障信號(hào)傳輸與功率切換無(wú)延遲,實(shí)現(xiàn)快速調(diào)控輸出。
作為智算中心的“電力心臟”,科華數(shù)據(jù)MR33系列1.2MW UPS從器件選型、產(chǎn)品設(shè)計(jì)到嚴(yán)苛驗(yàn)證,歷經(jīng)多輪高低溫、高濕、抗震等多項(xiàng)環(huán)境應(yīng)力驗(yàn)證,以及上千小時(shí)的老化測(cè)試,構(gòu)筑起層層可靠保障。
在AI算力重構(gòu)數(shù)字世界的今天,能源底座影響著數(shù)字文明的高度??迫A數(shù)據(jù)致力于讓每一座智算中心都擁有澎湃不息的“電力心臟”,與萬(wàn)千行業(yè)共赴AI時(shí)代的星辰大海。



