omniture

浪潮信息M6服務(wù)器極限性能挑戰(zhàn) 破解毫厘之間散熱"湍流"玄謎

2022-06-10 09:50 4372

北京2022年6月9日 /美通社/ --

狹小,不到0.002立方米空間內(nèi);
氣流,被每秒500轉(zhuǎn)的風扇擾動;
瞬間,所有電氣組件變?yōu)槟μ齑髽牵?br />極限,硬盤數(shù)據(jù)接近滿載;
此時,硬盤讀寫頭以10納米的距離,懸浮于盤片之上……

硬盤正在經(jīng)歷一項極致嚴苛的性能與可靠性測試——服務(wù)器工作環(huán)境溫度已經(jīng)超過數(shù)據(jù)中心環(huán)境溫度標準,與此同時內(nèi)部一臺散熱風扇停止工作,要求服務(wù)器仍然能正常運轉(zhuǎn),硬盤的讀寫性能依舊在線,以保障在這類極小概率出現(xiàn)的業(yè)務(wù)場景中硬盤數(shù)據(jù)的安全,性能的穩(wěn)定。但在極限測試中,浪潮信息工程師發(fā)現(xiàn),在對于硬盤進行接近滿載的高負荷壓力測試時,硬盤的穩(wěn)定性猶如在亂風中飛舞的柳絮飄忽不定,甚至還出現(xiàn)了徹底報廢的極端故障。

硬盤內(nèi)部:讀寫頭在在碟片上方“飛行” 尋找碟片磁道從而讀寫數(shù)據(jù)
飛行高度約為10納米,相當于大型飛機沿著地面3cm的高度穩(wěn)定飛行
硬盤內(nèi)部:讀寫頭在在碟片上方“飛行” 尋找碟片磁道從而讀寫數(shù)據(jù) 飛行高度約為10納米,相當于大型飛機沿著地面3cm的高度穩(wěn)定飛行

面對數(shù)據(jù)中心數(shù)據(jù)計算量的幾何級增長,這種看似在罕見場景、極限測試才出現(xiàn)的故障問題,也不能輕易忽視,必須要找到"神隱"背后的問題根源。

尋找毫厘之間的玄謎!一個好消息、一個壞消息?

為了揭開硬盤讀寫性能下降的謎題,浪潮信息工程師首先針對服務(wù)器的關(guān)鍵組件進行逐一篩查,替換了不同的風扇、硬盤、內(nèi)部主板以及背部連接器等進行對比分析,但問題依然存在。工程師又結(jié)合定量分析,改變環(huán)境溫度、調(diào)節(jié)風扇轉(zhuǎn)速等等進行了大量的實驗測試,終于發(fā)現(xiàn)每當風扇轉(zhuǎn)速達3萬轉(zhuǎn)/分鐘,服務(wù)器的硬盤讀寫性能就開始下降。

基于這一發(fā)現(xiàn),結(jié)構(gòu)仿真、流體仿真等多個團隊協(xié)同合作,找到了問題的答案——當散熱風扇轉(zhuǎn)速達到3萬轉(zhuǎn)的極限轉(zhuǎn)速時,系統(tǒng)風扇進風端形成的湍流,即氣流漩渦,會存在于硬盤和風扇之間的空間,而硬盤是精密度很高的部件,對湍流信號感知非常敏感,不規(guī)則的湍流可能會給硬盤性能帶來巨大的影響。輕則影響硬盤磁頭讀寫性能下降,嚴重則會硬盤報廢,導(dǎo)致數(shù)據(jù)丟失。

風扇入口因氣流受阻形成湍流
風扇入口因氣流受阻形成湍流

引起"湍流"的散熱風扇是保障服務(wù)器計算性能和散熱的核心部件之一,但極限轉(zhuǎn)速的風扇所產(chǎn)生的"湍流"又會影響硬盤的性能和可靠性,浪潮信息工程師需要尋找性能與散熱極致平衡的方法,讓計算性能、散熱、可靠性達到和諧統(tǒng)一。

問題雖然得已鎖定,但工程師們欣喜之下,又不得不去面對一個壞消息——能否有效治理"湍流"是數(shù)學屆的千禧年7大難題之一。浪潮信息工程師要做的就是尋找破解風扇高速轉(zhuǎn)動而產(chǎn)生湍流效應(yīng)的方法。

破解"湍流" 意外破"圈"帶來驚喜

想要有效的破解"湍流",就意味著要讓雜亂的"湍流"變成平穩(wěn)的"層流"。在項目組百思不得其解的時候,浪潮信息工程師在參與FAST天眼項目現(xiàn)場,看到天眼采用的濾波材料突然有了靈感。工程師開始嘗試引入一種濾波材料,通過對氣流進行導(dǎo)流,讓隨性的風走直線,破解湍流造成的硬盤性能影響。

PSH.Tennekes&J.L. Lumley 曾對湍流進行過評論:嘗試解決湍流問題的成功與否,強烈地取決于包括做出關(guān)鍵性假設(shè)的靈感。 湍流需要奔放的發(fā)明者,正如需要專業(yè)分析師那么重要。

這一濾波材料的形狀要如何確定呢?工程師們嘗試了多種不同的形狀,效果都不理想。在一次偶然的出差中,深圳機場六邊形的蜂窩結(jié)構(gòu)的設(shè)計又給工程師帶來了靈感,六邊形蜂窩狀結(jié)構(gòu),省材料,夠堅固,通風量也最好,工程師們將其引入M6服務(wù)器設(shè)計,進行仿真測試,設(shè)計出了波導(dǎo)網(wǎng)——鋁制六邊形蜂巢網(wǎng),它能夠破解湍流,引導(dǎo)風流直吹,同時在厚度上不足0.2mm,確保了進風處的最大通風量,重量也僅11克左右。

增加波導(dǎo)網(wǎng)進行導(dǎo)流,內(nèi)部氣流更加流暢
增加波導(dǎo)網(wǎng)進行導(dǎo)流,內(nèi)部氣流更加流暢

 

增加波導(dǎo)網(wǎng)進行導(dǎo)流,內(nèi)部氣流更加流暢
增加波導(dǎo)網(wǎng)進行導(dǎo)流,內(nèi)部氣流更加流暢

這一結(jié)構(gòu)可以將不規(guī)則的湍流切割成平穩(wěn)的層流。經(jīng)過高頻度仿真測試協(xié)同,浪潮信息工程師為M6旗下每一款服務(wù)器的波導(dǎo)網(wǎng)蜂巢單元尺寸進行了科學匹配,定制出最佳孔徑、厚度大小的波導(dǎo)網(wǎng)。與此同時,工程師還借鑒了"音樂廳"降低噪聲的方法,在波導(dǎo)網(wǎng)周圍貼附上吸音海綿,進一步降低噪音對硬盤和機箱共振的干擾。

波導(dǎo)網(wǎng),一個小的改變,化解了硬盤極限壓力危機,然而,收獲并未就此停止,數(shù)據(jù)顯示,通過采用波導(dǎo)網(wǎng),M6服務(wù)器的硬盤性能提升:6%-8%;服務(wù)器散熱效率提升:17%-22%;數(shù)據(jù)中心可節(jié)約能耗:6%-8%。

相對于計算技術(shù)的創(chuàng)新而言,波導(dǎo)網(wǎng)可能只能算是微創(chuàng)新,但往往細節(jié)決定成敗,微小的進步的累積,會引導(dǎo)風向,也會引動風潮。

 

消息來源:浪潮
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection