omniture

如何內(nèi)外兼修,打造一款極致性能的全閃存儲(chǔ)

2020-12-08 09:54 5509
浪潮全閃存儲(chǔ)是一款內(nèi)外兼修,軟硬皆強(qiáng)的產(chǎn)品。正是浪潮存儲(chǔ)部門孜孜不倦的努力,不斷在全球存儲(chǔ)性能委員會(huì)SPC-1這個(gè)平臺(tái)上創(chuàng)造了一個(gè)又一個(gè)的佳績(jī):浪潮存儲(chǔ)先后刷新了16控、8控、單位成本性能三項(xiàng)世界記錄。

北京2020年12月8日 /美通社/ -- 隨著科技洪流的推動(dòng),閃存存儲(chǔ)時(shí)代已經(jīng)全面開啟,閃存陣列的大規(guī)模普及已經(jīng)勢(shì)不可擋。人工智能、大數(shù)據(jù)、云計(jì)算、5G、物聯(lián)網(wǎng)等落地推進(jìn),隨之帶來(lái)了海量數(shù)據(jù)的爆發(fā)和對(duì)極致性能前所未有的需求。

閃存時(shí)代,全面開啟

在新技術(shù)、新應(yīng)用驅(qū)動(dòng)下,面對(duì)企業(yè)關(guān)鍵業(yè)務(wù)數(shù)據(jù)存儲(chǔ)需求,全閃陣列在主存儲(chǔ)市場(chǎng)呈現(xiàn)出一種穩(wěn)步增長(zhǎng)的態(tài)勢(shì),預(yù)計(jì)到2024年國(guó)內(nèi)全閃存儲(chǔ)市場(chǎng)將達(dá)到約56億的規(guī)模。

過去全閃存儲(chǔ)應(yīng)用場(chǎng)景主要集中在對(duì)于響應(yīng)延遲要求低、IOPS要求高的核心交易系統(tǒng),如傳統(tǒng)行業(yè)金融系統(tǒng)中的聯(lián)機(jī)交易、網(wǎng)銀、ODS,以及運(yùn)營(yíng)商的Billing系統(tǒng)和CRM系統(tǒng),這些核心系統(tǒng)通常要求存儲(chǔ)系統(tǒng)的性能高達(dá)8000 IOPS/TB,傳統(tǒng)存儲(chǔ)如果僅通過機(jī)械硬盤難以支撐。而現(xiàn)在隨著支撐的業(yè)務(wù)規(guī)模增加,或者因?yàn)樾枰艚蓓憫?yīng)市場(chǎng)需求導(dǎo)致的業(yè)務(wù)種類也在迅速增加,使得各個(gè)行業(yè)除了核心交易系統(tǒng)之外,一些非核心但I(xiàn)OPS要求高、響應(yīng)延時(shí)低的業(yè)務(wù)也逐漸開始需要使用全閃陣列了。

隨著全閃存儲(chǔ)的需求量逐漸增加,如何將存儲(chǔ)軟件棧與閃存盤完美融合發(fā)揮出最大效能,成為各大存儲(chǔ)廠商需要面對(duì)的巨大挑戰(zhàn)。

浪潮發(fā)力全閃:外功扎實(shí)、內(nèi)功深厚

那浪潮在全閃存儲(chǔ)上做得怎么樣呢?可以用一句話來(lái)形容,外功扎實(shí)、內(nèi)功深厚。

首先在外功方面,浪潮存儲(chǔ)通過引入傲騰SSD作為內(nèi)存級(jí)存儲(chǔ)、NVMe高速通路端到端打通等硬件層面的創(chuàng)新,使得產(chǎn)品競(jìng)爭(zhēng)力達(dá)到了業(yè)界領(lǐng)先水平。

在端到端NVMe方面,浪潮全閃存儲(chǔ)G5系列支持端到端NVMe,帶來(lái)性能快速提升。NVMe協(xié)議相較傳統(tǒng)SATA/SAS相比,重大的變化還在于由原來(lái)的單隊(duì)列機(jī)制轉(zhuǎn)變?yōu)槎嚓?duì)列機(jī)制,隊(duì)列深度增至64K;寫請(qǐng)求數(shù)據(jù)間通信次數(shù)相比SAS從4次減少到2次;NVMe SSD經(jīng)過PCIe Switch之后直接到CPU,減少了多個(gè)中間層,降低了傳輸損耗。另外,G5可基于一套架構(gòu)實(shí)現(xiàn)NVMe和SAS都支持,采用超高速PCIE 3.0互聯(lián)架構(gòu),最大可擴(kuò)展48個(gè)控制器,可實(shí)現(xiàn)6個(gè)9的可靠性。

在SCM級(jí)別介質(zhì)方面,浪潮存儲(chǔ)引入傲騰SSD作為SCM內(nèi)存存儲(chǔ)。SCM位于DRAM和NAND之間,能夠填補(bǔ)DRAM和NAND之間的性能和時(shí)延的鴻溝。由于SCM具備持久化和快速字節(jié)級(jí)訪問的特點(diǎn),同時(shí)具備Persistent Memory介質(zhì)和NVM(Non-VolatileMemory)介質(zhì)特性,更重要的是SCM沒有NAND Flash順序?qū)懭牒蛯懬安脸募s束,操作過程更簡(jiǎn)單,在壽命和數(shù)據(jù)保持能力方面的表現(xiàn)也遠(yuǎn)超NAND Flash?;谶@些特點(diǎn),業(yè)界普遍認(rèn)為SCM會(huì)成為顛覆存儲(chǔ)系統(tǒng)設(shè)計(jì)的新一代介質(zhì),并優(yōu)先應(yīng)用于性能和可靠性要求較高的場(chǎng)景。

Intel Optane(傲騰)系列硬盤通過實(shí)踐證明NVMe和SCM(Storage Class Memory)配對(duì)時(shí)才會(huì)顯現(xiàn)更大的存儲(chǔ)優(yōu)勢(shì),那時(shí)數(shù)據(jù)存儲(chǔ)將會(huì)迎來(lái)重大飛躍,NVMe的未來(lái)屬于SCM。


浪潮存儲(chǔ)全面支持SCM級(jí)介質(zhì),可在內(nèi)存和NAND之間增加新的性能層,具有高性價(jià)比;或整機(jī)框滿配Optane SSD,提供超高性能,業(yè)界少有。


說完外功,我們?cè)賮?lái)看看內(nèi)功,也就是軟件方面,浪潮存儲(chǔ)通過全用戶態(tài)軟件棧、智能資源調(diào)度技術(shù)、智能硬壓縮技術(shù)、垃圾回收技術(shù)、滿條帶寫、元數(shù)據(jù)優(yōu)化等技術(shù)創(chuàng)新,實(shí)現(xiàn)了全閃存儲(chǔ)的性能調(diào)優(yōu)。

其一全用戶態(tài)的軟件棧。浪潮存儲(chǔ)軟件部分和硬件驅(qū)動(dòng)都在操作系統(tǒng)的用戶態(tài)實(shí)現(xiàn),這種實(shí)現(xiàn)方案有如下優(yōu)勢(shì):可以減少CPU中斷次數(shù),消除內(nèi)核態(tài)到用戶態(tài)的內(nèi)存拷貝,提升性能;便于升級(jí)和維護(hù),升級(jí)固件無(wú)需重啟操作系統(tǒng),直接升級(jí)替換軟件部分就可以。

這種方案也是當(dāng)前DPDK等高性能IO框架所采用的實(shí)現(xiàn)方式。

其二智能資源調(diào)度技術(shù)。浪潮存儲(chǔ)軟件棧不完全依賴于操作系統(tǒng)的任務(wù)調(diào)度機(jī)制,而是采取如下的手段提高CPU利用率:比如使用進(jìn)程綁定技術(shù),將所有的任務(wù)綁定在不同的CPU核上,任務(wù)執(zhí)行時(shí)不跨越CPU核,不存在需要進(jìn)行沖突保護(hù)數(shù)據(jù),也就無(wú)需用鎖來(lái)保護(hù)沖突,可以避免加鎖引起的CPU上下文切換,提高CPU利用率。又如,使用數(shù)據(jù)綁定技術(shù),將元數(shù)據(jù)進(jìn)行切片,綁定在不同的CPU核上,避免多核并發(fā)訪問同一元數(shù)據(jù),降低CPU競(jìng)爭(zhēng)引起的等待,提高CPU利用率。


其三智能硬件壓縮技術(shù)。定長(zhǎng)輸出壓縮模式是一種前壓縮方式,數(shù)據(jù)會(huì)先經(jīng)過緩存壓縮(專用緩存和壓縮芯片),最終落盤的是壓縮后的數(shù)據(jù);且算法依據(jù)非定長(zhǎng)輸入會(huì)生成定長(zhǎng)輸出,更容易滿條帶刷寫,提高性能同時(shí)提高磁盤空間利用率。浪潮存儲(chǔ)基于時(shí)序的優(yōu)化策略可以識(shí)別隨機(jī)熱點(diǎn)數(shù)據(jù),依賴局部性原理進(jìn)行數(shù)據(jù)存儲(chǔ),進(jìn)一步提高隨機(jī)場(chǎng)景的壓縮性能。浪潮存儲(chǔ)采用專用的硬件壓縮引擎極大釋放了CPU計(jì)算資源,最終帶來(lái)系統(tǒng)整體性能的提升。


其四垃圾回收優(yōu)化技術(shù)。由于SSD固態(tài)盤介質(zhì)特點(diǎn),在長(zhǎng)時(shí)間隨機(jī)讀寫后,再將數(shù)據(jù)寫入非空塊時(shí),需要將塊中的其他數(shù)據(jù)讀入緩存、擦除整個(gè)塊、寫入數(shù)據(jù),這種“寫放大”導(dǎo)致性能急劇下降,且影響SSD盤壽命。浪潮全閃存儲(chǔ)設(shè)備利用全局垃圾回收優(yōu)化,針對(duì)SSD盤,在恰當(dāng)時(shí)機(jī),標(biāo)識(shí)不再使用的數(shù)據(jù)塊,讓設(shè)備從內(nèi)部自動(dòng)清除這些數(shù)據(jù)。從而提升I/O性能。

其五滿條帶寫技術(shù)。滿條帶寫即將隨機(jī)小IO轉(zhuǎn)為滿分條的順序大IO后寫入,隨之帶來(lái)的好處是: SSD盤在做GC回收空間時(shí)就無(wú)需再搬遷數(shù)據(jù),從而減少SSD內(nèi)的寫放大,延長(zhǎng)SSD盤的壽命。浪潮存儲(chǔ)通過滿條帶寫技術(shù)消除了Raid校驗(yàn)數(shù)據(jù)的反復(fù)更新,減少寫盤數(shù)據(jù),減少寫放大。


其六元數(shù)據(jù)優(yōu)化技術(shù)。浪潮全閃存儲(chǔ)通過基于全閃卷分配連續(xù)的地址,將多個(gè)元數(shù)據(jù)合并為大塊IO, 然后一起下盤,節(jié)省CPU資源。通過冷熱數(shù)據(jù)分流技術(shù),浪潮存儲(chǔ)能夠?qū)⒃獢?shù)據(jù)和用戶數(shù)據(jù)存放在不同的分區(qū)中,從而增加分區(qū)中數(shù)據(jù)同時(shí)無(wú)效的概率,達(dá)到減少垃圾回收過程中搬移有效數(shù)據(jù)的數(shù)據(jù)量,提升SSD的性能及可靠性。


其七數(shù)據(jù)零檢測(cè)技術(shù)。浪潮存儲(chǔ)優(yōu)先進(jìn)行數(shù)據(jù)全零檢測(cè)。在開啟重刪與壓縮模式下,將優(yōu)先進(jìn)行數(shù)據(jù)塊指紋值與全零指紋值的比較。若指紋值相同,則逐字確認(rèn)數(shù)據(jù)是否全零。如確認(rèn)是全零數(shù)據(jù),則僅僅標(biāo)記元數(shù)據(jù),不進(jìn)行數(shù)據(jù)的落盤。從而節(jié)省SSD存儲(chǔ)空間,縮短I/O路徑,提高系統(tǒng)性能。

打造內(nèi)外兼修、軟硬皆強(qiáng)的全閃存儲(chǔ)  

總結(jié)下來(lái),全閃存儲(chǔ)不但需要在硬件層面采用閃存盤乃至SCM級(jí)介質(zhì),還需要通過軟件棧的全面優(yōu)化去發(fā)揮出高速介質(zhì)的強(qiáng)大性能,浪潮全閃存儲(chǔ)正是這樣一款內(nèi)外兼修,軟硬皆強(qiáng)的產(chǎn)品。正是浪潮存儲(chǔ)部門孜孜不倦的努力,不斷在全球存儲(chǔ)性能委員會(huì)SPC-1這個(gè)平臺(tái)上創(chuàng)造了一個(gè)又一個(gè)的佳績(jī):浪潮存儲(chǔ)先后刷新了16控、8控、單位成本性能三項(xiàng)世界記錄。

消息來(lái)源:浪潮
China-PRNewsire-300-300.png
全球TMT
微信公眾號(hào)“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營(yíng)動(dòng)態(tài)、財(cái)報(bào)信息、企業(yè)并購(gòu)消息。掃描二維碼,立即訂閱!
collection