omniture

海量不止是容量,曙光問鼎MassStor100榜首

2021-02-01 14:32 6651
基于多年技術(shù)積累以及多套百PB級別超大規(guī)模存儲系統(tǒng)研制和運維經(jīng)驗,曙光公司認為,只有擁有如下核心技術(shù)研發(fā)實力,才能更好的應對各行業(yè)海量數(shù)據(jù)存儲的挑戰(zhàn)。

北京2021年2月1日 /美通社/ -- 眾所周知,如今我們正身處信息爆炸的時代,隨著新基建的逐步深入,各行各業(yè)都在快速推進數(shù)字化轉(zhuǎn)型,隨之誕生的各類創(chuàng)新技術(shù)層出不窮。這些新技術(shù)的發(fā)展,大多都圍繞著海量數(shù)據(jù)這個主題展開。如人工智能,就是以海量數(shù)據(jù)為生產(chǎn)要素;5G技術(shù)的成熟應用,為海量數(shù)據(jù)快速生成與傳輸筑造了通路基礎(chǔ),區(qū)塊鏈又為海量數(shù)據(jù)的去中心化交易提供了技術(shù)支撐。此類新技術(shù)的應用與推廣必然帶來海量數(shù)據(jù)的規(guī)?;奂瑪?shù)十甚至數(shù)百PB的存儲系統(tǒng),將成為業(yè)界常態(tài)。應對海量存儲壓力,絕是不僅僅靠設(shè)備堆砌來解決容量問題這樣簡單。容量的上的疊加也將引發(fā)技術(shù)的質(zhì)變,存儲系統(tǒng)面臨諸多關(guān)鍵技術(shù)上的挑戰(zhàn)。

曙光是國內(nèi)第一家專注海量存儲系統(tǒng)研制的廠商,2009年第一代全自研ParaStor分布式存儲系統(tǒng)誕生,奠定了構(gòu)建海量數(shù)據(jù)存儲最佳解決方案的基石。同年,曙光為用戶構(gòu)建了當時國內(nèi)最大的16PB單一存儲系統(tǒng)。在10多年的發(fā)展過程中,曙光始終圍繞海量分布式存儲系統(tǒng)進行架構(gòu)的深度優(yōu)化甚至局部重構(gòu),以應對云、人工智能、區(qū)塊鏈等技術(shù)帶來的海量數(shù)據(jù)新的挑戰(zhàn)。今天,曙光ParaStor在科研教育、氣象環(huán)保、生命科學、能源、區(qū)塊鏈等領(lǐng)域打造了一個又一個海量存儲最佳實踐,完成了從單套系統(tǒng)23PB、56PB到百PB級別的自我技術(shù)超越,獲得了市場的高度認可。

基于多年技術(shù)積累以及多套百PB級別超大規(guī)模存儲系統(tǒng)研制和運維經(jīng)驗,曙光公司認為,只有擁有如下核心技術(shù)研發(fā)實力,才能更好的應對各行業(yè)海量數(shù)據(jù)存儲的挑戰(zhàn)。

先進、創(chuàng)新的底層存儲技術(shù)基座

在基礎(chǔ)架構(gòu)層面,傳統(tǒng)集中式存儲架構(gòu)由于Scale-up擴展方式的局限性,無法對海量數(shù)據(jù)的容量與性能需求實現(xiàn)良好的支撐,天然適合此類場景分布式存儲架構(gòu)逐漸成為市場主流。為了應對海量存儲的挑戰(zhàn),曙光ParaStor除了采用分布式架構(gòu)之外,還可靈活選擇對稱與非對稱部署兩種模式,以更具性價比的硬件構(gòu)建成本,支撐千億級別文件、EB級存儲空間的擴展需要。


除了架構(gòu)之外,決定存儲系統(tǒng)先進性的另一關(guān)鍵要素是底層數(shù)據(jù)管理技術(shù)。目前業(yè)界分布式存儲系統(tǒng),大多采用ext4、xfs等開源文件系統(tǒng)進行底層磁盤管理,以降低代碼開發(fā)量,縮短產(chǎn)品研發(fā)周期。但這種間接的磁盤管理方式,無法更直接、高效地發(fā)揮磁盤性能。特別是在配置了數(shù)千甚至上萬塊磁盤的海量存儲系統(tǒng)中,單個磁盤的性能衰減會成指數(shù)級放大,最終影響存儲系統(tǒng)的整體性能和可靠性。為解決這個難題,曙光在ParaStor上創(chuàng)新性地開發(fā)了OBS本地對象管理系統(tǒng)。利用OBS可以精細化控制磁盤IO,使應用層的多個小隨機IO智能組合為大的順序IO,減少磁盤操作,使數(shù)據(jù)布局和負載更均衡,顯著提升多事務(wù)并發(fā)、IO異步處理等海量數(shù)據(jù)應用場景的系統(tǒng)性能。并為熱點數(shù)據(jù)加速、自動分層、重刪壓縮等進階數(shù)據(jù)管理服務(wù)的高效運行打下了良好的基礎(chǔ)。

海量并發(fā)應用場景下的深度性能優(yōu)化

海量數(shù)據(jù)應用場景下,應用IO模型復雜多樣、文件粒度差異很大,為了匹配不同應用對帶寬、IOPS、延時的個性化需求,要求存儲系統(tǒng)具備從磁盤管理、網(wǎng)絡(luò)層到協(xié)議層整個IO路徑上的深度優(yōu)化能力。同時,隨著參與數(shù)據(jù)存儲和處理節(jié)點數(shù)量的增加,由此帶來的資源開銷也會攀升,同樣需要針對性的優(yōu)化設(shè)計。

從建設(shè)成本角度考量,海量存儲系統(tǒng)仍以機械磁盤為主角。機械磁盤由于尋址方式的物理設(shè)計,在處理隨機小文件IO時會有先天的性能劣勢,單純依靠硬盤數(shù)量的增加無法應對海量小文件的性能挑戰(zhàn)。曙光ParaStor基于底層OBS管理系統(tǒng)實現(xiàn)與閃存介質(zhì)的深度融合,使用少量閃存高效覆蓋熱點IO需求,另一方面通過小IO合并、元數(shù)據(jù)緩存、動態(tài)智能預讀等多種方式,顯著提升海量大、小文件混合應用場景的整體用戶性能體驗。

同時,曙光ParaStor通過高性能網(wǎng)絡(luò)Infiniband RDMA協(xié)議支持、專屬高性能POSIX客戶端等技術(shù),針對具體的應用場景,單流帶寬可優(yōu)化至18GB/s,在首屆中國海量存儲系統(tǒng)MassStor100排行榜中,一套裸容量為100PB的存儲系統(tǒng),其系統(tǒng)聚合帶寬高達1TB/s,代表了業(yè)界最高水準。

隨著存儲系統(tǒng)規(guī)模的擴大,存儲客戶端對于CPU等資源的占用、數(shù)據(jù)網(wǎng)絡(luò)的負載和管理壓力也會增加,一旦某個節(jié)點由于上述原因出現(xiàn)阻塞,將對存儲系統(tǒng)的性能甚至可用性造成重大影響。曙光ParaStor分布式存儲系統(tǒng),針對大規(guī)模集群的資源占用進行了多重細粒度的優(yōu)化措施,保障了存儲系統(tǒng)性能的恒定發(fā)揮和數(shù)據(jù)訪問的可用性。

超大規(guī)模下的數(shù)據(jù)一致性和可靠性保障

在數(shù)據(jù)一致性保證層面,海量存儲系統(tǒng)必然伴隨著大量客戶端的并發(fā)訪問需求。通過軟件層面的高效調(diào)度,保障所有客戶端數(shù)據(jù)訪問的強一致性,避免對同一文件的并發(fā)讀寫對彼此數(shù)據(jù)的破壞,是一個成熟海量存儲系統(tǒng)的必備素質(zhì)。ParaStor存儲在分布式鎖(Distributed Lock Management,DLM)的使用與優(yōu)化方面投入了大量精力,不斷提升大規(guī)模分布式鎖獲取與釋放的性能與可用性,并增加了可重入、非阻塞等特性,有效保障高并發(fā)共享訪問場景的順序、秩序與效率,在氣象環(huán)保、能源地質(zhì)等海量數(shù)據(jù)處理場景得到了廣泛的應用。

在可靠性保障方面,硬件單點故障的防范只是海量存儲系統(tǒng)的初級需求,智能化故障預處理與高效無感知的系統(tǒng)自愈才能讓系統(tǒng)真正可靠穩(wěn)定運行。以磁盤為例,對于磁盤的單點故障,我們可以通過成熟的多副本、糾刪碼、RAID等技術(shù)實現(xiàn)數(shù)據(jù)重構(gòu),對于中小規(guī)模存儲系統(tǒng),磁盤故障屬于小概率事件,用戶只需要在某一段時間內(nèi)對前端業(yè)務(wù)性能與重構(gòu)性能做簡單取舍即可。但對于一個管理著上萬塊磁盤的百PB級海量存儲系統(tǒng)而言,意味著平均每天會有約2-5塊磁盤故障,存儲系統(tǒng)大部分時間內(nèi)都處于業(yè)務(wù)與重構(gòu)的資源爭用狀態(tài)。如果沒有妥善的處理方式,用戶每天都會面臨著要保障生產(chǎn)業(yè)務(wù)性能還是保障數(shù)據(jù)安全的靈魂拷問。曙光ParaStor存儲系統(tǒng)為大集群場景定向開發(fā)了內(nèi)部資源動態(tài)調(diào)度管理算法,在充分發(fā)揮硬件處理能力的基礎(chǔ)上有效避免資源爭搶,同時通過多重技術(shù)顯著縮短故障數(shù)據(jù)重建時間,解決了性能與可靠性沖突這個海量存儲故障處理的主要矛盾。

智能化運維挑戰(zhàn)上千節(jié)點的管理

在運維管理方面,維護由數(shù)百甚至數(shù)千節(jié)點構(gòu)成的海量存儲系統(tǒng),僅靠傳統(tǒng)的管理方式顯然是不可行的,各節(jié)點間的信息實時同步開銷會成為存儲系統(tǒng)的不可承受之重。曙光ParaStor在集群通信管理模塊中,將節(jié)點按照不同角色抽象成多個管理分組,以分組為單位進行管理信令交互,增大了信息傳遞顆粒度以降低通信頻度,實現(xiàn)管理流量的去中心化錯峰交互,集群信息秒級同步,使系統(tǒng)中所有節(jié)點都能“統(tǒng)一思想,明確目標”,提升存儲系統(tǒng)的整體戰(zhàn)斗力。

積土成山,風雨興焉;積水成淵,蛟龍生焉。正如常規(guī)軟件處理方式無法應對巨量數(shù)據(jù)集合的捕捉、管理與計算,而必須引入大數(shù)據(jù)等新型數(shù)據(jù)處理模式一樣,海量數(shù)據(jù)存儲在基礎(chǔ)架構(gòu)、數(shù)據(jù)管理、性能優(yōu)化、數(shù)據(jù)一致性、可靠性保障、運維管理等需求也需要全方位的定向深度優(yōu)化才可能完美承載。曙光ParaStor在海量存儲領(lǐng)域持續(xù)深耕,正在為全國數(shù)千家用戶管理著超過10EB的核心數(shù)據(jù),為云計算、軌道交通、氣象環(huán)保、基因測序、能源勘探等行業(yè)用戶的海量數(shù)據(jù)管理提供了堅實穩(wěn)定的保障。放眼未來,曙光存儲將繼續(xù)總結(jié)與吸收海量數(shù)據(jù)存儲系統(tǒng)優(yōu)化與運維過程中積累的寶貴經(jīng)驗,并在數(shù)據(jù)全生命周期管理,在線實時數(shù)據(jù)處理,以及與區(qū)塊鏈、AI、容器等新興技術(shù)深度融合等方面加強投入,為用戶提供更快速、更可靠、更智能、更便捷的一站式數(shù)據(jù)管理服務(wù)。

消息來源:中科曙光
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection