作者:周立旸,IBM 大中華區(qū)科技事業(yè)部存儲軟件產品總監(jiān)
北京2024年2月1日 /美通社/ -- 一年前,IBM 將 Red Hat 存儲產品的路線圖及團隊集成至 IBM存儲業(yè)務(IBM Storage)。在此期間,企業(yè)在擴展 AI 時正面臨前所未有的數據挑戰(zhàn):在多個位置、以多種形式存儲的數據量飆升,但數據質量較差。為了幫助客戶解決這一問題,我們需要領先的解決方案對客戶的基礎架構進行現代化改造,以支持其數字化轉型。這主要涉及在本地和云環(huán)境中提供一致的應用和數據存儲。此外,還需要幫助客戶采用云原生架構,實現公有云在成本、速度和彈性等方面的優(yōu)勢。作為業(yè)界領先的開源軟件定義存儲平臺,IBM Storage Ceph(前身為 Red Hat Ceph)正是實現這一目標所需的基石。
在數據管理方面,軟件定義存儲 (SDS) 已成為一股變革力量。與傳統(tǒng)的傳統(tǒng)存儲陣列相比,它具有許多優(yōu)勢,包括極高的靈活性與可擴展性,這非常適用于處理生成式 AI 等最新用例。借助 IBM Storage Ceph,用戶可從底層硬件中提取存儲資源,實現數據存儲的動態(tài)分配和高效利用。這種靈活性不僅可以簡化管理流程,還有助于提高敏捷性,適應不斷變化的業(yè)務需求,并將隨著新工作負載的增加而擴展計算和容量。這一自我修復和自我管理的平臺可在行業(yè)標準硬件上運行,并大規(guī)模地提供統(tǒng)一的文件存儲、塊存儲和對象存儲服務。[1] 統(tǒng)一存儲可以幫助客戶將在獨立文件或塊存儲上運行的傳統(tǒng)應用,和包含單一設備對象存儲的通用平臺連接起來。
Ceph 針對大型單站點和多站點部署進行了優(yōu)化,經過高效擴展可以支持數百 PB 級數據和數百億個對象,[2]這對于傳統(tǒng)工作負載和生成式 AI 工作負載至關重要。IBM Storage Ceph 可擴展、彈性且安全,支持更傳統(tǒng)的工作負載,例如 Red Hat OpenShift 或 RedHat OpenStack 上的 MySQL 和 MongoDB,是支持數據湖倉和 AI/ML 開源框架的理想之選。這也是 IBM watsonx.data 包含 IBM Storage Ceph 768 TiB 裸容量授權的原因之一;前者是 IBM推出的開放、可治理、定制化的數據湖倉架構,并針對數據、分析和 AI 工作負載進行了優(yōu)化。
計算密集型和數據密集型工作負載的理想底座
非結構化數據的爆炸式增長和生成式 AI 相互影響,也相輔相成。Gartner 在其《2023 年企業(yè)數據存儲的主要趨勢》報告中指出:"到 2028 年,大型企業(yè)的本地、邊緣和公有云上的非結構化數據將比 2023 年年中增加兩倍。"[3] 非結構化數據(如文本、圖像和視頻)的激增為訓練生成式 AI 模型提供了廣泛而多樣的資源,而生成式 AI 可支持用戶從非結構化數據中提前寶貴的洞察。這種協(xié)同作用形成了一個反饋循環(huán),生成式 AI 在大量非結構化數據的基礎上蓬勃發(fā)展,而 AI 持續(xù)生成的真實數據則進一步豐富和完善人們對非結構化數據集的理解,從而促進創(chuàng)新和進步。
根據上述報告[4],預計到 2028 年,將有 70% 的文件和對象數據部署在集成的非結構化數據存儲平臺上(高于 2023 年的 35%),組織需要能夠加速數據提取、數據清理和分類、元數據管理和擴充、云規(guī)模容量管理和部署(如軟件定義存儲)的存儲管理解決方案。IBM Storage Ceph 可實現無縫擴展,滿足不斷增長的數據需求;其自我管理功能確保系統(tǒng)適應不斷變化的條件,輕松實現數據完整性。
為了在整個組織中加速和擴展數據和 AI,并最終改善業(yè)務成果,企業(yè)必須有意識地采用混合云設計(hybrid cloud by design)。這包括通過云原生運營模式在本地使用存儲服務,以解決公有云上的部分企業(yè)級功能不可用、數據主權和成本等問題。IBM Storage Ceph 的"即插即用"架構簡化了與現有基礎架構的集成,包括各種平臺、云環(huán)境、虛擬管理程序、開源數據存儲庫(如 Apache Iceberg 或 Apache Parquet)以及完整解決方案(如 watsonx.ai、watsonx.data 等)。新節(jié)點或設備可以無縫添加到集群中,而不會出現中斷或服務停機。它為客戶提供來一種簡單高效的方式,來使用 watsonx.data 和其他新一代 AI 工作負載構建數據湖倉。
Snap Inc.相關負責人表示:"在 Snap,我們對數據存儲的需求越來越大,需要一個能夠快速擴展、滿足性能 KPI 且具有成本效益的平臺。IBM Storage Ceph 憑借其簡單可擴展的架構、易于管理的界面和經濟高效的軟件定義部署,成為我們的首選平臺。IBM Storage Ceph 還擁有 IBM 的世界級專長和支持,這也是我們決定將其引入關鍵業(yè)務的一個重要原因。"
利用NVMe over TCP 技術實現快速數據訪問
去年,IBM 對 Ceph 進行了幾項重要更新,包括最近的 IBM Storage Ceph 7.0。新一代Ceph 平臺為 NVMe/TCP 功能做好了準備。它保留了傳統(tǒng) NVMe 的低延遲和高帶寬特性,可以在存儲設備、服務器和云平臺之間實現更快的數據傳輸,因此適用于需要超快速存儲訪問的應用,例如數據庫、分析和內容傳輸;并且兼容傳統(tǒng)的網絡技術投資,從而簡化了基礎架構。這些優(yōu)勢將幫助客戶采用軟件定義的方法,在速度、敏捷性和經濟性方面享受云端體驗。
NVMe/TCP 可以幫助 Ceph 通過擴展架構彌補傳統(tǒng)塊存儲的不足。借助 NVMe/TCP,Ceph 將與 VMware 等平臺集成,幫助企業(yè)在自己的數據中心復制云架構,擺脫昂貴且固定的 SAN 網絡和單片存儲陣列。
Ceph 7.0 的其他新功能:
借助IBM Storage Ceph 實現云規(guī)模經濟
由于 IBM Storage Ceph 將數據作為對象存儲在邏輯存儲池中,因此單個集群可以有多個存儲池,每個存儲池都將針對不同的性能或容量需求進行調整。這樣一來,客戶能夠更輕松快速地訪問各種經過分類的內容數據和上下文數據,存儲容量僅受組織基礎架構規(guī)模的限制;與傳統(tǒng)存儲陣列架構相比,IBM Storage Ceph可消除硬件限制,實現大規(guī)模成本降低。
加快價值實現的步伐
IBM 更進一步簡化了 Ceph 部署。借助 IBM Storage Ready Nodes for Ceph,該平臺可部署為完整的軟硬件解決方案,提供多種容量配置,針對運行 IBM Storage Ceph 工作負載進行了優(yōu)化。我們消除了配置中的不確定因素,使其更易于理解、配置和管理。
IBM Storage Ceph 的發(fā)展是 IBM 存儲的軟硬件產品通過擴展的容量與性能,加速價值實現、優(yōu)化客戶成本的又一例證。
了解更多信息,請訪問https://www.ibm.com/cn-zh/products/ceph
關于IBM
IBM 是全球領先的混合云、人工智能及企業(yè)服務提供商,幫助超過 175 個國家和地區(qū)的客戶,從其擁有的數據中獲取商業(yè)洞察,簡化業(yè)務流程,降低成本,并獲得行業(yè)競爭優(yōu)勢。金融服務、電信和醫(yī)療健康等關鍵基礎設施領域的超過 4000 家政府和企業(yè)實體依靠 IBM 混合云平臺和紅帽 OpenShift 快速、高效、安全地實現數字化轉型。IBM 在人工智能、量子計算、行業(yè)云解決方案和企業(yè)服務方面的突破性創(chuàng)新為我們的客戶提供了開放和靈活的選擇。對企業(yè)誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業(yè)務發(fā)展的基石。了解更多信息,請訪問:https://www.ibm.com/cn-zh
媒體聯絡人
[1], [2] https://www.redhat.com/en/resources/data-solutions-overview |
[3], [4]《2023 年企業(yè)數據存儲的主要趨勢》;作者:Chandra Mukhyala、Julia Palmer、Jeff Voge,2023 年 6 月 29 日 |