omniture

加速HPC和AI工作負載融合,英特爾以數(shù)據(jù)為中心產(chǎn)品組合發(fā)揮優(yōu)勢

英特爾
2019-06-19 21:40 7055
?在2019國際超算大會(ISC’19)上,英特爾介紹了一系列英特爾以數(shù)據(jù)為中心的產(chǎn)品組合如何改變下一代高性能計算(HPC)系統(tǒng),并推動全行業(yè)向E級超算不斷發(fā)展的最新情況。

北京2019年6月19日 /美通社/ -- 在2019國際超算大會(ISC’19)上,英特爾介紹了一系列英特爾以數(shù)據(jù)為中心的產(chǎn)品組合如何改變下一代高性能計算(HPC)系統(tǒng),并推動全行業(yè)向E級超算不斷發(fā)展的最新情況。

英特爾公司副總裁兼企業(yè)與政府事業(yè)部總經(jīng)理Rajeeb Hazra博士在2019年6月17日于德國法蘭克福舉行的2019國際超算大會上代表英特爾發(fā)表主題演講,介紹了英特爾最新的高性能計算產(chǎn)品和技術突破。
英特爾公司副總裁兼企業(yè)與政府事業(yè)部總經(jīng)理Rajeeb Hazra博士在2019年6月17日于德國法蘭克福舉行的2019國際超算大會上代表英特爾發(fā)表主題演講,介紹了英特爾最新的高性能計算產(chǎn)品和技術突破。

 

英特爾公司副總裁兼極限計算部門總經(jīng)理 Trish Damkroger 表示:“在當今以數(shù)據(jù)為中心的世界,英特爾將繼續(xù)推動創(chuàng)新并不斷提升產(chǎn)品性能。我們的高性能計算解決方案產(chǎn)品組合 -- 包括英特爾®至強®鉑金9200處理器和英特爾®傲騰?數(shù)據(jù)中心級持久內(nèi)存 -- 實現(xiàn)了前所未有的科學探索和發(fā)現(xiàn)?!?/p>

如今,先進的高性能計算系統(tǒng)同時借助傳統(tǒng)的高性能計算數(shù)據(jù)分析和人工智能技術,來高效處理最為復雜的科學問題。然而隨著高性能計算系統(tǒng)對計算性能的要求越來越高,內(nèi)存帶寬日益成為一個瓶頸。在日前舉行的2019國際超算大會上,英特爾展示了其以數(shù)據(jù)為中心的產(chǎn)品組合如何通過將高性能計算數(shù)據(jù)分析和人工智能加速整合到一個單一的計算環(huán)境中,并提供新的內(nèi)存和存儲模式為計算引擎提供支持,進而解決高性能計算系統(tǒng)面臨的獨特挑戰(zhàn)。

當前,英特爾以數(shù)據(jù)為中心的產(chǎn)品組合為系統(tǒng)架構(gòu)師提供了構(gòu)建先進計算系統(tǒng)的根基,賦能這些系統(tǒng)能夠傳輸、存儲和處理海量數(shù)據(jù)。針對那些對計算性能有著最高要求的系統(tǒng),英特爾近日還宣布,包括Atos*、慧與(HPE)*、聯(lián)想*、Penguin Computing*、Megware*等在內(nèi)的一些指定OEM廠商以及經(jīng)過授權(quán)的英特爾經(jīng)銷商目前已開始出貨基于英特爾®至強®鉑金9200處理器的預配置系統(tǒng)。作為第二代英特爾®至強®可擴展處理器產(chǎn)品系列的延續(xù),英特爾®至強®鉑金9200處理器系列為廣泛的工作負載和用途提供領先的性能,諸如科學模擬、財務分析、人工智能/深度學習、3D建模與分析、密碼學和數(shù)據(jù)壓縮等場景。英特爾®至強®鉑金9200處理器集成了英特爾®深度學習加速(英特爾DL Boost)技術,其人工智能性能相比上一代發(fā)布的至強®可擴展處理器提高多達30倍。[1]

在2019國際超算大會上,英特爾還與歐洲中期天氣預報中心(ECMWF)*、愛丁堡大學并行計算中心(EPCC)*[4]、富士通*、斯洛文尼亞IT服務提供商Arctur*以及NEXTGenIO項目[2]中的其它合作伙伴公布了多項不同超算應用項目中使用英特爾®傲騰?數(shù)據(jù)中心級持久內(nèi)存獲得的最新突破性性能。

  • 歐洲中期天氣預報中心(ECMWF)將其Fields Database(保存中期天氣預測的氣象數(shù)據(jù))存儲于持久內(nèi)存并分布在多個計算節(jié)點上之后,獲得了10倍[3]的更高帶寬。配備英特爾®傲騰?數(shù)據(jù)中心級持久內(nèi)存的計算節(jié)點不僅加快了ECMWF的全球天氣預測,還減少了運行其模型所需的I/O節(jié)點數(shù)量。
  • Arctur高性能計算中心與巴塞羅那超算中心攜手合作,在模擬輕型電動飛機的3D模型時,獲得了2倍3的速度提升,并在16個節(jié)點上將其OpenFOAM運行時間縮短了50%[3]
  • 愛丁堡大學并行計算中心(EPCC)在配備英特爾®傲騰?數(shù)據(jù)中心持久內(nèi)存的計算節(jié)點上運行代碼后,在CASTEP*材料科學應用上實現(xiàn)了2倍[3]的高吞吐量,加快了跨多個領域的材料科學研究。

此外,英特爾進一步加快英特爾®傲騰?數(shù)據(jù)中心級持久內(nèi)存在高性能計算系統(tǒng)中的應用,并宣布了一項針對超算推出的,利用英特爾®傲騰?數(shù)據(jù)中心級持久內(nèi)存和分布式異步對象存儲(DAOS)的革命性全新存儲架構(gòu)。其中,DAOS是一種提供高帶寬、低延遲和高I/O操作的開源軟件定義橫向擴展對象存儲,專為高性能計算和人工智能工作負載的融合而設計。這一全新的軟件定義存儲引擎消除了目前并行文件系統(tǒng)中的若干局限性。

ALCF-X*項目總監(jiān)/E級計算系統(tǒng)副總監(jiān)Susan Coghlan表示:“阿貢領導力計算機構(gòu)(ALCF)將作為‘極光’(Aurora)項目的一部分首次大規(guī)模生產(chǎn)部署DAOS存儲系統(tǒng),到2021年,‘極光’(Aurora)將成為美國第一個E級計算系統(tǒng)。DAOS存儲系統(tǒng)旨在提供E級系統(tǒng)上的I/O密集型工作負載所需的元數(shù)據(jù)運算速度和帶寬?!?/p>

在2019國際超算大會上,英特爾還披露了其有關One API項目的更多信息。該項目將提供一個統(tǒng)一的編程模型,以簡化多樣化計算架構(gòu)上的應用開發(fā)。同時,英特爾的One API將基于行業(yè)標準和開放規(guī)范,并可以與OpenMP*、MPI*和Fortran*等進行交互操作。

[1] 配備英特爾® DL Boost獲得最高30倍的人工智能性能,對比了2017年7月發(fā)布的英特爾®至強®鉑金8180處理器。英特爾于2019年2月26日前進行測試。平臺:Dragon rock 2 socket 英特爾®至強®鉑金9282(每個插槽56個核心),啟用超線程,啟用睿頻,總內(nèi)存768 GB(24個插槽/ 32 GB/ 2933 MHz),BIOS:SE5C620.86B.0D.01.0241.112020180249,Centos 7 Kernel 3.10.0-957.5.1.el7.x86_64,深度學習框架:Intel® Optimization for Caffe版:https://github.com/intel/caffe d554cbf1, ICC 2019.2.187,MKL DNN版本:v0.17(commit hash:830a10059a018cd2634d94195140cf2d8790a75a),模型: https://github.com/intel/caffe/blob/master/models/intel_optimized_models/int8/resnet50_int8_full_conv.prototxt,BS=64,無數(shù)據(jù)層DummyData:3x224x224,56個實例/2個插槽,數(shù)據(jù)類型:INT8 vs 英特爾于2017年7月11日前測試:2S英特爾®至強®鉑金8180 CPU @ 2.50GHz(28個核心),禁用超線程,禁用睿頻,通過intel_pstate驅(qū)動程序把調(diào)速器設置到“高性能”,384GB DDR4-2666 ECC RAM。CentOS Linux版本7.3.1611 (Core),Linux內(nèi)核3.10.0-514.10.2.el7.x86_64。固態(tài)盤:英特爾®固態(tài)盤DC S3700系列(800GB,2.5in SATA 6Gb/s,25nm,MLC)。性能測量使用了:環(huán)境變量:KMP_AFFINITY=’granularity=fine, compact‘, OMP_NUM_THREADS=56, CPU Freq set with cpupower frequency-set -d 2.5G -u 3.8G -g performance。Caffe:(http://github.com/intel/caffe/),修訂版f96b759f71b2281835f690af267158b82b150b5c。推理使用“caffe time –forward_only”指令測量,訓練使用“caffe time”指令測量。對于“ConvNet”拓撲,使用了虛擬數(shù)據(jù)集。對于其它拓撲,數(shù)據(jù)存儲在本地存儲設備上并在訓練之前在內(nèi)存中緩存。拓撲規(guī)格來自于 https://github.com/intel/caffe/tree/master/models/intel_optimized_models (ResNet-50)。英特爾C++編譯器17.0.2 20170213版,英特爾MKL小型函數(shù)庫2018.0.20170425版。Caffe與“numactl -l”運行。

[2] NEXTGenIO項目由671951號Grant Agreement下的歐盟Horizon 2020研究與創(chuàng)新項目進行資助。

[3] 系統(tǒng)配置細節(jié)由EPCC提供:

  • 34個配備英特爾至強可擴展處理器8260M CPU的DP節(jié)點(A0步進),富士通主板
  • 每個插槽96GB DDR4 DRAM(6×16 GB DIMMs,2666速度級),加1.5 TB英特爾傲騰數(shù)據(jù)中心級持久內(nèi)存(6×256 GB DIMMs,QS)
  • 雙軌Omni-Path網(wǎng)絡(每個節(jié)點2個OPA網(wǎng)卡),通過2個48端口OPA交換機連接
  • 兩個運行Lustre的額外存儲服務器節(jié)點

[4] EPCC是愛丁堡大學先進計算中心

關于英特爾

英特爾(NASDAQ: INTC)是全球半導體行業(yè)的引領者,以計算和通信技術奠定全球創(chuàng)新基石,塑造以數(shù)據(jù)為中心的未來。我們通過精尖制造的專長,幫助保護、驅(qū)動和連接數(shù)十億設備以及智能互聯(lián)世界的基礎設施 -- 從云、網(wǎng)絡到邊緣設備以及它們之間的一切,并幫助解決世界上最艱巨的問題和挑戰(zhàn)。如需了解更多信息,請訪問英特爾中國新聞中心 newsroom.intel.cn 以及官方網(wǎng)站 intel.cn

英特爾和英特爾標識是英特爾公司在美國和其他國家(地區(qū))的商標。

*文中涉及的其它名稱及品牌屬于各自所有者資產(chǎn)。

消息來源:英特爾
China-PRNewsire-300-300.png
相關鏈接:
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection