加速HPC和AI工作負(fù)載融合，英特爾以數(shù)據(jù)為中心產(chǎn)品組合發(fā)揮優(yōu)勢

英特爾

2019-06-19 21:40 7601

?在2019國際超算大會(huì)（ISC’19）上，英特爾介紹了一系列英特爾以數(shù)據(jù)為中心的產(chǎn)品組合如何改變下一代高性能計(jì)算（HPC）系統(tǒng)，并推動(dòng)全行業(yè)向E級(jí)超算不斷發(fā)展的最新情況。

北京2019年6月19日 /美通社/ -- 在2019國際超算大會(huì)（ISC’19）上，英特爾介紹了一系列英特爾以數(shù)據(jù)為中心的產(chǎn)品組合如何改變下一代高性能計(jì)算（HPC）系統(tǒng)，并推動(dòng)全行業(yè)向E級(jí)超算不斷發(fā)展的最新情況。

英特爾公司副總裁兼企業(yè)與政府事業(yè)部總經(jīng)理Rajeeb Hazra博士在2019年6月17日于德國法蘭克福舉行的2019國際超算大會(huì)上代表英特爾發(fā)表主題演講，介紹了英特爾最新的高性能計(jì)算產(chǎn)品和技術(shù)突破。

英特爾公司副總裁兼極限計(jì)算部門總經(jīng)理 Trish Damkroger 表示：“在當(dāng)今以數(shù)據(jù)為中心的世界，英特爾將繼續(xù)推動(dòng)創(chuàng)新并不斷提升產(chǎn)品性能。我們的高性能計(jì)算解決方案產(chǎn)品組合 -- 包括英特爾^®至強(qiáng)^®鉑金9200處理器和英特爾^®傲騰?數(shù)據(jù)中心級(jí)持久內(nèi)存 -- 實(shí)現(xiàn)了前所未有的科學(xué)探索和發(fā)現(xiàn)。”

如今，先進(jìn)的高性能計(jì)算系統(tǒng)同時(shí)借助傳統(tǒng)的高性能計(jì)算數(shù)據(jù)分析和人工智能技術(shù)，來高效處理最為復(fù)雜的科學(xué)問題。然而隨著高性能計(jì)算系統(tǒng)對(duì)計(jì)算性能的要求越來越高，內(nèi)存帶寬日益成為一個(gè)瓶頸。在日前舉行的2019國際超算大會(huì)上，英特爾展示了其以數(shù)據(jù)為中心的產(chǎn)品組合如何通過將高性能計(jì)算數(shù)據(jù)分析和人工智能加速整合到一個(gè)單一的計(jì)算環(huán)境中，并提供新的內(nèi)存和存儲(chǔ)模式為計(jì)算引擎提供支持，進(jìn)而解決高性能計(jì)算系統(tǒng)面臨的獨(dú)特挑戰(zhàn)。

當(dāng)前，英特爾以數(shù)據(jù)為中心的產(chǎn)品組合為系統(tǒng)架構(gòu)師提供了構(gòu)建先進(jìn)計(jì)算系統(tǒng)的根基，賦能這些系統(tǒng)能夠傳輸、存儲(chǔ)和處理海量數(shù)據(jù)。針對(duì)那些對(duì)計(jì)算性能有著最高要求的系統(tǒng)，英特爾近日還宣布，包括Atos*、慧與(HPE)*、聯(lián)想*、Penguin Computing*、Megware*等在內(nèi)的一些指定OEM廠商以及經(jīng)過授權(quán)的英特爾經(jīng)銷商目前已開始出貨基于英特爾^®至強(qiáng)^®鉑金9200處理器的預(yù)配置系統(tǒng)。作為第二代英特爾^®至強(qiáng)^®可擴(kuò)展處理器產(chǎn)品系列的延續(xù)，英特爾^®至強(qiáng)^®鉑金9200處理器系列為廣泛的工作負(fù)載和用途提供領(lǐng)先的性能，諸如科學(xué)模擬、財(cái)務(wù)分析、人工智能/深度學(xué)習(xí)、3D建模與分析、密碼學(xué)和數(shù)據(jù)壓縮等場景。英特爾^®至強(qiáng)^®鉑金9200處理器集成了英特爾^®深度學(xué)習(xí)加速（英特爾DL Boost）技術(shù)，其人工智能性能相比上一代發(fā)布的至強(qiáng)^®可擴(kuò)展處理器提高多達(dá)30倍。^[1]

在2019國際超算大會(huì)上，英特爾還與歐洲中期天氣預(yù)報(bào)中心（ECMWF）*、愛丁堡大學(xué)并行計(jì)算中心（EPCC）*^[4]、富士通*、斯洛文尼亞IT服務(wù)提供商Arctur*以及NEXTGenIO項(xiàng)目^[2]中的其它合作伙伴公布了多項(xiàng)不同超算應(yīng)用項(xiàng)目中使用英特爾^®傲騰?數(shù)據(jù)中心級(jí)持久內(nèi)存獲得的最新突破性性能。

歐洲中期天氣預(yù)報(bào)中心（ECMWF）將其Fields Database（保存中期天氣預(yù)測的氣象數(shù)據(jù)）存儲(chǔ)于持久內(nèi)存并分布在多個(gè)計(jì)算節(jié)點(diǎn)上之后，獲得了10倍^[3]的更高帶寬。配備英特爾^®傲騰?數(shù)據(jù)中心級(jí)持久內(nèi)存的計(jì)算節(jié)點(diǎn)不僅加快了ECMWF的全球天氣預(yù)測，還減少了運(yùn)行其模型所需的I/O節(jié)點(diǎn)數(shù)量。
Arctur高性能計(jì)算中心與巴塞羅那超算中心攜手合作，在模擬輕型電動(dòng)飛機(jī)的3D模型時(shí)，獲得了2倍³的速度提升，并在16個(gè)節(jié)點(diǎn)上將其OpenFOAM運(yùn)行時(shí)間縮短了50%^[3]。
愛丁堡大學(xué)并行計(jì)算中心（EPCC）在配備英特爾^®傲騰?數(shù)據(jù)中心持久內(nèi)存的計(jì)算節(jié)點(diǎn)上運(yùn)行代碼后，在CASTEP*材料科學(xué)應(yīng)用上實(shí)現(xiàn)了2倍^[3]的高吞吐量，加快了跨多個(gè)領(lǐng)域的材料科學(xué)研究。

此外，英特爾進(jìn)一步加快英特爾^®傲騰?數(shù)據(jù)中心級(jí)持久內(nèi)存在高性能計(jì)算系統(tǒng)中的應(yīng)用，并宣布了一項(xiàng)針對(duì)超算推出的，利用英特爾^®傲騰?數(shù)據(jù)中心級(jí)持久內(nèi)存和分布式異步對(duì)象存儲(chǔ)（DAOS）的革命性全新存儲(chǔ)架構(gòu)。其中，DAOS是一種提供高帶寬、低延遲和高I/O操作的開源軟件定義橫向擴(kuò)展對(duì)象存儲(chǔ)，專為高性能計(jì)算和人工智能工作負(fù)載的融合而設(shè)計(jì)。這一全新的軟件定義存儲(chǔ)引擎消除了目前并行文件系統(tǒng)中的若干局限性。

ALCF-X*項(xiàng)目總監(jiān)/E級(jí)計(jì)算系統(tǒng)副總監(jiān)Susan Coghlan表示：“阿貢領(lǐng)導(dǎo)力計(jì)算機(jī)構(gòu)（ALCF）將作為‘極光’（Aurora）項(xiàng)目的一部分首次大規(guī)模生產(chǎn)部署DAOS存儲(chǔ)系統(tǒng)，到2021年，‘極光’（Aurora）將成為美國第一個(gè)E級(jí)計(jì)算系統(tǒng)。DAOS存儲(chǔ)系統(tǒng)旨在提供E級(jí)系統(tǒng)上的I/O密集型工作負(fù)載所需的元數(shù)據(jù)運(yùn)算速度和帶寬。”

在2019國際超算大會(huì)上，英特爾還披露了其有關(guān)One API項(xiàng)目的更多信息。該項(xiàng)目將提供一個(gè)統(tǒng)一的編程模型，以簡化多樣化計(jì)算架構(gòu)上的應(yīng)用開發(fā)。同時(shí)，英特爾的One API將基于行業(yè)標(biāo)準(zhǔn)和開放規(guī)范，并可以與OpenMP*、MPI*和Fortran*等進(jìn)行交互操作。

^[1] 配備英特爾® DL Boost獲得最高30倍的人工智能性能，對(duì)比了2017年7月發(fā)布的英特爾®至強(qiáng)®鉑金8180處理器。英特爾于2019年2月26日前進(jìn)行測試。平臺(tái)：Dragon rock 2 socket 英特爾®至強(qiáng)®鉑金9282（每個(gè)插槽56個(gè)核心），啟用超線程，啟用睿頻，總內(nèi)存768 GB（24個(gè)插槽/ 32 GB/ 2933 MHz），BIOS：SE5C620.86B.0D.01.0241.112020180249，Centos 7 Kernel 3.10.0-957.5.1.el7.x86_64，深度學(xué)習(xí)框架：Intel® Optimization for Caffe版：https://github.com/intel/caffe d554cbf1, ICC 2019.2.187，MKL DNN版本：v0.17（commit hash：830a10059a018cd2634d94195140cf2d8790a75a），模型： https://github.com/intel/caffe/blob/master/models/intel_optimized_models/int8/resnet50_int8_full_conv.prototxt，BS=64，無數(shù)據(jù)層DummyData:3x224x224，56個(gè)實(shí)例/2個(gè)插槽，數(shù)據(jù)類型：INT8 vs 英特爾于2017年7月11日前測試：2S英特爾®至強(qiáng)®鉑金8180 CPU @ 2.50GHz（28個(gè)核心），禁用超線程，禁用睿頻，通過intel_pstate驅(qū)動(dòng)程序把調(diào)速器設(shè)置到“高性能”，384GB DDR4-2666 ECC RAM。CentOS Linux版本7.3.1611 (Core)，Linux內(nèi)核3.10.0-514.10.2.el7.x86_64。固態(tài)盤：英特爾®固態(tài)盤DC S3700系列（800GB，2.5in SATA 6Gb/s，25nm，MLC）。性能測量使用了：環(huán)境變量：KMP_AFFINITY=’granularity=fine, compact‘, OMP_NUM_THREADS=56, CPU Freq set with cpupower frequency-set -d 2.5G -u 3.8G -g performance。Caffe：（http://github.com/intel/caffe/），修訂版f96b759f71b2281835f690af267158b82b150b5c。推理使用“caffe time –forward_only”指令測量，訓(xùn)練使用“caffe time”指令測量。對(duì)于“ConvNet”拓?fù)?，使用了虛擬數(shù)據(jù)集。對(duì)于其它拓?fù)?，?shù)據(jù)存儲(chǔ)在本地存儲(chǔ)設(shè)備上并在訓(xùn)練之前在內(nèi)存中緩存。拓?fù)湟?guī)格來自于 https://github.com/intel/caffe/tree/master/models/intel_optimized_models (ResNet-50)。英特爾C++編譯器17.0.2 20170213版，英特爾MKL小型函數(shù)庫2018.0.20170425版。Caffe與“numactl -l”運(yùn)行。

^[2]NEXTGenIO項(xiàng)目由671951號(hào)Grant Agreement下的歐盟Horizon 2020研究與創(chuàng)新項(xiàng)目進(jìn)行資助。

^[3] 系統(tǒng)配置細(xì)節(jié)由EPCC提供：

34個(gè)配備英特爾至強(qiáng)可擴(kuò)展處理器8260M CPU的DP節(jié)點(diǎn)（A0步進(jìn)），富士通主板
每個(gè)插槽96GB DDR4 DRAM（6×16 GB DIMMs，2666速度級(jí)），加1.5 TB英特爾傲騰數(shù)據(jù)中心級(jí)持久內(nèi)存（6×256 GB DIMMs，QS）
雙軌Omni-Path網(wǎng)絡(luò)（每個(gè)節(jié)點(diǎn)2個(gè)OPA網(wǎng)卡），通過2個(gè)48端口OPA交換機(jī)連接
兩個(gè)運(yùn)行Lustre的額外存儲(chǔ)服務(wù)器節(jié)點(diǎn)

^[4] EPCC是愛丁堡大學(xué)先進(jìn)計(jì)算中心

關(guān)于英特爾

英特爾（NASDAQ: INTC）是全球半導(dǎo)體行業(yè)的引領(lǐng)者，以計(jì)算和通信技術(shù)奠定全球創(chuàng)新基石，塑造以數(shù)據(jù)為中心的未來。我們通過精尖制造的專長，幫助保護(hù)、驅(qū)動(dòng)和連接數(shù)十億設(shè)備以及智能互聯(lián)世界的基礎(chǔ)設(shè)施 -- 從云、網(wǎng)絡(luò)到邊緣設(shè)備以及它們之間的一切，并幫助解決世界上最艱巨的問題和挑戰(zhàn)。如需了解更多信息，請?jiān)L問英特爾中國新聞中心 newsroom.intel.cn 以及官方網(wǎng)站 intel.cn。

英特爾和英特爾標(biāo)識(shí)是英特爾公司在美國和其他國家（地區(qū)）的商標(biāo)。

*文中涉及的其它名稱及品牌屬于各自所有者資產(chǎn)。

消息來源：英特爾