omniture

亞馬遜云科技推出六項Amazon SageMaker新功能

亞馬遜云科技
2021-12-08 18:49 4084

Amazon SageMaker Canvas進一步降低機器學習使用門檻,業(yè)務(wù)分析師無需編碼即可使用點擊式界面進行更準確的機器學習預測
Amazon SageMaker Ground Truth Plus提供全托管數(shù)據(jù)標記服務(wù),為客戶提供內(nèi)置工作流程以及技能嫻熟的團隊,以更低成本快速交付高質(zhì)量的機器學習模型訓練數(shù)據(jù)集
Amazon SageMaker Studio 提供一個可以集中執(zhí)行數(shù)據(jù)工程、數(shù)據(jù)分析和機器學習工作流程的通用notebook環(huán)境
Amazon SageMaker Training Compiler 通過自動代碼編譯提高效率,幫助客戶將深度學習模型訓練速度提高50%
Amazon SageMaker Inference Recommender為運行機器學習推理自動推薦適合的亞馬遜云科技計算實例,獲得最佳性價比
Amazon SageMaker Serverless Inference 為大規(guī)模機器學習推理提供無服務(wù)器計算

北京2021年12月8日 /美通社/ -- 2021年12月8日,亞馬遜云科技在2021 re:Invent全球大會上,宣布為行業(yè)領(lǐng)先的機器學習服務(wù)Amazon SageMaker推出六項新功能,讓機器學習更易于上手且更具成本效益。此次發(fā)布的強大新功能包括:無需編碼即可進行準確的機器學習預測,更精準的數(shù)據(jù)標記服務(wù),可用于跨域協(xié)作的通用 Amazon SageMaker Studio notebook體驗、讓代碼更高效的機器學習模型訓練編譯器,為機器學習推理自動推薦計算實例,以及用于機器學習推理的無服務(wù)器計算。欲開始使用 Amazon SageMaker,請訪問 aws.amazon.com/sagemaker 。

在多重因素的推動下,如云上幾乎無限的算力、數(shù)據(jù)量的爆炸性增長以及開發(fā)人員工具的快速進步及迭代,機器學習已成為各行業(yè)的主流。多年來,亞馬遜云科技一直致力于降低機器學習的使用門檻,讓更多的客戶利用機器學習技術(shù)。Amazon SageMaker是亞馬遜云科技增長速度最快的服務(wù)之一,全球數(shù)萬客戶包括阿斯利康、Aurora、Capital One、塞納、路虎、現(xiàn)代集團、Intuit、湯森路透、Tyson、Vanguard,正使用Amazon SageMaker訓練各種規(guī)模的機器學習模型,有些模型甚至包含數(shù)十億參數(shù),每月進行數(shù)千億次預測。隨著客戶在 Amazon SageMaker 上不斷擴展其機器學習模型訓練和推理,亞馬遜云科技也持續(xù)投入,僅在過去一年就推出 60 多項Amazon SageMaker新的特性和功能。此次發(fā)布的諸多新功能讓Amazon SageMaker更強大 -- 更輕松地準備和收集機器學習數(shù)據(jù),更快地訓練模型,優(yōu)化推理所需的計算類型和數(shù)量,并將機器學習擴展到更廣泛的受眾。

  • Amazon SageMaker Canvas 無代碼機器學習預測:Amazon SageMaker Canvas 為業(yè)務(wù)分析師(支持財務(wù)、市場、運營和人力資源團隊的業(yè)務(wù)員工)提供可視化界面,他們無需任何機器學習經(jīng)驗,也不必編寫代碼,即可自行創(chuàng)建更準確的機器學習模型進行預測。越來越多的公司希望通過機器學習重塑其業(yè)務(wù)和客戶體驗,這就需要更多來自不同業(yè)務(wù)領(lǐng)域的員工使用先進的機器學習技術(shù)。然而,機器學習通常需要專業(yè)技能,獲得這些技能通常需要多年的正規(guī)教育或強化培訓,同時對應(yīng)的課程難度大且不斷變化。Amazon SageMaker Canvas解決了這一挑戰(zhàn),它通過提供一個可視化的、 點擊式的用戶界面,讓業(yè)務(wù)分析師可以輕松地生成預測??蛻魧mazon SageMaker Canvas連接到他們的數(shù)據(jù)存儲(例如 Amazon Redshift、Amazon S3、Snowflake、本地數(shù)據(jù)存儲、本地文件等),Amazon SageMaker Canvas提供可視化工具,幫助客戶直觀地準備和分析數(shù)據(jù)。然后,客戶無需任何編碼,Amazon SageMaker Canvas使用自動機器學習來構(gòu)建和訓練機器學習模型。為確保模型的準確性和有效性,業(yè)務(wù)分析師還可以在Amazon SageMaker Canvas的控制臺中查看和評估模型。Amazon SageMaker Canvas還支持客戶將模型導出到 Amazon SageMaker Studio,與數(shù)據(jù)科學家共享,進一步驗證和完善模型。
  • Amazon SageMaker Ground Truth Plus 專業(yè)數(shù)據(jù)標記:Amazon SageMaker Ground Truth Plus 是一項完全托管的數(shù)據(jù)標記服務(wù),為客戶提供內(nèi)置的工作流程、技能嫻熟的團隊,以更低成本快速交付高質(zhì)量的訓練數(shù)據(jù)集,用于訓練機器學習模型,客戶無需編碼。為了訓練更準確的模型并規(guī)?;瘷C器學習部署,客戶需要被正確標記的數(shù)據(jù)集越來越大。但是,要生成大型數(shù)據(jù)集可能需要數(shù)周甚至數(shù)年的時間,并且通常需要公司雇傭員工并創(chuàng)建工作流來管理標記數(shù)據(jù)的過程。 2018 年,亞馬遜云科技推出了 Amazon SageMaker Ground Truth,通過使用來自Amazon Mechanical Turk、第三方供應(yīng)商或自有團隊的人工數(shù)據(jù)標注員的方式,幫助客戶更輕松的生成標記數(shù)據(jù)。Amazon SageMaker Ground Truth Plus 進一步擴展了這項功能,通過提供專業(yè)團隊為客戶提供高度準確的數(shù)據(jù)標簽。這些專業(yè)團隊不但擁有特定領(lǐng)域和行業(yè)專業(yè)知識,同時具有職業(yè)技能可滿足客戶對數(shù)據(jù)安全、隱私與合規(guī)等要求。 Amazon SageMaker Ground Truth Plus具有多步驟標記工作流程功能,可縮短標記數(shù)據(jù)集所需的時間并降低采購高質(zhì)量注釋數(shù)據(jù)的成本,該功能包括機器學習模型預標記、檢測人工標記錯誤和低質(zhì)量標簽的機器驗證,以及輔助標記功能(例如 3D 長方體捕捉、去除2D中的失真圖像、視頻標記中的預測和自動分割工具)??蛻糁恍柘葘?Amazon SageMaker Ground Truth Plus 指向他們在 Amazon Simple Storage Service (Amazon S3) 中的數(shù)據(jù)源,并提供特定的標記要求(例如,醫(yī)學專家應(yīng)如何標記肺部放射影像中的異常情況的說明)。 Amazon SageMaker Ground Truth Plus 隨后創(chuàng)建數(shù)據(jù)標記工作流程并提供控制面板,客戶可通過控制面板跟蹤數(shù)據(jù)注釋進度、檢查已完成標簽的樣本質(zhì)量,并提供為生成高質(zhì)量數(shù)據(jù)的反饋;該功能讓客戶可以更快地構(gòu)建、訓練和部署高度準確的機器學習模型。
  • Amazon SageMaker Studio 通用notebookAmazon SageMaker Studio 的通用notebook(業(yè)界首個完整的機器學習集成開發(fā)環(huán)境)提供了一個統(tǒng)一的集成環(huán)境來執(zhí)行數(shù)據(jù)工程、數(shù)據(jù)分析和機器學習。如今,來自不同數(shù)據(jù)領(lǐng)域的團隊希望使用一系列涵蓋數(shù)據(jù)工程、數(shù)據(jù)分析和機器學習的工作流開展協(xié)作。這些領(lǐng)域的從業(yè)者通常來自數(shù)據(jù)工程、數(shù)據(jù)分析和數(shù)據(jù)科學等不同的知識領(lǐng)域,他們希望實現(xiàn)跨各種工作流工作,并無需切換數(shù)據(jù)相關(guān)工具。而當客戶準備集成數(shù)據(jù)分析和機器學習的數(shù)據(jù)時,通常需要處理多種工具和notebook,這一過程繁瑣、耗時且容易出錯。 Amazon SageMaker Studio 現(xiàn)支持客戶在一個通用notebook中,為實現(xiàn)多種目的而進行的交互方式訪問、轉(zhuǎn)換和分析各種數(shù)據(jù)。Amazon SageMaker Studio與在 Amazon EMR 集群上運行的 Spark、Hive 和 Presto,以及在 Amazon S3 上運行的數(shù)據(jù)湖均內(nèi)置集成,客戶無需切換服務(wù)即可使用Amazon SageMaker Studio 訪問和操作通用notebook中的數(shù)據(jù)。客戶除了可以使用喜歡的框架(例如 TensorFlow、PyTorch 或 MXNet)開發(fā)機器學習模型,并在 Amazon SageMaker Studio 中構(gòu)建、訓練和部署機器學習模型外;客戶無需離開通用Amazon SageMaker Studio notebook,可以一站式瀏覽和查詢數(shù)據(jù)源、探索元數(shù)據(jù)和模式,并處理數(shù)據(jù)分析或機器學習工作流相關(guān)的工作負載。
  • 適用于機器學習模型的 Amazon SageMaker Training CompilerAmazon SageMaker Training Compiler 是一種新的機器學習模型編譯器,可自動優(yōu)化代碼提高計算資源的使用效率,并縮短訓練模型時間多達 50%。先進的深度學習模型通常是龐大而復雜的,訓練單個模型可能消耗數(shù)千小時的GPU計算時間,為此它們需要專門的計算實例來加速訓練。為了進一步縮短訓練時間,數(shù)據(jù)科學家會嘗試增加訓練數(shù)據(jù)或調(diào)整超參數(shù)(控制機器學習訓練過程的變量),找到性能最佳且資源消耗最少的模型版本。這項工作的技術(shù)復雜性致使數(shù)據(jù)科學家沒有時間優(yōu)化在 GPU 上運行訓練模型所需的框架。 Amazon SageMaker Training Compiler與 Amazon SageMaker 中的 TensorFlow 和 PyTorch 版本集成,這些版本經(jīng)過優(yōu)化可在云中更高效地運行,因此數(shù)據(jù)科學家可以使用他們喜歡的框架,更高效得使用GPU訓練機器學習模型。只需單擊一下,Amazon SageMaker Training Compiler 就會自動優(yōu)化并編譯訓練好的模型,提高訓練執(zhí)行速度多達50%。
  • Amazon SageMaker Inference Recommender 自動實例選擇:Amazon SageMaker Inference Recommender 幫助客戶自動選擇最佳計算實例和配置(例如實例數(shù)量、容器參數(shù)和模型優(yōu)化),運行其特定的機器學習模型推理。大型機器學習模型,通常用于自然語言處理或計算機視覺,選擇具有最佳性價比的計算實例是一個復雜的迭代過程,可能需要數(shù)周的實驗時間。 Amazon SageMaker Inference Recommender消除了運行一個模型應(yīng)選擇哪種實例的不確定性和復雜性,通過自動推薦適合的計算實例配置,可將部署時間從數(shù)周縮短至幾小時。數(shù)據(jù)科學家使用 Amazon SageMaker Inference Recommender 可將模型部署到推薦的一個計算實例上, 或者使用該服務(wù)在一系列選定的計算實例上運行性能基準測試。客戶可以在 Amazon SageMaker Studio 中查看基準測試結(jié)果,并評估不同配置在延遲、吞吐量、成本、計算和內(nèi)存等方面的利弊。
  • 適用于機器學習模型的 Amazon SageMaker Serverless Inference使用Amazon SageMaker Serverless Inference,客戶僅需為生產(chǎn)中部署的機器學習模型推理按使用量付費。客戶使用機器學習時,希望能優(yōu)化成本,對于具有間歇性流量模式和長時間空閑的應(yīng)用程序而言尤為重要。有些應(yīng)用程序,如基于消費者購買的個性化推薦、接聽來電的聊天機器人以及基于實時交易的需求預測等,可能會受外部因素如天氣狀況、促銷的產(chǎn)品或節(jié)假日等影響出現(xiàn)波峰波谷。為機器學習推理提供合適的計算容量是一項艱難的、需要權(quán)衡多方面因素的工作。有時,為滿足峰值需求,客戶會過度配置容量,雖然實現(xiàn)了一致的性能,但在沒有流量時會浪費成本。有時, 客戶為控制成本而部署了不足夠的計算容量,在條件變化時卻無法提供足夠的算力來執(zhí)行推理。為了適應(yīng)不斷變化的條件,一些客戶嘗試動態(tài)地手動調(diào)整計算資源,這是繁瑣且耗費精力的工作。用于機器學習的 Amazon SageMaker Serverless Inference 會根據(jù)推理請求的數(shù)量自動預置、擴展和關(guān)閉計算容量。當客戶將機器學習模型部署到生產(chǎn)中,只需在 Amazon SageMaker 中選擇無服務(wù)器部署選項,Amazon SageMaker Serverless Inference 就會管理計算資源并提供所需的精確計算量。通過Amazon SageMaker Serverless Inference,客戶無需管理底層基礎(chǔ)設(shè)施,且只需為每個請求使用的算力和處理的數(shù)據(jù)量付費。

亞馬遜云科技機器學習副總裁Bratin Saha 表示:“各個行業(yè)和各種規(guī)模的客戶都在積極借助Amazon SageMaker 擴大機器學習的使用范圍,機器學習已經(jīng)成為很多企業(yè)運營的核心組成,并賦能客戶發(fā)明新的產(chǎn)品,創(chuàng)新的服務(wù)和體驗。我們很高興將行業(yè)領(lǐng)先的機器學習服務(wù)拓展至更多客戶,幫助更多企業(yè)推動業(yè)務(wù)創(chuàng)新,解決富有挑戰(zhàn)性的問題。這些 Amazon SageMaker的新功能將觸達更廣泛的客戶,同時為現(xiàn)有客戶提供額外的功能,幫助他們在機器學習之旅中更輕松地將數(shù)據(jù)轉(zhuǎn)化為有價值的洞察,加快部署速度,提升性能并節(jié)省成本?!?/p>

寶馬集團總部位于德國慕尼黑,是一家全球豪華汽車和摩托車制造商,品牌涵蓋寶馬、寶馬摩托車、MINI 和勞斯萊斯等;它還提供優(yōu)質(zhì)的金融和移動服務(wù)。寶馬集團人工智能平臺產(chǎn)品負責人 Marc Neumann 表示:“將人工智能作為關(guān)鍵技術(shù)使用是寶馬集團數(shù)字化轉(zhuǎn)型過程中的重要一環(huán)。我們在整個價值鏈中已經(jīng)采用人工智能,為客戶、產(chǎn)品、員工和流程創(chuàng)造附加價值。過去幾年里,我們已經(jīng)將寶馬集團許多具有商業(yè)價值影響的頂級用例產(chǎn)業(yè)化。 我們認為Amazon SageMaker Canvas將幫助我們把人工智能/機器學習擴展至整個寶馬集團。通過SageMaker Canvas,業(yè)務(wù)用戶可以輕松地探索和構(gòu)建機器學習模型,無需編寫代碼即可做出準確預測。 SageMaker 還支持我們的核心數(shù)據(jù)科學團隊協(xié)作,并對由業(yè)務(wù)用戶創(chuàng)建的模型在投入生產(chǎn)環(huán)境之前對其進行評估?!?/p>

西門子能源正在為社會注入活力,環(huán)境、社會和公司治理(ESG)是其戰(zhàn)略重點,他們的創(chuàng)新正在為合作伙伴和員工創(chuàng)造不一樣的明天。西門子能源工業(yè)應(yīng)用數(shù)據(jù)科學團隊負責人 Davood Naderi表示:“西門子能源數(shù)據(jù)科學戰(zhàn)略的核心是將機器學習的力量帶給所有業(yè)務(wù)用戶,讓他們能夠在不需要數(shù)據(jù)科學專家的情況下試驗不同的數(shù)據(jù)源和機器學習框架。這將加快我們能源解決方案(例如調(diào)度優(yōu)化器和診斷服務(wù))的創(chuàng)新和數(shù)字化速度。Amazon SageMaker Canvas支持業(yè)務(wù)用戶開展實驗,是西門子能源機器學習工具套件的很好的補充。同時還可以與數(shù)據(jù)科學團隊共享和協(xié)作,這種協(xié)作非常重要,不但幫助我們將更多機器學習模型投入生產(chǎn),同時還確保所有模型都符合我們的質(zhì)量標準和政策?!?/p>

愛彼迎是全球最大的特色民宿預定平臺之一,提供超過 700 萬個住宿選擇和 40,000 項由當?shù)胤繓|組織的手工活動?!霸趷郾擞?,我們越來越多地將機器學習整合到業(yè)務(wù)的各個方面。為了訓練和測試機器學習模型,我們的團隊始終需要生成和維護高質(zhì)量的數(shù)據(jù)。”愛彼迎中國數(shù)據(jù)科學家羅偉表示:“為了更好地為客戶提供服務(wù),并減少對客服團隊的依賴,我們一直在尋找一種方法,可以基于十萬段普通話客戶服務(wù)日志生成高質(zhì)量的文本分類數(shù)據(jù)結(jié)果。通過Amazon SageMaker Ground Truth Plus,亞馬遜云科技團隊為我們構(gòu)建了定制數(shù)據(jù)標記工作流程,其中包括能夠?qū)崿F(xiàn) 99% 分類準確率的自定義機器學習模型?!?nbsp;

美國國家橄欖球聯(lián)盟(NFL)是美國最受歡迎的體育聯(lián)盟,由 32 支職業(yè)運動隊組成,他們每年都在爭奪超級碗冠軍,這是世界上最大的年度體育賽事。NFL 球員健康與創(chuàng)新高級副總裁 Jennifer Langton表示:“在 NFL,為了幫助我們的球迷、廣播公司、教練和球隊獲得洞察,我們一直尋找使用機器學習的新方法。橄欖球是一項追求速度的運動,比賽可以在一瞬間發(fā)生。雖然有教練員和裁判員,但很難在場上照看到所有球員的安全。計算機視覺讓我們能夠準確監(jiān)測球員安全事件,但開發(fā)這些算法需要專業(yè)標記的數(shù)據(jù)?,F(xiàn)在,Amazon SageMaker Ground Truth Plus為復雜的標記任務(wù)提供了定制工作流程和用戶界面,這將幫助我們提高球員的安全性?!?/p>

Vanguard Group, Inc. 是一家美國注冊的投資顧問機構(gòu),總部位于賓夕法尼亞州馬爾文,管理著約 7 萬億美元的全球資產(chǎn)。 Vanguard 重新定義行業(yè)價值,幫助投資者做正確的選擇,并為全球數(shù)百萬客戶創(chuàng)造變革。Vanguard數(shù)據(jù)和分析高級總監(jiān)Doug Stewart表示:“我們非常高興的看到數(shù)據(jù)科學家和數(shù)據(jù)工程師可以在一個通用notebook環(huán)境中協(xié)作,進行數(shù)據(jù)分析和機器學習。Amazon SageMaker Studio已與在 Amazon EMR 上運行的 Spark、Hive 和 Presto 內(nèi)置集成,這提高了我們開發(fā)團隊的工作效率。這種統(tǒng)一的開發(fā)環(huán)境讓我們的團隊能夠?qū)W⒂跇?gòu)建、訓練和部署機器學習模型。”

iFood 是拉丁美洲在線食品配送的領(lǐng)先企業(yè),每月完成6,000 多萬份訂單。iFood使用機器學習向在線訂購的客戶推薦餐廳。 iFood 機器學習和數(shù)據(jù)工程總監(jiān) Ivan Lima 表示:“我們的機器學習模型一直采用 Amazon SageMaker構(gòu)建高質(zhì)量的應(yīng)用程序,這貫穿于整個業(yè)務(wù)線。Amazon SageMaker Serverless Inference讓我們能夠更快地實現(xiàn)模型部署和擴展,無需擔心實例選擇,也不必擔心工作負載的波峰波谷。同時,我們預計該服務(wù)將進一步降低我們的成本?!?/p>

消息來源:亞馬遜云科技
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection