omniture

Meta迄今最強(qiáng)AI模型Llama 4現(xiàn)已在亞馬遜云科技上正式可用

亞馬遜云科技
2025-04-07 14:21 596

北京2025年4月7日 /美通社/ -- 亞馬遜云科技日前宣布,Meta的新一代Llama 4模型現(xiàn)已在Amazon SageMaker JumpStart上正式可用,完全托管的無服務(wù)器版本也將很快在Amazon Bedrock推出。首批推出的Llama 4 Scout 17B與Llama 4 Maverick 17B均具備先進(jìn)的多模態(tài)能力(可同時理解圖像與文本),并擁有行業(yè)領(lǐng)先的上下文窗口長度(單次處理信息量),性能與效率較前代顯著提升。此外,Llama 4模型采用智能計(jì)算策略,根據(jù)具體任務(wù)智能選擇激活其"專家"模塊,而非全程調(diào)用全部算力,從而能以更低算力實(shí)現(xiàn)更優(yōu)效果,降低企業(yè)使用先進(jìn)AI技術(shù)的使用門檻與成本。

亞馬遜云科技推出Llama 4 Scout與Llama 4 Maverick,進(jìn)一步豐富了客戶在亞馬遜云科技上構(gòu)建、部署和擴(kuò)展應(yīng)用程序時的模型選擇。亞馬遜云科技始終通過與如Meta等領(lǐng)先的AI公司緊密合作,確??蛻裟茉诘谝粫r間使用最新模型,并借助企業(yè)級的工具與安全保障更輕松地構(gòu)建、定制和擴(kuò)展其生成式AI應(yīng)用。

亞馬遜云科技此次通過引入Meta兩款全新的多模態(tài)模型,進(jìn)一步強(qiáng)化了其對模型多樣化的承諾。Llama 4 Scout 17B大幅擴(kuò)展了AI單次處理能力——其上下文長度從早期Llama模型的12.8萬token躍升至1,000萬token(約提升80倍)。這一升級可支持多文檔總結(jié)、復(fù)雜用戶行為分析或整段代碼庫推理等場景。Llama 4 Maverick 17B是通用型模型,擅長12種語言的圖文理解任務(wù),尤其適用于開發(fā)復(fù)雜的智能助手與聊天應(yīng)用程序。

兩款Llama 4模型均采用原生多模態(tài)設(shè)計(jì),即從設(shè)計(jì)之初就能無縫的同時理解文本與圖像,而非將兩者作為獨(dú)立的輸入進(jìn)行處理。這是Meta首次采用高效的專家混合(MoE)架構(gòu),該架構(gòu)僅針對每項(xiàng)任務(wù)激活模型中最相關(guān)的模塊,能夠幫助客戶顯著提升模型的訓(xùn)練與推理的計(jì)算效率,進(jìn)而以更低的成本獲得更出色的性能。

Llama 4 Scout 17B與Llama 4 Maverick 17B介紹

若將Llama 4模型擬人化,Scout就像一位注重細(xì)節(jié)的研究助理,擁有"過目不忘"的能力。假若身處大型圖書館中,它能夠僅憑一張小小的書桌,瞬間能從數(shù)千份文檔里精準(zhǔn)調(diào)取所需信息。Scout能預(yù)判信息需求,不僅提供答案,還會賦予答案有意義的上下文。Maverick則像一位精通多語言的創(chuàng)意總監(jiān),擅長視覺敘事,無論是起草引人入勝的故事、精準(zhǔn)分析復(fù)雜圖像,還是在客戶會議中用多種語言保持品牌聲調(diào),均能游刃有余。

數(shù)據(jù)解析

  • 據(jù)Meta稱,Llama 4 Scout 17B包含170億活躍參數(shù)與1,090億總參數(shù),其性能在同類別模型中處于領(lǐng)先水平。
  • Llama 4 Scout 17B還擁有行業(yè)領(lǐng)先的1,000萬token上下文窗口——約為Llama 3的12.8萬token的80倍。這相當(dāng)于從一次性吸收幾頁書的信息躍升至整部百科全書。
  • Llama 4 Maverick 17B包含170億活躍參數(shù)與4,000億總參數(shù),分布于128個專家模塊中。這如同擁有128臺協(xié)同工作的專用機(jī)器,但僅按任務(wù)激活最相關(guān)的部分,兼具強(qiáng)大性能與效率。

模型的專家混合(MoE)架構(gòu)就像擁有一支專家團(tuán)隊(duì),而非一名通才。模型不會為每個問題調(diào)用全部算力,而是根據(jù)具體任務(wù)智能選擇激活其"專家"模塊。這類似于醫(yī)院將患者分診至不同??漆t(yī)生,而非讓每位醫(yī)生嘗試治療所有病癥。這種更具針對性的方式使Llama 4能以更少計(jì)算資源實(shí)現(xiàn)更強(qiáng)大的結(jié)果,讓各類規(guī)模的企業(yè)都能更便捷、經(jīng)濟(jì)地使用先進(jìn)AI技術(shù)。對開發(fā)者而言,這意味著他們能夠構(gòu)建復(fù)雜的應(yīng)用程序,這些程序可以處理海量信息,同時支持多種語言,并能無縫處理文本和圖像。

亞馬遜云科技始終致力于為客戶及時提供領(lǐng)先AI公司最新模型,隨著模型在規(guī)模與模態(tài)上的持續(xù)擴(kuò)展,這將賦能客戶充分釋放生成式AI的潛力。此外,亞馬遜云科技很快還將在Amazon Bedrock中推出完全托管的無服務(wù)器版本的Llama 4模型。

欲即刻使用Llama 4,請?jiān)L問Amazon SageMaker AI控制臺。

消息來源:亞馬遜云科技
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection