Amazon Bedrock新增自動(dòng)化推理檢查、多智能體協(xié)作和模型蒸餾三項(xiàng)新功能,基于堅(jiān)實(shí)的企業(yè)級(jí)功能基礎(chǔ)構(gòu)建,助力客戶更快地從概念驗(yàn)證過(guò)渡到生產(chǎn)級(jí)的生成式人工智能
北京2024年12月12日 /美通社/ -- 亞馬遜云科技在2024 re:Invent全球大會(huì)上,宣布推出Amazon Bedrock的三項(xiàng)新功能。Amazon Bedrock是一項(xiàng)完全托管的服務(wù),借助高性能基礎(chǔ)模型,構(gòu)建和擴(kuò)展生成式人AI應(yīng)用程序。新發(fā)布的功能可幫助客戶防止因模型幻覺(jué)而導(dǎo)致的事實(shí)性錯(cuò)誤,編排多個(gè)AI智能體處理復(fù)雜任務(wù),以及創(chuàng)建更小的、針對(duì)特定任務(wù)的模型,這些模型在成本與延遲方面遠(yuǎn)低于大型模型的同時(shí),仍能達(dá)成相近效果。
亞馬遜云科技人工智能和數(shù)據(jù)副總裁Swami Sivasubramanian博士表示:"Amazon Bedrock擁有廣泛的模型選擇、領(lǐng)先的功能,使開(kāi)發(fā)人員能夠更輕松地將生成式AI集成到其應(yīng)用中,并且注重安全和隱私。對(duì)于希望將生成式AI作為其應(yīng)用和業(yè)務(wù)核心的客戶來(lái)說(shuō),Amazon Bedrock已成為一個(gè)不可或缺的工具。因此,Amazon Bedrock的客戶群僅在去年就增長(zhǎng)4.7倍之多。隨著生成式AI逐漸改變?cè)絹?lái)越多企業(yè)業(yè)務(wù)和客戶體驗(yàn),推理將成為每個(gè)應(yīng)用的核心部分。隨著此次新功能的推出,我們正在為客戶進(jìn)行創(chuàng)新,以解決整個(gè)行業(yè)在將生成式AI應(yīng)用推向生產(chǎn)時(shí)面臨的主要挑戰(zhàn),比如降低幻覺(jué)和成本。"
自動(dòng)化推理檢查功能防止因模型幻覺(jué)而導(dǎo)致的事實(shí)性錯(cuò)誤
雖然模型在不斷進(jìn)步,但即使是能力最強(qiáng)的模型也會(huì)產(chǎn)生幻覺(jué),提供不正確或誤導(dǎo)性的響應(yīng)。幻覺(jué)仍然是整個(gè)行業(yè)面臨的一個(gè)根本挑戰(zhàn),這限制了企業(yè)對(duì)生成式AI的信任。特別是在醫(yī)療保健、金融服務(wù)和政府機(jī)構(gòu)等受監(jiān)管的行業(yè)中,準(zhǔn)確性至關(guān)重要,這些組織需要進(jìn)行審核,以確保模型做出適當(dāng)?shù)捻憫?yīng)。自動(dòng)化推理檢查功能是強(qiáng)大的生成式AI保護(hù)措施,可通過(guò)邏輯準(zhǔn)確且可驗(yàn)證的推理來(lái)幫助防止因模型幻覺(jué)而導(dǎo)致的事實(shí)性錯(cuò)誤。通過(guò)提高客戶對(duì)模型響應(yīng)的信任,自動(dòng)化推理檢查功能為生成式AI開(kāi)辟了對(duì)準(zhǔn)確性要求極高的新應(yīng)用場(chǎng)景。
自動(dòng)化推理是AI的一個(gè)分支,它運(yùn)用數(shù)學(xué)來(lái)驗(yàn)證事情的正確性。在處理用戶需要精確答案的問(wèn)題時(shí),自動(dòng)化推理表現(xiàn)出色,尤其是在那些主題廣泛且復(fù)雜、并有一套明確定義的規(guī)則或知識(shí)體系的領(lǐng)域。亞馬遜云科技擁有一支由世界一流的自動(dòng)化推理專家組成的團(tuán)隊(duì),他們過(guò)去十年使用這項(xiàng)技術(shù)在整個(gè)亞馬遜云科技改善用戶體驗(yàn),例如準(zhǔn)確部署證明權(quán)限和訪問(wèn)控制以增強(qiáng)安全性,或者在部署之前,對(duì)Amazon Simple Storage Service(Amazon S3)中的數(shù)百萬(wàn)個(gè)場(chǎng)景進(jìn)行檢查,以確保可用性和持久性得到保障。
Amazon Bedrock Guardrails使客戶能夠輕松地將安全和負(fù)責(zé)任的AI檢查應(yīng)用到生成式AI應(yīng)用程序中,從而指導(dǎo)模型僅討論相關(guān)主題。通過(guò)Amazon Bedrock Guardrails,自動(dòng)化推理檢查功能可以讓Amazon Bedrock驗(yàn)證事實(shí)響應(yīng)的準(zhǔn)確性,生成可審計(jì)的輸出,并向客戶準(zhǔn)確展示模型得出結(jié)果的原因。這提高了透明度,并確保模型響應(yīng)符合客戶的規(guī)則和政策。例如,健康保險(xiǎn)提供商采用了生成式AI驅(qū)動(dòng)的客戶服務(wù)應(yīng)用程序,它需要能夠正確響應(yīng)客戶有關(guān)保單的問(wèn)題,自動(dòng)化推理檢查功能可實(shí)現(xiàn)這一點(diǎn)。為了使用該功能,提供商無(wú)需自動(dòng)化推理方面的專業(yè)知識(shí),只需上傳其政策信息,Amazon Bedrock 會(huì)自動(dòng)制定必要的規(guī)則,并指導(dǎo)客戶反復(fù)測(cè)試,以確保模型調(diào)整為正確的響應(yīng)。然后,保險(xiǎn)提供商應(yīng)用自動(dòng)化推理檢查功能,當(dāng)模型生成響應(yīng)時(shí),Amazon Bedrock 會(huì)對(duì)其進(jìn)行驗(yàn)證。如果響應(yīng)不正確,例如弄錯(cuò)了免賠額或標(biāo)記了不在承保范圍內(nèi)的程序,Amazon Bedrock 會(huì)使用自動(dòng)化推理檢查功能中的信息來(lái)建議正確的響應(yīng)。
全球?qū)I(yè)服務(wù)公司普華永道正在使用自動(dòng)化推理檢查功能來(lái)創(chuàng)建高度準(zhǔn)確、可信且有用的AI助手和智能體,以推動(dòng)其客戶的業(yè)務(wù)處于領(lǐng)先地位。普華永道將該功能納入到為金融服務(wù)、醫(yī)療保健和生命科學(xué)領(lǐng)域客戶提供的特定行業(yè)解決方案,包括驗(yàn)證AI生成的合規(guī)內(nèi)容是否符合美國(guó)食品藥品管理局(FDA)和其他監(jiān)管標(biāo)準(zhǔn)的應(yīng)用程序。在公司內(nèi)部,普華永道采用自動(dòng)化推理檢查功能來(lái)確保生成式AI助手和智能體生成的響應(yīng)準(zhǔn)確且符合內(nèi)部政策。
輕松構(gòu)建和協(xié)調(diào)多個(gè)智能體以執(zhí)行復(fù)雜的工作流程
隨著企業(yè)將生成式AI作為其應(yīng)用程序的核心部分,這項(xiàng)技術(shù)的應(yīng)用不再僅限于總結(jié)內(nèi)容和增強(qiáng)聊天體驗(yàn)。企業(yè)還希望自己的應(yīng)用程序能夠執(zhí)行實(shí)際操作。AI驅(qū)動(dòng)的智能體可以通過(guò)利用模型的推理功能,將任務(wù)(例如幫助退貨或分析客戶留存數(shù)據(jù))分解為模型可以執(zhí)行的一系列步驟,從而幫助客戶的應(yīng)用程序完成這些操作。Amazon Bedrock智能體功能使客戶能夠輕松構(gòu)建智能體,使其能夠跨公司系統(tǒng)和數(shù)據(jù)源工作。單個(gè)智能體可能很有用,但更復(fù)雜的任務(wù),如對(duì)數(shù)百或數(shù)千個(gè)不同變量進(jìn)行財(cái)務(wù)分析,可能需要大量各具專長(zhǎng)的智能體。然而,要?jiǎng)?chuàng)建一個(gè)能夠協(xié)調(diào)多個(gè)智能體、在智能體之間共享上下文并動(dòng)態(tài)分配不同任務(wù)給相應(yīng)智能體的系統(tǒng),需要專業(yè)工具和生成式AI專業(yè)知識(shí),這是很多企業(yè)難以企及的。因此,亞馬遜云科技擴(kuò)展Amazon Bedrock智能體功能以支持多智能體協(xié)作,使客戶能夠輕松地構(gòu)建和協(xié)調(diào)專業(yè)智能體來(lái)執(zhí)行復(fù)雜的工作流程。
憑借Amazon Bedrock多智能體協(xié)作功能,客戶可以通過(guò)為項(xiàng)目的特定步驟創(chuàng)建和分配專用智能體,從而獲得更準(zhǔn)確的結(jié)果,并通過(guò)編排多個(gè)并行工作的智能體來(lái)加速任務(wù)。例如,金融機(jī)構(gòu)可以使用Amazon Bedrock智能體對(duì)一家公司進(jìn)行投資前的盡職調(diào)查。首先,客戶可以使用 Amazon Bedrock智能體創(chuàng)建一系列專注于特定任務(wù)的專用智能體,例如分析全球經(jīng)濟(jì)因素、評(píng)估行業(yè)趨勢(shì)和審查公司的歷史財(cái)務(wù)狀況。在創(chuàng)建完所有專用智能體后,再創(chuàng)建一個(gè)主管智能體來(lái)管理整個(gè)項(xiàng)目。主管智能體負(fù)責(zé)協(xié)調(diào)工作,包括將任務(wù)分解并路由到相應(yīng)的智能體,為特定智能體提供完成工作所需的信息,并確定哪些操作可以并行處理,以及哪些操作需要等待其他任務(wù)的詳細(xì)信息完成后才能繼續(xù)。一旦所有專業(yè)智能體都完成了自己的任務(wù),主管智能體會(huì)將信息匯總,綜合結(jié)果,并制定整體風(fēng)險(xiǎn)概況。
穆迪公司是信用評(píng)級(jí)和金融洞察領(lǐng)域的全球領(lǐng)導(dǎo)者,已選擇Amazon Bedrock多智能體協(xié)作功能來(lái)增強(qiáng)其風(fēng)險(xiǎn)分析工作流程。穆迪公司正在利用Amazon Bedrock創(chuàng)建智能體,為每個(gè)智能體分配特定的任務(wù),并允許其訪問(wèn)量身定制的數(shù)據(jù)集,以履行其職責(zé)。例如,一個(gè)智能體可能會(huì)分析宏觀經(jīng)濟(jì)趨勢(shì),另一個(gè)智能體可能會(huì)使用專有財(cái)務(wù)數(shù)據(jù)評(píng)估公司特定風(fēng)險(xiǎn),第三個(gè)智能體則考慮競(jìng)爭(zhēng)和戰(zhàn)略定位。這些智能體無(wú)縫協(xié)作,將輸出結(jié)果綜合成精確、可操作的洞察。這種創(chuàng)新方法使穆迪公司能夠提供更快、更準(zhǔn)確的風(fēng)險(xiǎn)評(píng)估,鞏固其作為金融決策領(lǐng)域值得信賴的權(quán)威機(jī)構(gòu)的聲譽(yù)。
使用模型蒸餾功能創(chuàng)建更小、更快、更具成本效益的模型
如今,客戶正在嘗試各種型號(hào)的模型,以找到最適合其業(yè)務(wù)獨(dú)特需求的模型。然而,即使在所有可用模型中,也很難找到一個(gè)能夠提供特定知識(shí)、成本和延遲的最佳組合。較大的模型知識(shí)更豐富,但響應(yīng)時(shí)間更長(zhǎng)、成本更高,較小的模型運(yùn)行速度更快、更便宜,但功能不夠強(qiáng)大。模型蒸餾是一種將知識(shí)從大型模型轉(zhuǎn)移到小型模型,同時(shí)保留小型模型性價(jià)比的技術(shù)。然而,這項(xiàng)工作需要機(jī)器學(xué)習(xí)(ML)專業(yè)知識(shí)來(lái)處理訓(xùn)練數(shù)據(jù)、手動(dòng)微調(diào)模型,以及在不損害客戶最初選擇該小型模型的性能特征的前提下調(diào)整模型權(quán)重。借助Amazon Bedrock模型蒸餾功能,任何客戶現(xiàn)在都可以蒸餾出自己的模型,與原始模型相比,被蒸餾模型的速度可以提高500%,運(yùn)行成本降低75%,在檢索增強(qiáng)生成(RAG)等用例中,準(zhǔn)確性損失低于2%?,F(xiàn)在,客戶無(wú)需具備專業(yè)的機(jī)器學(xué)習(xí)知識(shí),可根據(jù)自身用例進(jìn)行優(yōu)化,實(shí)現(xiàn)功能、準(zhǔn)確性、延遲和成本的最佳組合。
借助Amazon Bedrock模型蒸餾功能,客戶只需為給定的用例選擇最佳模型,該系列模型中的一個(gè)較小的模型便能滿足客戶對(duì)成本和延遲的需求。在客戶提供樣本提示后,Amazon Bedrock將完成生成響應(yīng)和微調(diào)較小模型的所有工作,如果需要,它甚至可以創(chuàng)建更多樣本數(shù)據(jù)以完成蒸餾過(guò)程。這為客戶提供了一個(gè)具有大模型的相關(guān)知識(shí)和準(zhǔn)確性,同時(shí)又具有較小模型的速度和成本的模型,使其成為生產(chǎn)場(chǎng)景下(如實(shí)時(shí)聊天互動(dòng))的理想選擇。模型蒸餾適用于來(lái)自Anthropic、Meta的模型,以及新發(fā)布的Amazon Nova模型。
Robin AI提供一款A(yù)I驅(qū)動(dòng)的助手,該服務(wù)能使復(fù)雜的法律流程更快、更經(jīng)濟(jì)且更易于訪問(wèn)。該公司正在使用模型蒸餾來(lái)幫助實(shí)現(xiàn)針對(duì)數(shù)百萬(wàn)合同條款的高質(zhì)量法律問(wèn)答。模型蒸餾幫助Robin AI以極低的成本獲得所需的準(zhǔn)確性,而更快的響應(yīng)則為客戶與AI助手之間提供了更流暢的互動(dòng)。
自動(dòng)化推理檢查、多智能體協(xié)作和模型蒸餾功能均已預(yù)覽可用。