北京2024年5月24日 /美通社/ -- 生成式人工智能(生成式AI)正在成為任何人都無法忽視的生產力變量。在它的面前,以往的知識與技能壁壘開始松動甚至坍塌,并為各領域機構的創(chuàng)新帶來新的無窮可能性。
但企業(yè)利用生成式AI進行業(yè)務創(chuàng)新的同時也不免面臨新的隱憂。企業(yè)或機構向生成式AI模型提供數據——很可能是涉及核心業(yè)務及客戶信息等關鍵數據——是否能被妥善地保管、使用,及進行必要的隔離;還有生成式AI的一些"固有問題",如怎樣實現負責任的AI,過濾有害內容,確保內容符合當地及企業(yè)政策等問題……
通常情況下,規(guī)?;墒紸I應用都發(fā)生在云端,更多企業(yè)機構也將依賴于云開展生成式AI的業(yè)務創(chuàng)新。因此,我們可以將生成式AI的安全話題,看作是對云計算安全提出的新挑戰(zhàn)。
亞馬遜云科技對AI的研究已持續(xù)數年,其中包括生成式AI應用被廣泛應用后產生的安全需求演變。對于云計算安全,亞馬遜云科技的態(tài)度是一貫的——在業(yè)務初期就考慮安全因素,主動設計而不是被動響應。聚焦到生成式AI相關服務、功能及應用,亞馬遜云科技在其安全的基礎設施之上,在生成式AI服務及功能設計之初就充分考慮了安全因素,并進一步構建了負責任AI的防護機制。與此同時,亞馬遜云科技也在利用生成式AI來賦能已有的或新推出的安全服務。這些舉措幫助亞馬遜云科技的客戶在使用生成式AI服務時能獲得不遜色于以往任何時候的安全體驗。
從底層基礎設施層面實現對生成式AI工作負載數據的隔離與加密保護
企業(yè)使用生成式AI最大的顧慮之一是如何保護他們的數據及隱私安全。企業(yè)可能會使用高度敏感的如個人數據、合規(guī)數據、運營數據和財務信息用于模型優(yōu)化或使用生成式AI應用。
企業(yè)為了安全地使用生成式AI,首先應考慮三個問題:1)數據在哪里?企業(yè)需要知道用數據訓練模型的整個工作流程中,這些數據來自哪,以及是如何被處理和保護的。2)如何處理模型推理時的輸入和輸出數據?訓練數據并不是企業(yè)需要關注的唯一敏感數據集,企業(yè)查詢本身也應該成為數據保護計劃的一部分。3)生成式AI模型的輸出是否準確?不同的生成式AI的使用場景對準確度和風險的要求不同。如果企業(yè)正在使用大型語言模型來生成代碼,那么企業(yè)就必須要確認這個代碼是否寫得足夠好,是否遵循了企業(yè)的最佳實踐等等。
亞馬遜云科技對客戶生成式AI的保護始于其基礎設施。亞馬遜云科技獨有的云服務器虛擬化引擎Amazon Nitro將主機CPU/GPU的I/O功能卸載至專門的硬件上,不但提供了更加一致的性能,其增強的安全性可以在客戶端和云端全程保護客戶的代碼和數據在處理過程中的安全。這一獨有的功能已經獲得了領先的網絡安全公司NCC Group的獨立驗證。
Nitro系統(tǒng)提供的硬件級別的安全機制,首先從設計上將客戶數據與運營商進行完全隔離,即亞馬遜云科技作為運營商無法訪問客戶在Amazon Elastic Compute Cloud (Amazon EC2)實例上運行的包括生成式AI相關在內的工作負載或數據。其次,客戶還可以通過Amazon Nitro Enclaves和Amazon Key Management Service(Amazon KMS),使用密鑰加密敏感的生成式AI數據,將其存儲在指定的位置,并安全地將加密數據傳輸到隔離的計算環(huán)境中進行推理計算。此外,亞馬遜云科技還將Amazon Nitro Enclaves和Amazon KMS端到端加密流程進一步擴展到如Amazon Trainium2和其他GPU,進一步增強用戶生成式AI數據在基礎設施設備間的安全通信。
在生成式AI服務的設計之初就考慮安全性,并成為負責任的AI
除了構建安全的全球云基礎設施,亞馬遜云科技的安全不止安全服務,其所有服務均有安全基線。亞馬遜云科技提倡在新服務設計初期就考慮安全因素。
以生成式AI完全托管服務Amazon Bedrock為例,作為一項為讓客戶便捷地使用基礎模型構建和擴展生成式AI應用程序的云服務,Amazon Bedrock在設計之初就考慮了如何發(fā)揮基礎設施安全能力,以及AI服務本身的安全需求。亞馬遜云科技和第三方模型提供商不會使用 Amazon Bedrock 的任何輸入或輸出來訓練其基礎模型。在使用Amazon Bedrock時,客戶的數據在傳輸過程中和靜態(tài)存儲時都經過加密,客戶的所有數據都是始終安全且私密的。客戶可以使用Amazon PrivateLink建立從Amazon Virtual Private Cloud(Amazon VPC)到Amazon Bedrock的私有連接;或者采用基于身份識別的安全策略,例如在使用Amazon KMS創(chuàng)建、管理和控制加密密鑰時,定義哪些用戶或角色可以在什么條件下對哪些資源執(zhí)行什么操作。
對于云計算用戶來說,數據與隱私安全并非生成式AI帶來的"新話題"。但生成式AI也確實帶來了像"負責任的AI(Responsible AI)"這種AI時代獨有的安全考驗。當客戶在使用Amazon Bedrock這類生成式AI服務時,不得不考慮過濾有害內容,確保內容符合當地及企業(yè)政策等問題。
為此,Amazon Bedrock配備了幫助客戶實施負責任AI的防護機制(Guardrails for Amazon Bedrock)。相比于一些AI大模型僅通過內部控制模塊來過濾內容,Amazon Bedrock的防護機制能讓客戶進一步定制AI應用程序,以便符合不同標準的內容政策。
客戶只需提供一個自然語言描述來定義其應用程序上下文中被拒絕的主題,即可創(chuàng)建個性化的防護機制,還可以配置閾值,跨領域過濾諸如仇恨言論、侮辱、暴力等語言,以及設置過濾器來刪除任何個人和敏感信息、褻瀆言論或特定的屏蔽詞。通過這種"內置+定制"的雙重防護機制,更大限度保證基于生成式AI的業(yè)務能良好實踐負責任的AI要求。
借助生成式AI的能力讓安全更易實現
在云環(huán)境中,生成式AI并不僅僅是"被保護者",它本身也能成為提升安全的強大工具,從業(yè)務初期就能揭示那些潛伏的、未被意識到的風險。
代碼編寫方式是信息安全中最大的變量之一,一些小問題就可能導致嚴重的安全后果。包括生成式AI模型本質上也是代碼,也可能因為代碼編寫的漏洞而存在安全隱患。從安全角度來看,從一開始就編寫出安全的代碼,無疑比在編寫完成后,已經進行了測試,甚至已經交付后再去修改要好得多。
為了幫助云計算客戶達成符合安全需求的代碼編寫,亞馬遜云科技將AI能力運用到代碼生成器上,以服務或功能的方式提供給客戶。
亞馬遜云科技推出的用于IDE(集成開發(fā)環(huán)境)和命令行的AI生產力工具Amazon Q Developer,是一個以機器學習為動力的代碼生成器,直接在集成開發(fā)環(huán)境中為開發(fā)者提供實時代碼建議。Amazon Q Developer不僅能極大提升開發(fā)者的編碼效率,而且還能讓代碼更加安全。它內置了安全掃描功能,能夠掃描代碼以檢測難以發(fā)現的漏洞,并根據客戶的代碼,提供專屬修復建議,幫助開發(fā)者及時快速修復該漏洞。
Amazon Q Developer同樣為客戶提供了定制化的選擇,以便使用自己的私有代碼庫來提升產出成果。為了確保用于開發(fā)的數據處于隔離計算環(huán)境,以及防止一切未經授權的訪問,Amazon Q Developer設置了一系列不可變更的安全機制,包括不同工作負載之間的數據隔離,Amazon KMS對靜態(tài)數據的加密,基于身份認證的數據訪問授權,以及數據存儲時的加密和強制隔離。
一些原有的安全服務也正在逐漸通過生成式AI獲得新的功能。例如漏洞管理服務Amazon Inspector,它的Amazon Lambda函數代碼掃描功能從去年開始使用生成式AI和自動推理的輔助代碼修復,以簡化更新易受攻擊代碼的過程。Amazon Detective也在去年增加了使用生成式AI來構建安全事件描述的能力。生成式AI可以自動分析調查發(fā)現組并以自然語言提供洞察,幫助安全工程師加快安全調查。
這些基于生成式AI的創(chuàng)新服務和新的升級,為安全工作創(chuàng)造了更便捷、更高效的新可能。我們可以期待,企業(yè)的安全工程師將能夠以更少的工作負擔來達成目標,使企業(yè)得以更從容地應對各類安全風險。
寫在最后
在不遠的未來,生成式AI將如同當下的互聯網與云計算一樣變得無處不在。盡管新的數字技術產物也將無可避免地帶來新的安全挑戰(zhàn),但我們無需為此過分擔憂。成熟的安全防護機制,加上新的安全功能,足以為云上生成式AI業(yè)務構建起可靠的安全環(huán)境。生成式AI本身也成為安全創(chuàng)新的助力,讓新的安全功能更具主動性,更加簡單易用。
云計算廠商積累的經驗與智慧,將繼續(xù)在AI時代護航用戶的安全——經歷過數次重大技術變革之后,安全工作者愈發(fā)知道如何應對變革,讓新事物的到來可控且有序。