Amazon Bedrock新增自動化推理檢查、多智能體協(xié)作和模型蒸餾三項新功能,基于堅實的企業(yè)級功能基礎(chǔ)構(gòu)建,助力客戶更快地從概念驗證過渡到生產(chǎn)級的生成式人工智能
北京2024年12月12日 /美通社/ -- 亞馬遜云科技在2024 re:Invent全球大會上,宣布推出Amazon Bedrock的三項新功能。Amazon Bedrock是一項完全托管的服務(wù),借助高性能基礎(chǔ)模型,構(gòu)建和擴展生成式人AI應(yīng)用程序。新發(fā)布的功能可幫助客戶防止因模型幻覺而導(dǎo)致的事實性錯誤,編排多個AI智能體處理復(fù)雜任務(wù),以及創(chuàng)建更小的、針對特定任務(wù)的模型,這些模型在成本與延遲方面遠低于大型模型的同時,仍能達成相近效果。
亞馬遜云科技人工智能和數(shù)據(jù)副總裁Swami Sivasubramanian博士表示:"Amazon Bedrock擁有廣泛的模型選擇、領(lǐng)先的功能,使開發(fā)人員能夠更輕松地將生成式AI集成到其應(yīng)用中,并且注重安全和隱私。對于希望將生成式AI作為其應(yīng)用和業(yè)務(wù)核心的客戶來說,Amazon Bedrock已成為一個不可或缺的工具。因此,Amazon Bedrock的客戶群僅在去年就增長4.7倍之多。隨著生成式AI逐漸改變越來越多企業(yè)業(yè)務(wù)和客戶體驗,推理將成為每個應(yīng)用的核心部分。隨著此次新功能的推出,我們正在為客戶進行創(chuàng)新,以解決整個行業(yè)在將生成式AI應(yīng)用推向生產(chǎn)時面臨的主要挑戰(zhàn),比如降低幻覺和成本。"
自動化推理檢查功能防止因模型幻覺而導(dǎo)致的事實性錯誤
雖然模型在不斷進步,但即使是能力最強的模型也會產(chǎn)生幻覺,提供不正確或誤導(dǎo)性的響應(yīng)?;糜X仍然是整個行業(yè)面臨的一個根本挑戰(zhàn),這限制了企業(yè)對生成式AI的信任。特別是在醫(yī)療保健、金融服務(wù)和政府機構(gòu)等受監(jiān)管的行業(yè)中,準確性至關(guān)重要,這些組織需要進行審核,以確保模型做出適當(dāng)?shù)捻憫?yīng)。自動化推理檢查功能是強大的生成式AI保護措施,可通過邏輯準確且可驗證的推理來幫助防止因模型幻覺而導(dǎo)致的事實性錯誤。通過提高客戶對模型響應(yīng)的信任,自動化推理檢查功能為生成式AI開辟了對準確性要求極高的新應(yīng)用場景。
自動化推理是AI的一個分支,它運用數(shù)學(xué)來驗證事情的正確性。在處理用戶需要精確答案的問題時,自動化推理表現(xiàn)出色,尤其是在那些主題廣泛且復(fù)雜、并有一套明確定義的規(guī)則或知識體系的領(lǐng)域。亞馬遜云科技擁有一支由世界一流的自動化推理專家組成的團隊,他們過去十年使用這項技術(shù)在整個亞馬遜云科技改善用戶體驗,例如準確部署證明權(quán)限和訪問控制以增強安全性,或者在部署之前,對Amazon Simple Storage Service(Amazon S3)中的數(shù)百萬個場景進行檢查,以確??捎眯院统志眯缘玫奖U?。
Amazon Bedrock Guardrails使客戶能夠輕松地將安全和負責(zé)任的AI檢查應(yīng)用到生成式AI應(yīng)用程序中,從而指導(dǎo)模型僅討論相關(guān)主題。通過Amazon Bedrock Guardrails,自動化推理檢查功能可以讓Amazon Bedrock驗證事實響應(yīng)的準確性,生成可審計的輸出,并向客戶準確展示模型得出結(jié)果的原因。這提高了透明度,并確保模型響應(yīng)符合客戶的規(guī)則和政策。例如,健康保險提供商采用了生成式AI驅(qū)動的客戶服務(wù)應(yīng)用程序,它需要能夠正確響應(yīng)客戶有關(guān)保單的問題,自動化推理檢查功能可實現(xiàn)這一點。為了使用該功能,提供商無需自動化推理方面的專業(yè)知識,只需上傳其政策信息,Amazon Bedrock 會自動制定必要的規(guī)則,并指導(dǎo)客戶反復(fù)測試,以確保模型調(diào)整為正確的響應(yīng)。然后,保險提供商應(yīng)用自動化推理檢查功能,當(dāng)模型生成響應(yīng)時,Amazon Bedrock 會對其進行驗證。如果響應(yīng)不正確,例如弄錯了免賠額或標(biāo)記了不在承保范圍內(nèi)的程序,Amazon Bedrock 會使用自動化推理檢查功能中的信息來建議正確的響應(yīng)。
全球?qū)I(yè)服務(wù)公司普華永道正在使用自動化推理檢查功能來創(chuàng)建高度準確、可信且有用的AI助手和智能體,以推動其客戶的業(yè)務(wù)處于領(lǐng)先地位。普華永道將該功能納入到為金融服務(wù)、醫(yī)療保健和生命科學(xué)領(lǐng)域客戶提供的特定行業(yè)解決方案,包括驗證AI生成的合規(guī)內(nèi)容是否符合美國食品藥品管理局(FDA)和其他監(jiān)管標(biāo)準的應(yīng)用程序。在公司內(nèi)部,普華永道采用自動化推理檢查功能來確保生成式AI助手和智能體生成的響應(yīng)準確且符合內(nèi)部政策。
輕松構(gòu)建和協(xié)調(diào)多個智能體以執(zhí)行復(fù)雜的工作流程
隨著企業(yè)將生成式AI作為其應(yīng)用程序的核心部分,這項技術(shù)的應(yīng)用不再僅限于總結(jié)內(nèi)容和增強聊天體驗。企業(yè)還希望自己的應(yīng)用程序能夠執(zhí)行實際操作。AI驅(qū)動的智能體可以通過利用模型的推理功能,將任務(wù)(例如幫助退貨或分析客戶留存數(shù)據(jù))分解為模型可以執(zhí)行的一系列步驟,從而幫助客戶的應(yīng)用程序完成這些操作。Amazon Bedrock智能體功能使客戶能夠輕松構(gòu)建智能體,使其能夠跨公司系統(tǒng)和數(shù)據(jù)源工作。單個智能體可能很有用,但更復(fù)雜的任務(wù),如對數(shù)百或數(shù)千個不同變量進行財務(wù)分析,可能需要大量各具專長的智能體。然而,要創(chuàng)建一個能夠協(xié)調(diào)多個智能體、在智能體之間共享上下文并動態(tài)分配不同任務(wù)給相應(yīng)智能體的系統(tǒng),需要專業(yè)工具和生成式AI專業(yè)知識,這是很多企業(yè)難以企及的。因此,亞馬遜云科技擴展Amazon Bedrock智能體功能以支持多智能體協(xié)作,使客戶能夠輕松地構(gòu)建和協(xié)調(diào)專業(yè)智能體來執(zhí)行復(fù)雜的工作流程。
憑借Amazon Bedrock多智能體協(xié)作功能,客戶可以通過為項目的特定步驟創(chuàng)建和分配專用智能體,從而獲得更準確的結(jié)果,并通過編排多個并行工作的智能體來加速任務(wù)。例如,金融機構(gòu)可以使用Amazon Bedrock智能體對一家公司進行投資前的盡職調(diào)查。首先,客戶可以使用 Amazon Bedrock智能體創(chuàng)建一系列專注于特定任務(wù)的專用智能體,例如分析全球經(jīng)濟因素、評估行業(yè)趨勢和審查公司的歷史財務(wù)狀況。在創(chuàng)建完所有專用智能體后,再創(chuàng)建一個主管智能體來管理整個項目。主管智能體負責(zé)協(xié)調(diào)工作,包括將任務(wù)分解并路由到相應(yīng)的智能體,為特定智能體提供完成工作所需的信息,并確定哪些操作可以并行處理,以及哪些操作需要等待其他任務(wù)的詳細信息完成后才能繼續(xù)。一旦所有專業(yè)智能體都完成了自己的任務(wù),主管智能體會將信息匯總,綜合結(jié)果,并制定整體風(fēng)險概況。
穆迪公司是信用評級和金融洞察領(lǐng)域的全球領(lǐng)導(dǎo)者,已選擇Amazon Bedrock多智能體協(xié)作功能來增強其風(fēng)險分析工作流程。穆迪公司正在利用Amazon Bedrock創(chuàng)建智能體,為每個智能體分配特定的任務(wù),并允許其訪問量身定制的數(shù)據(jù)集,以履行其職責(zé)。例如,一個智能體可能會分析宏觀經(jīng)濟趨勢,另一個智能體可能會使用專有財務(wù)數(shù)據(jù)評估公司特定風(fēng)險,第三個智能體則考慮競爭和戰(zhàn)略定位。這些智能體無縫協(xié)作,將輸出結(jié)果綜合成精確、可操作的洞察。這種創(chuàng)新方法使穆迪公司能夠提供更快、更準確的風(fēng)險評估,鞏固其作為金融決策領(lǐng)域值得信賴的權(quán)威機構(gòu)的聲譽。
使用模型蒸餾功能創(chuàng)建更小、更快、更具成本效益的模型
如今,客戶正在嘗試各種型號的模型,以找到最適合其業(yè)務(wù)獨特需求的模型。然而,即使在所有可用模型中,也很難找到一個能夠提供特定知識、成本和延遲的最佳組合。較大的模型知識更豐富,但響應(yīng)時間更長、成本更高,較小的模型運行速度更快、更便宜,但功能不夠強大。模型蒸餾是一種將知識從大型模型轉(zhuǎn)移到小型模型,同時保留小型模型性價比的技術(shù)。然而,這項工作需要機器學(xué)習(xí)(ML)專業(yè)知識來處理訓(xùn)練數(shù)據(jù)、手動微調(diào)模型,以及在不損害客戶最初選擇該小型模型的性能特征的前提下調(diào)整模型權(quán)重。借助Amazon Bedrock模型蒸餾功能,任何客戶現(xiàn)在都可以蒸餾出自己的模型,與原始模型相比,被蒸餾模型的速度可以提高500%,運行成本降低75%,在檢索增強生成(RAG)等用例中,準確性損失低于2%?,F(xiàn)在,客戶無需具備專業(yè)的機器學(xué)習(xí)知識,可根據(jù)自身用例進行優(yōu)化,實現(xiàn)功能、準確性、延遲和成本的最佳組合。
借助Amazon Bedrock模型蒸餾功能,客戶只需為給定的用例選擇最佳模型,該系列模型中的一個較小的模型便能滿足客戶對成本和延遲的需求。在客戶提供樣本提示后,Amazon Bedrock將完成生成響應(yīng)和微調(diào)較小模型的所有工作,如果需要,它甚至可以創(chuàng)建更多樣本數(shù)據(jù)以完成蒸餾過程。這為客戶提供了一個具有大模型的相關(guān)知識和準確性,同時又具有較小模型的速度和成本的模型,使其成為生產(chǎn)場景下(如實時聊天互動)的理想選擇。模型蒸餾適用于來自Anthropic、Meta的模型,以及新發(fā)布的Amazon Nova模型。
Robin AI提供一款A(yù)I驅(qū)動的助手,該服務(wù)能使復(fù)雜的法律流程更快、更經(jīng)濟且更易于訪問。該公司正在使用模型蒸餾來幫助實現(xiàn)針對數(shù)百萬合同條款的高質(zhì)量法律問答。模型蒸餾幫助Robin AI以極低的成本獲得所需的準確性,而更快的響應(yīng)則為客戶與AI助手之間提供了更流暢的互動。
自動化推理檢查、多智能體協(xié)作和模型蒸餾功能均已預(yù)覽可用。