北京2023年4月28日 /美通社/ -- 隨著大數(shù)據(jù)的快速發(fā)展和人工智能技術(shù)的逐漸成熟,大數(shù)據(jù)和人工智能的結(jié)合變得越來越緊密,相輔相成,為各個領(lǐng)域的發(fā)展和進步帶來了巨大的機遇和挑戰(zhàn)。大數(shù)據(jù)提供了海量的數(shù)據(jù),而人工智能可以利用這些數(shù)據(jù)進行深度學(xué)習(xí)、模式識別和智能決策等方面的分析,從而產(chǎn)生有用的信息和價值。然而,大數(shù)據(jù)和人工智能的結(jié)合也面臨著數(shù)據(jù)泄露、數(shù)據(jù)隱私保護、模型安全等諸多數(shù)據(jù)安全問題,必須采取有效措施來確保數(shù)據(jù)存儲、數(shù)據(jù)處理、數(shù)據(jù)流轉(zhuǎn)等過程中的數(shù)據(jù)安全。
因此,英特爾攜手浪潮信息構(gòu)建了端到端的大數(shù)據(jù)和人工智能隱私保護機器學(xué)習(xí)方案,該方案基于英特爾軟件防護拓展(Software Guard Extensions, SGX)提供可信執(zhí)行環(huán)境(Trusted Execution Environment,TEE),使用浪潮信息云海Insight提供大數(shù)據(jù)能力支持,通過BigDL-PPML建立端到端的大數(shù)據(jù)和人工智能隱私計算解決方案。通過英特爾Big-PPML和浪潮信息云海Insight的聯(lián)合測試和應(yīng)用實踐證明了該方案的安全高效和卓越性能表現(xiàn)。
大數(shù)據(jù)和人工智能結(jié)合時的數(shù)據(jù)安全問題
大數(shù)據(jù)和人工智能結(jié)合是當(dāng)前技術(shù)發(fā)展的熱點領(lǐng)域之一,其應(yīng)用范圍涉及到商業(yè)、醫(yī)療、教育、能源等多個領(lǐng)域。然而,在大數(shù)據(jù)和人工智能結(jié)合的過程中,數(shù)據(jù)安全問題是不可忽視的,主要面臨以下數(shù)據(jù)安全問題:
數(shù)據(jù)隱私保護:大數(shù)據(jù)和人工智能結(jié)合所處理的數(shù)據(jù)規(guī)模和種類非常龐大和復(fù)雜,包含大量個人身份信息、財務(wù)信息、醫(yī)療信息等敏感信息,如果這些信息被泄露或被未經(jīng)授權(quán)的第三方獲取,將對個人、企業(yè)和機構(gòu)造成極大的損失。因此,必須采取措施保護數(shù)據(jù)隱私,例如數(shù)據(jù)加密、數(shù)據(jù)脫敏等技術(shù)。
數(shù)據(jù)泄露:大數(shù)據(jù)中存儲的信息往往包括商業(yè)機密、個人隱私等敏感信息,如果這些信息被攻擊者獲取,將給企業(yè)和個人帶來重大損失。因此,必須采取措施防止數(shù)據(jù)泄露,例如網(wǎng)絡(luò)加密、身份認(rèn)證和訪問控制等技術(shù)。
假數(shù)據(jù)攻擊:大數(shù)據(jù)中的數(shù)據(jù)質(zhì)量往往無法完全保證,攻擊者可以通過提交虛假數(shù)據(jù)來操縱模型,從而對企業(yè)或機構(gòu)造成損害。因此,必須采取措施防止假數(shù)據(jù)攻擊,例如數(shù)據(jù)質(zhì)量管理、異常檢測、可信執(zhí)行環(huán)境等技術(shù)。
模型安全問題:在人工智能中,模型往往是根據(jù)大數(shù)據(jù)訓(xùn)練得到的,如果攻擊者能夠訪問模型,就可以從中獲得大量敏感信息。因此,必須采取措施保護模型安全,例如數(shù)據(jù)加密、訪問控制等技術(shù)。
英特爾BigDL-PPML攜手浪潮信息云海Insight的端到端隱私保護機器學(xué)習(xí)
為了解決大數(shù)據(jù)和人工智能結(jié)合時遇到的數(shù)據(jù)安全問題,英特爾與浪潮信息合作,基于英特爾SGX可信執(zhí)行環(huán)境技術(shù),加持強安全的浪潮信息KOS操作系統(tǒng),使用浪潮信息云海容器云平臺ICKS(InCloud K8S, ICKS)一鍵部署Kubernetes(K8s)集群,浪潮信息云海Insight大數(shù)據(jù)平臺提供運維管理、數(shù)據(jù)存儲、數(shù)據(jù)計算、權(quán)限管理等能力,通過英特爾BigDL-PPML實現(xiàn)大數(shù)據(jù)和人工智能端到端的隱私保護機器學(xué)習(xí)方案。
KOS
浪潮信息KOS是一款基于Linux Kernel、OpenAnolis等開源技術(shù)自主研發(fā)的服務(wù)器操作系統(tǒng),支持x86、ARM等主流架構(gòu)處理器,性能和穩(wěn)定性屬于行業(yè)領(lǐng)先地位??蓾M足云計算、大數(shù)據(jù)、分布式存儲、人工智能、邊緣計算等應(yīng)用場景需求。
浪潮信息KOS服務(wù)器操作系統(tǒng)基于開源OpenAnolis系統(tǒng)做了開發(fā)和增強, 加入了自主研發(fā)的軟件,提供全方位(內(nèi)核及用戶態(tài))的操作系統(tǒng)支持, 其穩(wěn)定性、安全性、兼容性和性能等核心能力均已得到充分驗證,是一款強安全、高可用、高可靠、高性能、易維護的服務(wù)器操作系統(tǒng),能夠為企業(yè)用戶提供值得信賴的基礎(chǔ)設(shè)施平臺,滿足企業(yè)用戶多應(yīng)用場景的需求。本方案使用浪潮信息KOS系統(tǒng)可加固整個端到端隱私保護流程,且浪潮信息KOS已自帶SGX驅(qū)動,可簡化部署實施流程。
ICKS
浪潮信息云海容器云平臺(InCloud K8S,簡稱 ICKS) 是企業(yè)級容器云平臺, 基于容器和 Kubernetes 容器編排技術(shù),采用微服務(wù)架構(gòu),以應(yīng)用為中心,面向企業(yè)私有云市場提供包括全方位應(yīng)用管理、服務(wù)網(wǎng)格、智能監(jiān)控運維、DevOps、異構(gòu)設(shè)備管理、應(yīng)用遷移、容災(zāi)備份、 多租戶管理、安全審計等云平臺服務(wù),能夠幫助企業(yè)加速應(yīng)用上云,實現(xiàn)業(yè)務(wù)的高可用性、彈性伸縮,并對應(yīng)用的全生命周期進行自動化管理。本方案使用浪潮信息云海容器云平臺ICKS可以一鍵部署K8S集群環(huán)境,簡化部署流程,提高部署效率,確保集群高可用,為本方案提供穩(wěn)定可靠的容器調(diào)度環(huán)境。
BigDL PPML
BigDL-PPML是英特爾開源的大數(shù)據(jù)和人工智能應(yīng)用平臺BigDL構(gòu)建的一個分布式的隱私保護機器學(xué)習(xí)平臺,主要基于英特爾SGX可信執(zhí)行環(huán)境技術(shù)。BigDL-PPML可以使公司企業(yè)在探索強大的人工智能技術(shù)的同時盡量降低處理大量敏感數(shù)據(jù)相關(guān)的安全風(fēng)險。PPML可以有效保護存儲、傳輸和使用中的數(shù)據(jù):由SGX Enclaves保護的計算和內(nèi)存、由加密保護的存儲、由遠(yuǎn)程認(rèn)證和傳輸層安全保護的網(wǎng)絡(luò)通信,以及可選的聯(lián)邦學(xué)習(xí)支持。
云海Insight
云海Insight是浪潮信息企業(yè)級大數(shù)據(jù)基礎(chǔ)軟件,集合業(yè)界主流的新型大數(shù)據(jù)處理技術(shù),包含數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)計算、檢索服務(wù)、編排、數(shù)據(jù)湖、數(shù)據(jù)安全等30多個大數(shù)據(jù)組件,提供統(tǒng)一的平臺化管理運維,實現(xiàn)深度功能增強和性能優(yōu)化,能夠幫助客戶輕松應(yīng)對海量數(shù)據(jù)的采集、存儲、計算、查詢、分析挖掘和數(shù)據(jù)安全等應(yīng)用場景。BigDL PPML作為AI計算的重要組成部分集成到Insight大數(shù)據(jù)平臺中,提供Spark SQL、ML/DL、聯(lián)邦學(xué)習(xí)等功能,提升Insight平臺AI服務(wù)能力。
安全高效的發(fā)掘數(shù)據(jù)價值
英特爾BigDL-PPML攜手浪潮信息云海Insight構(gòu)建的端到端的大數(shù)據(jù)和人工智能隱私保護機器學(xué)習(xí)方案,可以幫助企業(yè)在保護數(shù)據(jù)安全的前提下,實現(xiàn)數(shù)據(jù)分析、機器學(xué)習(xí)、深度學(xué)習(xí)等大數(shù)據(jù)和AI應(yīng)用。通過集成英特爾BigDL-PPML,浪潮信息云海Insight可以為企業(yè)提供更加安全和可靠的大數(shù)據(jù)和人工智能隱私計算方案,從而帶來以下收益:
數(shù)據(jù)隱私保護:隱私保護多方計算技術(shù)可以將數(shù)據(jù)分布在多個計算節(jié)點上進行計算,并在不泄露原始數(shù)據(jù)的情況下完成計算任務(wù)。這可以有效保護企業(yè)的數(shù)據(jù)隱私,避免敏感數(shù)據(jù)被泄露。
高效性和可擴展性:英特爾BigDL-PPML基于分布式計算框架Spark進行實現(xiàn),可以實現(xiàn)大規(guī)模深度學(xué)習(xí)模型的訓(xùn)練和推理,同時保證計算效率和可擴展性。這可以為企業(yè)提供更加高效和可靠的數(shù)據(jù)分析和處理服務(wù)。
降低數(shù)據(jù)處理成本:浪潮信息云海Insight大數(shù)據(jù)平臺具有完善的數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)計算流程,通過大數(shù)據(jù)處理技術(shù)和數(shù)據(jù)安全體系,可以對海量數(shù)據(jù)進行一站式處理。這可以降低企業(yè)的數(shù)據(jù)傳輸和處理成本,同時提高數(shù)據(jù)安全性。
提高數(shù)據(jù)價值:通過利用英特爾BigDL-PPML進行訓(xùn)練和推理,企業(yè)可以更加準(zhǔn)確地分析和挖掘數(shù)據(jù),從而提高數(shù)據(jù)的價值。同時,數(shù)據(jù)隱私得到保護,企業(yè)可以更加放心地分享數(shù)據(jù),促進行業(yè)內(nèi)數(shù)據(jù)共享和合作。
綜上所述,英特爾BigDL-PPML攜手浪潮信息云海Insight建立端到端的大數(shù)據(jù)和人工智能隱私計算方案,可以為企業(yè)帶來多方面的收益,包括數(shù)據(jù)隱私保護、高效性和可擴展性、降低數(shù)據(jù)處理成本和提高數(shù)據(jù)價值等。
持續(xù)更新完善隱私計算方案在各行業(yè)的創(chuàng)新應(yīng)用
基于英特爾SGX技術(shù),英特爾BigDL-PPML攜手浪潮信息云海Insight可以為企業(yè)提供更加安全和可靠的大數(shù)據(jù)和人工智能隱私保護機器學(xué)習(xí)方案,經(jīng)過雙方的聯(lián)合測試和多方實踐,該方案不僅能夠保障用戶的隱私安全,而且能夠提高企業(yè)的機器學(xué)習(xí)效率,為企業(yè)帶來包括數(shù)據(jù)隱私保護、高效性和可擴展性、降低數(shù)據(jù)處理成本和提高數(shù)據(jù)價值等多方面的收益。
隨著計算能力的不斷提高和人工智能算法的不斷創(chuàng)新,大數(shù)據(jù)和人工智能的應(yīng)用場景也將會更加廣泛,數(shù)據(jù)隱私和安全問題變得越來越重要?;谟⑻貭朣GX技術(shù)的英特爾BigDL-PPML將成為企業(yè)實現(xiàn)數(shù)據(jù)安全和隱私保護的重要工具,浪潮信息云海Insight大數(shù)據(jù)智能分析平臺將會不斷更新和完善,為企業(yè)提供更加安全可靠的數(shù)據(jù)處理和分析服務(wù)。雙方將繼續(xù)深入合作,進一步完善端到端的大數(shù)據(jù)和人工智能隱私保護方案,在保障用戶數(shù)據(jù)安全的同時,促進大數(shù)據(jù)和人工智能技術(shù)持續(xù)發(fā)展,在各行各業(yè)中產(chǎn)生更多的創(chuàng)新和應(yīng)用。