隨著深度學(xué)習(xí)、CAE仿真、大數(shù)據(jù)分析、動畫渲染、圖像分析、高性能計(jì)算的快速發(fā)展和個性化服務(wù)的不斷演進(jìn),大型互聯(lián)網(wǎng)公司在服務(wù)用戶過程中積累了海量數(shù)據(jù)。此外,數(shù)據(jù)的頻繁跨境、跨系統(tǒng)、跨生態(tài)圈交互已成為常態(tài),加劇了隱私信息在不同信息系統(tǒng)中有意、無意留存,但隨之而來的隱私信息保護(hù)短板效應(yīng)、隱私侵犯追蹤溯源難等問題越來越嚴(yán)重,致使現(xiàn)有的隱私保護(hù)方案不能提供體系化的保護(hù)。
12月21日,由中國信息通信研究院和中國通信標(biāo)準(zhǔn)化協(xié)會聯(lián)合主辦的“2021可信隱私計(jì)算高峰論壇暨數(shù)據(jù)安全產(chǎn)業(yè)峰會”在北京舉行。
會上各個專家從數(shù)據(jù)安全、構(gòu)筑安全可信的數(shù)據(jù)互聯(lián)互通的基礎(chǔ)設(shè)施、圍繞隱私計(jì)算的底層關(guān)鍵技術(shù)、深入解析隱私計(jì)算的算力及通信挑戰(zhàn)提出了見解與看法。
數(shù)據(jù)安全
專家深入分析了政務(wù)數(shù)據(jù)流通、金融數(shù)據(jù)流通、保險數(shù)據(jù)流通面臨的問題,提出了數(shù)據(jù)安全的新觀點(diǎn)。將數(shù)據(jù)安全分為四層:
第一層:數(shù)據(jù)傳統(tǒng)安全,包括數(shù)據(jù)的保密性、完整性和可用性。
第二層:數(shù)據(jù)作為生產(chǎn)要素在流通過程中的權(quán)益和安全。
第三層:互聯(lián)網(wǎng)平臺企業(yè)收集海量數(shù)據(jù)形成的數(shù)據(jù)霸權(quán)。
第四層:可能影響國家安全的數(shù)據(jù)主權(quán)。
這四層互聯(lián)互通。例如,個人隱私保護(hù)本質(zhì)上是屬于數(shù)據(jù)保密性的范疇,但在大數(shù)據(jù)環(huán)境下,也與第二層和第四層相關(guān)。
專家表示:只有安全地使用數(shù)據(jù),數(shù)據(jù)作為生產(chǎn)要素的價值才能得到釋放。在數(shù)據(jù)安全流通領(lǐng)域,為公共數(shù)據(jù)和社會數(shù)據(jù)按需安全開放創(chuàng)造更多應(yīng)用場景,推動數(shù)字化轉(zhuǎn)型,激發(fā)數(shù)字經(jīng)濟(jì)活力將成為一大課題。
構(gòu)筑安全可信的隱私數(shù)據(jù)
互聯(lián)互通基礎(chǔ)設(shè)施
隱私計(jì)算技術(shù)發(fā)展到現(xiàn)階段面臨著一個臨界點(diǎn),即隱私計(jì)算能否從一項(xiàng)創(chuàng)新型技術(shù)走向大規(guī)模生產(chǎn)和應(yīng)用。在這個過程中,隱私計(jì)算的技術(shù)服務(wù)商面臨兩大挑戰(zhàn):
一:如何在實(shí)際業(yè)務(wù)中更廣泛地應(yīng)用隱私計(jì)算?
隱私計(jì)算作為保障數(shù)據(jù)隱私安全的技術(shù),必然會入侵和影響現(xiàn)有的數(shù)據(jù)業(yè)務(wù)系統(tǒng)。對于試圖引入隱私計(jì)算的客戶來說,隱私計(jì)算技術(shù)服務(wù)商能否打消他們對業(yè)務(wù)受損的擔(dān)憂,是客戶能夠深度擁抱隱私計(jì)算的前提。因此,降低隱私計(jì)算帶來的性能損失,提高隱私計(jì)算平臺的通用性和可擴(kuò)展性,為現(xiàn)有數(shù)據(jù)服務(wù)中的上下游系統(tǒng)提供充分的兼容性,是隱私計(jì)算技術(shù)服務(wù)商需要考慮的關(guān)鍵問題。
二: 如何充分信任隱私計(jì)算的安全性?
雖然從技術(shù)角度來看,隱私計(jì)算的每一條技術(shù)路線都有其自證的邏輯,但對于最終客戶來說,對這項(xiàng)技術(shù)信任的建立不能僅僅依靠技術(shù)論證本身。做好技術(shù)標(biāo)準(zhǔn)化,實(shí)現(xiàn)技術(shù)棧自主可控國產(chǎn)化,建立權(quán)威和監(jiān)管機(jī)構(gòu)認(rèn)可的標(biāo)準(zhǔn)體系,也是隱私計(jì)算廠商需要推動和解決的問題。

面對上述一系列挑戰(zhàn)隱私計(jì)算技術(shù)發(fā)展的六大突破總結(jié)如下:
1.多技術(shù)路線有機(jī)融合:
通過實(shí)現(xiàn)跨技術(shù)路線的互聯(lián)互通,降低不同技術(shù)路線客戶的選型成本。
2.國產(chǎn)化生態(tài)深化:
隱私計(jì)算上下游與數(shù)據(jù)庫、數(shù)據(jù)治理等國產(chǎn)軟件服務(wù)商形成深度合作。
3.軟硬件深度優(yōu)化突破:
性能層面,通過軟硬件深度優(yōu)化實(shí)現(xiàn)計(jì)算效能的突破。
4.隱私計(jì)算的可信增強(qiáng):
通過技術(shù)和非技術(shù)手段具有更強(qiáng)的可信度。
5.離線計(jì)算全面覆蓋:
在隱私計(jì)算目前覆蓋的建模訓(xùn)練、統(tǒng)計(jì)分析等線下場景之外,針對數(shù)據(jù)處理等線上場景,擴(kuò)大隱私計(jì)算技術(shù)的覆蓋范圍。
6.工業(yè)級別工程化落地:
穩(wěn)定性和可用性方面,面對數(shù)億樣本甚至更大的數(shù)據(jù)量級,隱私計(jì)算平臺的生產(chǎn)可用性仍有保障。

高性能算力加速構(gòu)建數(shù)據(jù)
安全流通網(wǎng)絡(luò)
人工智能的發(fā)展與大數(shù)據(jù)息息相關(guān)。AI 的成功基于大量的數(shù)據(jù)。但在行業(yè)內(nèi),由于數(shù)據(jù)安全相關(guān)法律法規(guī)的相繼頒布實(shí)施,對數(shù)據(jù)的管理和使用日趨嚴(yán)格。醫(yī)療、政務(wù)、金融等高質(zhì)量、規(guī);臄(shù)據(jù)通常以數(shù)據(jù)孤島的形式分散在不同的機(jī)構(gòu)和行業(yè),難以聚集起來進(jìn)行人工智能建模。

在嚴(yán)監(jiān)管的情況下,解決數(shù)據(jù)供給和數(shù)據(jù)安全防護(hù)的雙重需求逐漸成為各行業(yè)普遍存在的問題。因此,“數(shù)據(jù)可用不可見、數(shù)據(jù)不動模型動”的特性使其迅速“出圈”,備受業(yè)界關(guān)注。就像一條小溪流入江河大海。借助深度學(xué)習(xí)技術(shù),把分屬于不同機(jī)構(gòu)的數(shù)據(jù)匯集在一起,分離數(shù)據(jù)所有權(quán)和使用權(quán),將小數(shù)據(jù)聚合成大數(shù)據(jù),以安全合規(guī)的方式進(jìn)行建模培訓(xùn),是企業(yè)數(shù)字化轉(zhuǎn)型的重要支撐。
從技術(shù)層面來看,在原始數(shù)據(jù)不出域的前提下,實(shí)現(xiàn)了數(shù)據(jù)價值的高效轉(zhuǎn)移,既滿足了監(jiān)管對數(shù)據(jù)安全保護(hù)的要求,又使得數(shù)據(jù)生產(chǎn)要素功能的高效轉(zhuǎn)移成為可能,同時釋放了人工智能和機(jī)器學(xué)習(xí)工業(yè)應(yīng)用的增量需求。
作為人工智能和大數(shù)據(jù)的重要關(guān)鍵技術(shù)延伸,深度學(xué)習(xí)技術(shù)大規(guī)模應(yīng)用于政務(wù)、金融、醫(yī)療等領(lǐng)域漸成重要趨勢。然而,由于深度學(xué)習(xí)中大量密碼算法的引入,效率是大規(guī)模深度學(xué)習(xí)系統(tǒng)的關(guān)鍵挑戰(zhàn)。
不解決算力和通信問題,隱私計(jì)算的大規(guī)模應(yīng)用將無從談起。面對隱私計(jì)算的算力和通信壓力,通過對隱私計(jì)算的大量實(shí)驗(yàn)和分析,深度學(xué)習(xí)的計(jì)算能力挑戰(zhàn)主要來自兩個方面:
計(jì)算壓力
深度學(xué)習(xí)使用大量的密文計(jì)算,加密后的數(shù)據(jù)計(jì)算會產(chǎn)生大量的計(jì)算能力開銷,單模型訓(xùn)練和迭代的耗時會呈指數(shù)級增長。即使使用最小位數(shù)進(jìn)行加密計(jì)算,如1024bit密鑰位寬,相較于明文計(jì)算慢數(shù)十倍。隨著秘鑰位寬的增加,隱私計(jì)算的實(shí)際運(yùn)算效率會出現(xiàn)指數(shù)級的差異。
通信壓力
與傳統(tǒng)的分布式學(xué)習(xí)技術(shù)相比,現(xiàn)在的學(xué)習(xí)模型分布在不同機(jī)構(gòu)和行業(yè)的參與方。因此,深度學(xué)習(xí)的實(shí)際應(yīng)用往往需要頻繁的通信來交換中間結(jié)果,并且使用秘密狀態(tài)來傳輸中間結(jié)果,進(jìn)一步降低了數(shù)據(jù)傳輸?shù)男省?/p>
藍(lán)海大腦深度學(xué)習(xí)平臺廣泛應(yīng)用于各個領(lǐng)域,液冷GPU工作站搭建于 NVIDIA 4 × A100 / 3090 / P6000 / RTX6000;使用 NVLink + NVSwitch的最高GPU通信;4個用于 GPU Direct RDMA的NIC(1:1 GPU比率);最高4 x NVMe用于GPU系統(tǒng)盤,帶有 AIOM。為隱私計(jì)算的發(fā)展保駕護(hù)航。
|