第二個挑戰來自數據隱私保護。
戴文淵指出,即便是有數據科學家,或者通過AutoML降低了AI的門檻,但缺少數據隱私保護技術,AI應用也會面臨嚴重問題。在大數據當中如何保護用戶的隱私,這是AI的第二個挑戰。
目前,可用的高質量數據依然稀缺,這就需要通過遷移學習把數據中的知識從一個領域遷移另一個新領域,保證AI在新領域的應用及效果。第四範式在遷移學習領域積累了很多優秀的算法,但我們一直堅持系統本身需要解決好隱私的問題,AI基於數據得出的一些結論被應用是可以被大家接受的方式,前提是這些結論並沒有記錄個人具體的數據。“最近幾年我們在遷移學習隱私保護領域取得了比較大的突破,能夠把知識從一個領域遷移到另外一個領域,同時也不會導致隱私暴露。今年年初,第四範式先知率先通過了歐盟GDPR認證,成為國內第一款通過該認證的AI平台產品。”
第三個挑戰是AI算力成本。
戴文淵在演講中指出,頂尖的互聯網公司每年要花費上千億在搜索引擎、推薦引擎上,這是由於AI發展所帶來的算力成本激增,然而很少有傳統企業能接受如此高的成本。
目前,AI體系中硬件成本居高不下,但AI不僅是硬件體系,而是硬件+軟件融合發展的體系,軟件的設計必須要基於硬件的特點,硬件的設計也必須基於軟件的算法。“我們發現如果採用軟硬件深度融合優化的方式,不止性能會提高十倍,成本也會大幅降低。”戴文淵說。
以第四範式服務的某零售企業推薦場景為例,過去需要採用88台傳統服務器才能支撐AI業務,採用軟硬一體的方式後降為8台,TCO(總擁有成本)降低了90%。 |