︿
Top

英國皇家學會院士樊文飛提出2個新理論:把大數據變小,突破企業資源限制

瀏覽次數:4380| 歡迎推文: facebook twitter wechat twitter twitter

科技產業資訊室 - May 發表於 2019年9月18日

圖、AI新理論:把大數據變小

目前AI是否過熱需要冷思考,或是AI新創公司快要彈盡援絕了呢?
 
最近,英國皇家學會(FRS)院士樊文飛(Wenfei Fan)也是愛丁堡大學主任教授,接受『MIT 科技評論』雜誌訪問,提出把大數據變小,突破企業資源限制的看法,表示:
  • 「AI 目前可以幫助我們發現一些關聯關係,提高生產效率。要使 AI 進一步發揮潛力,就需要提高基礎計算引擎的效率。」
  • 「大數據是 AI 的基礎。由於大數據計算的困難性,傳統的經典計算理論已經不能夠解決大數據的問題,需要新的理論和切實可行的技術」。
  • 「計算機研究的核心是理論和系統。」
樊文飛是國際學術界公認的在「資料庫理論與系統領域都做出突破性貢獻的極少數學者之一」。他是資料庫領域獲得國際資料庫理論與系統四大頂級會議的最佳論文獎或十年最佳論文獎(SIGMOD 2017,PODS 2015 & 2010,VLDB2010, ICDE 2007)。
 
他認為:「計算機研究的核心是理論和系統。」
人工智慧的背後代價和成本,不是一般的企業所能承受的。能否藉由理論的突破到系統的落地,來解決大多數企業因資源受限而無力進行大數據分析的現實問題。也就是說,通過『把大數據變小』,做到企業無論大小都能享受大數據分析的利益。
 
於是,他的團隊提出了兩個研究理論:有界計算理論(bounded evaluation)及數據驅動的近似計算(data-driven approximation)理論。」
 
有界計算理論(bounded evaluation
所謂”有界計算理論”研究,基本思想是給定一個函數 F(x),參數 x 代表大數據集,然而,多數計算不需要訪問全部的 x,而是只需要取 x 的一小部分就能得到 F(x)的精確解。也就是如何根據不同的函數 F,根據語義找到所需的 x 的那一小部分。
 
舉例來說,大企業通過測試發現,在數十億條數據的實時查詢場景下,91% 的查詢可以用有界計算來解決;並在 70% 以上的查詢中,查詢效率提升 25 倍到 14 萬倍。剩餘 9% 不具備有界計算條件的查詢,可以通過數據驅動的近似計算理論來解決。
 
數據驅動的近似計算(data-driven approximation)理論
根據用戶的查詢,在數據的層次表述中動態找到所需的數據,並在有限資源下計算查詢的近似解。其特點是保證精確度,即對每個精確解,都找到一個對應的近似解使得二者之間的誤差在一定範圍內,同時每個近似解都對應一個誤差範圍內的精確解。目前,國際上還沒有查詢系統能做到這一點。
 
舉例來說,「在北京找一個離藝術館比較近的、價格低於 500 元的旅館,在資源有限的情況下只能查看一百條數據。但找出一個近似的結果,可能旅館是 520 元,距離美術館比較近的旅館。」
 
他的第一團隊「數據征服者」簡稱「CoD
正在做「把大數據變小」這個理論的產業化落地,這個系統將有界計算和數據驅動的近似計算疊加,突破性解決大數據計算問題。該系統預計明年(2020) 將在 CNCC 大會展示區展出其系統原型。
 
他的第二團隊「GRAPE
基於兩個理論研究以提升大規模圖數據計算效率,從 2016 年開始,樊文飛著手研究並提出了兩個理論:一個是基於不動點計算的單機圖算法自動並行化的程序設計模型,另一個是同步/異步自適應並發計算模型。這些理論可以降低並行圖計算程序設計的門檻,保證計算正確性,同時可以大幅提升效率。這些工作獲得了包括 SIGMOD 和 VLDB 這些行業頂級會議上的三個獎項。
 
該GRAPE系統,已於 2018 年 3 月 5 日在中國設立公司,後由一家網際網路巨頭所收購,將建立一個GRAPE開源社區及打造成為一個中國的國際 IT 軟體品牌。(1205字;圖1)
 
 
參考資料:
英國皇家學會院士樊文飛:把大數據變小,突破企業資源限制。MIT 科技評論,2019/9/17。


相關文章:
1.前瞻技術脈動:AI與機器人技術(201903)
2.臺灣的人工智慧展望
3.AI重大突破關鍵在於硬體設計
4.人工智慧正重塑人類的發明模式
5.Forbes:2019年人工智慧與機器學習的三項預測

 

 
歡迎來粉絲團按讚!
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1. 科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2. 著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。