︿
Top

科技部釋出免費「AI語音大數據」

瀏覽次數:3523| 歡迎推文: facebook twitter wechat twitter twitter

張仁僡 、創新創業推動組 發佈於 2020年3月17日

圖、科技部釋出免費「AI語音大數據」
 
對話是人機互動最直覺的方式,像是Siri這類任務型的語音智慧助理將人機對話場景帶入日常生活,無疑是近年行動裝置普及後,最令人興奮的進展之一。「科技大擂台:與AI對話」的宏遠目標是打造與台灣在地民眾溝通無礙的對話機器人,這個難度比完成指定任務的語音助理更困難,除了AI要聽得懂台灣在地腔調,並且理解對話內容的意涵之外,還得用台灣人聽得懂的方式表達出來。

2019年3月「科技大擂台:與AI對話」第一屆決賽落幕,期間競賽依照題型難度分為初賽、複賽、決賽等,每階段競賽主辦單位都會釋出1000至4000題不等的測試資料,第一屆正式賽賽事總計約有15,000題選擇題,在比賽後重新整理且除錯之後,於2019年6月在國家實驗研究院高速網路與計算中心資料集平台(NCHC DATA MARKET)上架,此數據集公開釋出後,可讓我國企業、學研界免費取得授權,用於技術研發以提升台灣產業競爭力。語音大數據被視為AI基礎建設之一,隨著新賽事的進行,未來釋出的「AI語音大數據」數量可望持續擴大,內容形式與知識領域也日趨多元化。

企業導入AI技術有助提升企業競爭力,因此許多科技公司都搶著開發AI技術,以便盡早提供企業新管理工具,強化生產力。然而,一般而言,若一家公司的資料集是散亂、無統一格式的非結構化資料,則需先雇用人力蒐集、分析、清理所需的資料集,完成標註之後,才能著手發展AI技術,如此一來,可以想像這個過程不僅所費不貲、曠日費時,人力也難免發生錯誤,構成許多企業跨入AI的一大門檻。而雪上加霜的是,全球與使用者有關的數位資訊多半掌握在雲端巨擘手中,資料量數量越龐大越多元,AI技術就越容易有突破性的進展,換言之,技術後進者要突破技術重圍,還需要先克服「資料霸權」的嚴峻議題。(680字;圖1)
 
科技部語料庫 歡迎來下載:
https://scidm.nchc.org.tw/dataset?tags=%E7%A7%91%E6%8A%80%E5%A4%A7%E6%93%82%E5%8F%B0
 
 
參考文獻
2019台灣企業AI領先度調查(一),天下雜誌,2019/7/25,https://www.cw.com.tw/article/article.action?id=5096151,檢閱日期:2019/7/30
陳杰翰、莊坤達,人工智慧的非技術挑戰,科學發展,2019年3月,第555期,頁13。


相關文章:
1. 科技部找好手要AI聽懂國語
2. 亞馬遜企圖語音辨識結合穿戴式裝置,創造感測人類情緒市場商機
3. AI語音助理於2023年達80億次,內建語音之智慧電視成長最快
4. CES 2020 AI語音助理正深入日常生活各角落
5. 臉書秘密開發語音助理,將應用於AR/VR產品
 

 
歡迎來粉絲團按讚!
--------------------------------------------------------------------------------------------------------------------------------------------