晶文摘

[人工智慧] AI人工智慧與產業廣汎應用的距離-開發流程

給晶新聞一個讚



作者:夏肇毅 2020-5-21 初版 工商時報

AI人工智慧與產業廣汎應用的距離


近年來AI人工智慧議題發燙,各類應用的新聞如雨後春筍般冒出。AI可以用來解決各式各樣的問題。就像現在covid19新冠病毒疫情嚴重,世界各國很多人嘗試著用人工智慧來找出跟疫情相關的因子,試圖預測未來各地染病的人數,替世界盡一份心力。


開發解決一個問題的人工智慧模型需要餵入大量資料,再經過幾天幾夜的訓練後才能使用。但能不能訓練出結果來,還在未定之天。萬一不行,就要試著調整模型,再加工一下資料,等待幾天後再看一次結果。但時間就是金錢,電腦資源用得越久就花得越多。而事前標示資料正確答案,更需要大量人力來處理,國外新創人工智慧公司曾表示,八成以上的人力都在做資料答案標示。聘用的大量高薪人員也造成十分沈重的負擔。在前幾年AI風潮剛起,有大量資金投入時尚能支應。那時大家爭先恐後卡位,不怕燒錢只怕搶不到人。幾年過去,卻猛然發現成果有限,無法兌現對客戶的承諾。在長成金雞母無望,不堪長年虧損之下,只好砍人收攤。


人工智慧的開發流程


一個人工智慧應用研發的步驟包括設計模型,整理資料與訓練模型。一般人工智慧的程式都不大,所以業者會主動分享各式研究好的模型讓人免費使用,再以推廣服務的方式來搶佔地盤,圖的是日後租用運算設備的生意。


模型是人工智慧運作的核心,粗淺的模型需要輸入和記憶中的範本很相似才能識別。深層模型能將特徵濃縮汲取,只要本質一致就可以識別。有模型後就要加以訓練,如訓練好的語言模型能將字詞濃縮成相近的語意代號,這樣能大幅縮減識別範本記憶的規模。訓練也需要大量資料才能見效,像語音識別,先要訓練出聲學模型。這需要將高低快慢各種口音的樣本都先熟悉一次,才訓練的起來,否則最後的識別率會很差。等到聲學模型識別輸出之後要再連到語言模型處理,這樣人工智慧才能識別出說話的語意。


由此可知,人工智慧的運作需要大量的資料範本做基礎。它的基本原理,是要從分析大量資料的過程中,尋找特徵並記憶答案。之後再次碰到這些特徵時,就可以很快的分析出之前記住的答案。就像考試一樣,記得的考古題越多,答對的命中率就越高。因此,擁有大量資料是發展人工智慧的基礎。然而只有平日接觸大量客戶,有客服的大公司才能擁有這些應對過程,以及大量的人力來處理所收集到的這些資料。