不論是在網絡上,報紙還是各式各樣的媒體中,你都會看見機械學習,深度學習又或是人工智能等Buzzword,有時還上加上區塊鏈和FinTech等字眼。恍忽加上了這些字詞整篇文章的格調就得到了提升。但這些花俏字眼又能騙過多少人呢?
夢中的科技—人工智能
人工智能之父當然要數圖靈,他所發明的圖靈機概念奠定了人工智能的諸多基礎。但要數人工智能的實踐就要數到1956年的夏天。人工智能領域先驅們提出了「廣義人工智能(General AI)」的概念,擁有人類的所有感覺(甚至可能更多)、所有理智,並且像人類一樣思考的神奇機器。
想像一下《星際大戰》裡的 C-3PO、又或是《終結者》裏人類敵人的終結者,電影已經出現太多這些被我們當做朋友的機器。我們實現不了這些事,至少目前還做不到。
那人類能夠實現的人工智能是甚麼?那就是「狹義人工智能(Narrow AI)」,是指在處理特殊任務之際,表現如同人類一樣好,甚至是更好的技術。運用狹義人工智能的例子有 Pinterest 上的影像分類與 Facebook 的人臉識別。
這些是應用狹義人工智能的例子,展現出人類智能的一些面向。但是又如何做到的?那項智能源自於哪裡?那就要提到機器學習。
通往人工智能的鑰匙—機器學習
機器學習最基礎的用法,是通過演算法來分析數據、從中學習,以及判斷或預測現實世界裡的某些事,並非手動編寫帶有特定指令的軟體程序來完成某個特殊任務,而是使用大量的數據和演算法來「訓練」機器,讓它學習如何執行任務。
最早提出人工智能概念的學者們構思出機器學習的概念,多年來也發展出決策樹學習、歸納邏輯編程、叢集、強化學習和貝葉斯網路等演算法,然而這些都沒有達到廣義人工智能的最終目標,也未實現狹義人工智能的一小部分目標。
其實多年來最擅長應用機器學習的領域之一就是電腦視覺,不過仍得靠大量人工編碼作業來完成工作。人們會製作人工編碼分類器,像是邊緣檢測過濾器,讓程序可以識別對象的啟止位置、進行形狀檢測以確定是否為八邊形,還有用來識別「S-T-O-P」的分類器。從這些人工編碼分類器中,發展出能理解影像的演算法,「學習」判斷是否這是一個停止標誌。
這很好,但還不到讓人驚艷的程度,特別是在起霧時無法完全看到標誌的情況下,或者被樹遮住了一部分。太過脆弱又太容易出錯的電腦視覺和影像檢測技術,還達不到與人類媲美的水準,一直要到近期才有重大突破。
時間和正確的學習演算法改變了一切。
鑰匙的尖端—深度學習
從早期機器學習又衍生出人工神經網路,這已有幾十年的發展歷史。我們對大腦生物學的理解,也就是所有神經元之間相互連接,成為發展神經網路的靈感。這些人工神經網路的各層、連結和數據傳播方向呈現離散狀態,不像生物大腦中的任何神經元,可以在一定的物理距離內連接其它神經元。
像是你可以將一個圖像切成一堆碎片,並且輸入到神經網路的第一層,接著第一層的獨立神經元將數據傳遞給第二層,第二層神經元再傳給第三層,一直傳到最後一層並產生出最終結果。
各神經元對於輸入內容都會分配一個權重,評估與否正確執行任務,並且由權重的加總值來判斷最終產出的結果。以前面那個停止標誌的例子來看,一一分解一個停止標誌圖像的特徵,並且由神經元來「檢查」它的八角形形狀、紅色的消防車、獨特的字母、交通標誌的尺寸,還有它是否有在動作。神經網路的任務是判定它是否為一個停止標誌,這裡產生出了一個「機率向量」,是一項基於權重、經過高度訓練的猜測。在我們的例子裡,系統可能有 86% 的把握,覺得圖像是一個停止標誌,7% 的把握認為是一個限速標誌,5% 的把握認為是一只卡在樹上的風箏,接著網路架構將結果正確與否告訴神經網路。
我們再回到停止標誌的例子。正在調整或「訓練」網路時,出現大量的錯誤答案,這是一個極佳的機會。網路需要的正是訓練,它需要看到成千上萬,甚至數以百萬計的圖像,直到精確調整神經元的輸入權重,讓它幾乎每次都能得到正確答案,不管有無起霧、天氣是晴是雨。在這方面神經網路已經自己學會停止標誌的外觀;或是在 Facebook 例子裡怎麼辨識媽媽的臉。
Source: Nvidia
Text by Fortune Insight