人工智慧的原理與應用

日期 2021-03-29

台北福星曙光衛星社 曲建仲博士Hightech
 
人工智慧的分級與歷史

人工智慧(AI:Artificial Intelligence),一個吸引人們卻又令大家害怕的名詞,吸引我們的是一個會思考可以協助我們處理工作的智慧型機器人,可以替我們帶小孩洗衣做飯;讓我們害怕的是這個機器人自己會思考,哪天他不聽話了怎麼辦?更慘的是,哪天老闆發現他比我還好用,那我不就失業了?許多人以為人工智慧就是科幻電影裡會思考的機器人,人工智慧真的這麼神奇嗎?現在的人工智慧到底發展到什麼程度了?它到底有那些限制呢?

人工智慧的定義與範圍

人工智慧(AI:Artificial Intelligence)是指人類製造出來的機器所表現出來的智慧,人工智慧討論研究的範圍很廣,包括:演繹、推理和解決問題、知識表示法、規劃與學習、自然語言處理、機器感知、機器社交、創造力等,而我們常常聽到的「機器學習(Machine learning)」是屬於人工智慧的一部分,另外「深度學習(Deep learning)」又屬於機器學習的一部分,如圖一所示。

人工智慧的分級

人工智慧的依照機器(電腦)能夠處理與判斷的能力區分為四個分級如下:

→第一級人工智慧(First level AI):自動控制

第一級人工智慧是指機器(電腦)含有自動控制的功能,可以經由感測器偵測外界的溫度、濕度、亮度、震動、距離、影像、聲音等訊號,經由控制程式自動做出相對的反應,例如:吸塵器、冷氣機等,這個其實只是電腦含有自動控制的程式,程式設計師必須先把所有可能的情況都考慮進去才能寫出控制程式,算不上是真的「智慧」。

第一級人工智慧就好像是公司裡的工讀生:只是執行老闆交待的命令,進行各種重複性的工作,並不會去思考這個命令是否正確,例如:老闆說把大箱子搬到寫有「大」的區域;小箱子搬到「小」區域,工讀生就依照老闆的交待去做。

→第二級人工智慧(Second level AI):探索推論、運用知識

第二級人工智慧是指機器(電腦)可以探索推論、運用知識,是基本典型的人工智慧,利用演算法將輸入與輸出資料產生關聯,可以產生極為大量的輸入與輸出資料的排列組合,可能的應用包括:拼圖解析程式、醫學診斷程式等。

第二級人工智慧就好像是公司裡的員工,能夠理解老闆交待的規則並且做出判斷,例如:老闆說根據箱子長、寬、高分類大小箱子,運用知識留意不同貨物種類:小心易碎、易燃物品,員工就依照這個意思把箱子的尺寸量出來分類,並且要判斷什麼貨物「易碎」或「易燃」?

→第三級人工智慧(Third level AI):機器學習

第三級人工智慧是指機器(電腦)可以根據資料學習如何將輸入與輸出資料產生關聯,「機器學習(Machine learning)」是指根據輸入的資料由機器自己學習規則,可能的應用包括: 搜尋引擎、大數據分析等。

第三級人工智慧就好像是公司裡的經理,能夠學習原則並且自行判斷,例如:老闆給予大箱子與小箱子的判斷原則(特徵值),讓經理自己學習如何判斷多大是大箱子?經理就依照以往的經驗,自己思考多大的箱子是「大」?

→第四級人工智慧(Fourth level AI):深度學習

第四級人工智慧是指機器(電腦)可以自行學習並且理解機器學習時用以表示資料的「特徵值」,因此又稱為「特徵表達學習」 ,可能的應用包括: Google教會電腦貓的特徵。

第四級人工智慧就好像是公司裡的總經理,能夠發現規則並且做出判斷,例如:發現有一個箱子雖然很大但是卻是圓形(特徵值),與其他貨物不同應該另案處理。

第三級(主要是指機器學習)與第四級(主要是指深度學習)不容易區分,其實深度學習是由機器學習發展而來,主要的差別在於,第三級人工智慧處理資料時的「特徵值」必須由人類告訴機器(電腦);第四級人工智慧處理資料時的「特徵值」可以由機器(電腦)自己學習而得,這是人工智慧很大的突破。

人工智慧的創新應用

利用機器學習進行翻譯:Google開發翻譯技術突破性的「神經網路機器翻譯系統(GNMT:Google Neural Machine Translation)」,不再將句子中的名詞和短語單獨翻譯,而是直接處理完整的句子,使翻譯誤差降低50%以上。

利用神經網路識別影像:Google Cloud影片智慧使用深度學習模型,基於TensorFlow軟體框架進行開發,讓開發者輕鬆搜索和發現影片內容,例如:狗、花、人等名詞與跑、游、飛等動詞相關的影像資訊,甚至可以提供語境理解。

黃瓜智慧分類挑選系統:日本的一位菜農使用TensorFlow為他收獲的大量黃瓜建立了自動分類挑選儲存系統,相機自動拍攝黃瓜圖片後,利用TensorFlow神經網絡系統分析辨別黃瓜的顏色、大小,自動分類挑選9個不同的品質級別。

分析辨識特定植物病蟲害:廠商開發了一個名為PlantMD的手機應用程式(APP),利用大學的數據資料庫plantvillage.com中收集的數據,訓練模型去識別生病的植物,也可以使用類似的方法診斷皮膚病。

糖尿病視網膜病變診斷:糖尿病視網膜病變會造成失明,Google與印度和美國的醫生合作,建位12萬張眼底掃描圖片的數據資料庫,用於訓練檢測糖尿病性視網膜病變的深度神經網絡,可以幫助醫生提高診斷效率,使患者儘早得到治療。

頭部頸部癌症訪斷治療:Deepmind與英國倫敦大學醫學院合作,利用機器學習參與治療方案的設計過程,協助醫護人員分辨癌變組織和健康組織,細分過程由4小時縮短到1小時,同時提高了放射治療的效率。

交易與理財諮詢(Robo advisor):投資理財機器人可以依照客戶不同的財務目標、風險容忍度、投資範圍等演算出建議的資產配置,系統自動將資金配置投資於幾個指數型基金,過程只需要10分鐘。

風險控管模型建構(Risk control):目前銀行的信用評分制度多依賴聯合徵信中心的信用相關資料作為評分參數,透過人工智慧與大數據可以分析客戶的票證支付、電信公司、公用事業、大賣場、購物商城、社群網站資料發展出全方位的信用評分系統。

金融監理科技(RegTech:Regulation Technology):金融科技興起造成金融監理及法令遵循的管控工作日益繁瑣,人工智慧可以將行員與客戶之間的交談錄音及錄影資料,透過特定的關鍵字檢索,定期進行過濾與檢視,能快速地確認其中是否有違反相關的作業規定。

安全防護身分辨識(Identification):經由人工智慧演算法進行臉部、聲紋、虹膜、靜脈、指紋等生物辨識,作為客戶進行金融交易的主要方式,時間更短、精確度更高,例如:支付寶在2015年時就以機器視覺與深度學習研發「人臉支付」技術。

精準行銷(Precision marketing):利用人工智慧可以分析購買行為、客戶特徵、社群行為等,了解各種客戶特性,並且利用數據開發預測模型,作為處理信用額度、風險管理、產品訂價的工具,依據不同預測結果提供客製化服務。

智慧客服(Smart chatbot):運用人工智慧實體或線上機器人,可以利用臉部辨識判定客戶身分,經由情緒辨識分析客戶的聲紋、表情、肢體動作決定如何與客戶互動,可以分析客戶的基本資料、消費記錄等大數據對客戶建議相關產品。

犯罪行為評估(Criminal behavior):透過個人移動路線和行為數據,來評估犯罪的可能性,根據人們的目的地與行為來評估高度可疑的人群,如果某人經常前往販賣刀具的商店,當國民的犯罪風險到達危險的高度時,系統就會通知警方介入干預。

情緒表情分析:經由個人臉部表情、肢體動作、聲音語調分析行為特徵,辨識通用情緒:憤怒、厭惡、恐懼、快樂、悲傷、驚訝等,來源於「情緒臉部動作編碼系統(EMFACS:Emotional Facial Action Coding System)」。

在可以預見的未來,人工智慧應用將成為協助我們生活與工作的好幫手,未來將會有愈來愈多的使用情境,就讓我們拭目以待吧!