(改寫自Microsoft ”Democratizing AI” )
人工智慧,在過去只在科技小說出現的情節,現在每天出現在我們的日常生活中。
每天上Facebook,總是跳出你想買的東西的廣告,一直誘惑著你;每次出國回國,盯著自動通關的螢幕,就是運用人臉辨識確認你的身份,如果不幸辨識失敗,很可能因為你出國吃喝地太過份了。我們已經活在一個充滿AI的世界裡,只會往前,回不去了。
話說AI也不是什麼新玩意兒,早在我們的教授還在唸書的時代,就有人在用類神經網路發展這個那個應用,那現在怎麼又紅了起來,以一種理所當然的姿態走進我們的生活? 原因只有三個字 – 雲、大、物 – 雲,垂手可得的雲端計算能力,不用花大錢建機房買設備,要什麼Algorithm 雲上面都找的到。大,大數據,Data滋養人工智慧的活水,愈訓練智慧愈澄澈。物,物聯網,我們隨身的手機、運動手環、路上的監視器、店裡的beacon,不斷地送出Data。 這雲大物的浪潮下,感覺科技没有極限,什麼事都有可能?
雲大物可以無窮無盡一直發展下去,但時間有限,生命無常。
AI發展的意義,就是體認到時間有限,而世上還有很多的難題是需要被解決的。我們能不能用AI,加快我們對世界的理解,更有效地治療疾病、預防天災、種植農作、甚至安慰寂寞的人們?
微軟在AI這個領域一直没閑著,事實上,早在1990年代,我們就深信自然語言將成為人機溝通的主流,Microsoft Research 一直在Speech 語言及語意辨識持續領先。在近30年以來,微軟持續發展語言辨識,透過深度學習,至今錯誤率已經降到5.9%。這技術已經被廣泛運用在會議上即時的記錄及字幕展現,在速食餐廳得來速接受點餐,準確的記下來你要幾份麥香雞全餐幾份單點、幾杯低糖可樂去冰。或是用來即時口譯,讓你在Skype上面跟各國老外網友聊天。圖像判別能力,更早就超出人類的能力,錯誤率只有3.5%,高度精確的圖像辨識能力, 讓你路上看到不知名的花草樹木,打開App就成為植物專家;看到漂亮的台灣藍鵲飛過,不再只能張口結舌叫著- “看… 那隻帶點藍藍的黑鳥, 好漂亮”…. 而在商業運用上,也可以在工廠裡被用來判別是工程師的手還是銲接鋼架,實現所謂的人機協同應用;用在自駕車上,判斷是從大人手中跑掉的幼童或只是跳到路上的籃球。
走出學術的象牙塔,脫下權貴才穿得起的華服,微軟想促成AI的民主化 (Democratization)。 政治上的民主化是眾人的事讓眾人參與,而AI的民主化則是讓AI技術,人人用的著、用得起、用得好。
當下要怎麼做啊 Where we are today…
要促成AI的民主化,為普世可用,目前微軟從四個管道著手:
Agents
貼心的個人助理 : 給你新型態的互動方式,讓你用最自然的交談方式來跟溝通,無論是跟機器還是人。以Cortana為例,她不但可以中規中矩地提醒你下一個會議快開始了,你最好現在就出門,而且走什麼路線最快,Cortana的中國分身 – 小冰,還可以陪你聊天對對聯,因而成為微博上的網紅。基本上,愈多人用,她們的IQ跟EQ也愈來愈高,目前累積下來已經有1億3千3百萬活躍的使用者,超過120億次的互動交談。

Applications
聰明的App: 從手機輸入法到工作必備的Office,充份感受你的App愈用愈聰明,愈個人化。以SwiftKey 這個智慧鍵盤軟體為例,就是運用類神經網路來學習你的打字習慣,猜測並建議你要打的下一個字或詞,可以加快輸入的速度,目前已經被廣泛地用在3億iOS及Android 的手機平板上,從10兆次的打字愈學愈精準,幫使用者一共省下了10萬年的輸入時間。 另一個我最常用的是Office 365 PowerPoint 上的”Design Ideas”,幫你把原本怎麼排怎麼怪的圖跟文,去分析你的主題及重點,再幫你編排出既專業又賞心悅目的簡報,再怎麼艱澀的題目,也變得時尚而吸睛起來了。而在其它的商務應用像是Outlook, CRM等都大量運用了AI來讓你更有效率地處理大量的信件,排定處理順序跟追踪客戶需求。

Services
開放的程式介面API: 程式開發者像是大廚,微軟幫你把食材備好,洗好切好,大廚專心作菜和擺盤就好。在AI的廚房裡,程式開發者可以直接呼叫AI程式介面,像是Cortana Intelligence Suite提供了視覺、語音語言、圖像辨識等認知服務,這些API服務已經被廣泛運用在個人化醫療、居家照護、及服務業,像是UBER就用Cognitive Services 來開發可供乘客確認司機的App,讓搭車更安全。而談話機器人也成為近年最熱門的新應用, 讓人跟機器可以透過自然人類語言做順暢的溝通,可以發掘出語言中提到的人事時地物(Contextual awareness),並記住跟每個人的聊天歷程、推敲出語句背後要表達的用意(Intention)、了解當時情境並且能提供有溫度的回應。好像很難? 有了Bot Framework 也就没那麼難了,已經有超過5萬的程式開發者,用微軟Bot Framework SDK,加上Cognitive Services以及可連接到Facebook Messenger、Skype、SMS等各大社群及通訊管道, 讓大家快速可以打造一個談話機器程式,讓客服人員,可以將時間花在更複雜的問題上。

Infrastructure
隨選可得的基礎架構: 深度學習需要巨量平行運算的能力,所以過去AI的研究常需高額投資在買Server, 建HPC 高速運算中心。而現在,只要開個帳號就可運用微軟在全球38區佈署的Azure Cloud公有雲平台,彈指之間就可以使用Machine Learning訓練模型或是進階分析等。 進一步來看,透過深度類神經學習網絡(DNN,Deep neural networks),讓我們在電腦視覺、翻譯及語言理解上有了突破性的進展。微軟也將在深度學習的研究成果釋出,包裝成Cognitive Toolkits 深度學習框架 (以前叫做CNDK) ,以open source方式放在GitHub上,讓開發者可以運用在local或是Azure Cloud上來針對海量數據來開發應用。
然而,要服務廣大來自Internet的在線需求,傳統CPU或是圖形加速運算(GPU)架構,還是會面臨傳輸延遲(latency)、成本、電力耗損、以及無法彈性調配capacity等限制。 因而微軟近年大幅投資在FPGA (Field-Programmable Gate Array,現場可程式化閘陣列) 架構, 跟晶片及研體夥伴合作, 在Azure Cloud上建構了可組態的FPGA的超級AI網格架構(FPGA-Based Configurable Cloud),並且己經運用在Microsoft Bing的ranking服務上, 可支援到25GB/s 的Throughput, 延遲時間縮短至1/10。如果要將厚達1440頁的文學巨作 – 戰爭與和平從俄文翻到英文, 只用一個FPGA fabric的node, 只需要2秒半。

設計原則Design principles
坐在AI的這列特快車上的我們,是否擔心,會不會有一天AI取代了我的工作,而機器人用大數據,被訓練地比我們人類還要聰明?AI除了機器學習外,還會學習人類的感知,他們會不會變得比人類更懂人類,而終將統治人類?
人跟機器本來就不一樣,人類富有創意、同情心、各種情緒,而機器則擅長于在海量資料裡找出道理。機器,應該是來強化人們的分析判斷能力,克服時間的限制。人跟機器,應該是一起變出AI魔法的夥伴,而非相互競爭。
我們想要享受AI帶來的便利,也想要保護人類,保有人性。我們不只是在科技上持續創新,更需要所有勾勒美好願景的夢想者,及運用科技的實踐者, 共同信守一些價值觀或「心法」, 以坦誠、尊重、負責、包容的態度來相互協同合作。 微軟將之稱為設計準則 (Design Principles) –
透明化 Transparency
我們必須要了解技術的運作,跟背後的規則, 不只打造出有智慧可以理解人類的機器人,更需要了解機器人的智慧從何而來;不能只追求單向的人工智慧,更需要以雙向角度來發展「互利共生」智慧 (Symbiotic Intelligence)。做為AI原生物種的我們,要保有好奇心,試著了解。
尊重人性 多元包容 Respect dignity of people & Diversity:
AI 發展的出發點常是為了追求效率,但往往忽略了人性的需求;或是過於倚重大數據做為假設基礎, 顧及了廣大使用者的習慣, 而忽略了少數人的需求,甚至助長偏見的傳播。AI也需要加入文明進步的元素,鼓勵跨領域、跨國界的合作,以更細緻而先進的設計來尊重人性及包容多元性。
尊重隱私 Designed for Privacy
AI需要透過大數據來理解人類,而人也有保有隱私的權利。服務提供者除了需在每個環節,針對人、組織、裝置、通訊、應用等,提供全方位的資訊安全保障外,如何建構信賴關係(Trust),又是另一層次的大哉問。
防錯防呆機制 Algorithmic Accountability
機器也會出錯,AI 必須可以修正可預期或不可預期的演算法錯誤,而且要找得到人負責修正錯誤。
我們這一代,AI世化原生物種,一面思考著AI對人性及社會帶來的挑戰和衝擊,身為吃科技飯的我,還是樂觀地相信 – 人類跟AI在一起,只要互相了解,是會幸福的。
(原文參見Microsoft ”Democratizing AI” https://news.microsoft.com/features/democratizing-ai/#SZR3oeU4bTm92s8R.97 )