1
| 本文作者: 金紅 | 2016-09-19 18:51 |

“有著圓臉、胖身子、 兩個尖尖的耳朵,還有一條長尾巴的東西,就是貓。”——計算機識別貓的邏輯
關于計算機讀懂照片,相信很多人對于李飛飛在一年前的TED演講記憶猶新,演講中展示的一張關于貓的照片,對于人類來說很容易分辨,即使是三歲的小孩兒也只需一眼就能做出定義,而對于計算機來說,卻需要經過無數次的學習才能完成。
這是因為,在三歲的小孩兒的眼中,世界已經不是簡簡單單的物體集合,而是一個個具體的個體,他們已經對這個世界形成了自己的理解。而計算機,則沒有。想要計算機也能快速對圖片做出理解,最好的方式是讓它模擬人腦的學習方式。李飛飛一手創建的ImageNet,便是為計算機喂下的學習養分。利用互聯網,ImageNet提供了一個龐大的圖片數據庫,讓計算機系統能夠在1500萬張照片里認識22000種物品。機器學習也因此有了突飛猛進的進展。
從全球范圍內來看,目前機器學習常用“在線學習”(online learning),即按照順序、循序的學習,不斷的去修正模型,進行優化。已有多家公司嘗到“在線學習”的甜頭,在視覺、聲音、大數據等領域人工智能均有突破。
與此同時,研究人員也未停止對“片上學習”(On-Chip Learning)研究,因為只要實現這一技術,就能直接在硬件上完成學習與測試,進而讓基礎算法的研發迭代,產品的升級有著更短的周期和更高的效率,并且消耗更少的能源。不過“片上學習”在嚴苛的硬件環境中研究進展緩慢,并沒有一個成型的應用于實際問題的演示,一直停留在理論研究階段。現階段,在硬件中部署機器算法更多還是“在線學習”,即用大規模高性能計算平臺進行模型訓練,然后將訓練好的模型再直接部署在硬件中。谷歌的AlphaGo就是“在線學習”的典型,在今年與李世石比賽時,AlphaGo的服務器在美國中西部,通過谷歌云服務連接到韓國首爾的對局室,谷歌總部團隊必須確保AlphaGo與谷歌的服務器連接順利。
日前,中國類腦強人工智能初創公司西井科技在2016PSPE上海國際科普產品博覽會上正式宣布,該團隊在全球范圍內首次實現“片上學習”。這意味著機器學習能在硬件端直接完成,通過硬件層面的不斷“自我學習”和“自我提高”,實現高效率、低功耗。今年5月,該團隊曾宣布研發出一種完全跳脫于馮諾依曼結構的神經形態的芯片結構——即模擬人腦神經元工作原理而制造出的芯片,它既具備人腦的學習能力,又具備強大的特定運算能力,僅需一塊郵票大小的芯片,就能模仿人類大腦在短時間內處理海量的感官信息。
在發布會上,西井科技正式對外演示了其WIKI系統“片上學習”過程,包括識別隨機生成的數字以及對油畫進行畫風畫派的分類。結果顯示,機器能在短短 1 秒內自動完成數百張圖片的分類,正確率接近100%。

油畫畫風分類完成

油畫畫派分類完成
為了讓參會者更容易理解“片上學習”,西井科技用學生的學習方式來做類比,“打個比方來說,‘片上學習’就好像學生身邊時刻跟隨著一位‘私教’,直接在芯片上邊學習邊測試訓練成果,最大的優勢是真正實現‘無網絡’情況下的‘自我學習、自我實時提高’。而‘在線學習’則好比學生定期去‘學校’上課,回家后做作業來測試學習效果,再將優化過的模型灌輸在硬件中,每一次新的學習都需通過網絡、云端等手段重新進行傳輸、遷移。”

片上學習訓練中(紅線代表CHIP)
西井科技表示,期間,芯片可隨時中斷學習,以測試學習效果。結果發現,隨著芯片學習進度的推進,油畫識別與分類的正確率將逐步上升,直至經過8至10秒的一段完整學習后,識別的正確率接近100%。
同時,因為“片上學習”可以實現本地化學習,從而幫助機器大幅度提升效率,提高運算速度。在網絡環境相對嚴苛或有限的情況下,“片上學習”的芯片消耗的帶寬和流量更少,大幅降低云端服務器的通訊成本,且耗時更少。畢竟“在線學習”需要更高質量的網絡環境,在數據傳輸時會造成延遲。
西井科技此次實現的“片上學習”將在多個領域得到突破性的應用,比如提升大數據挖掘、視頻流處理的質量與效率、節省基因測序的時間以及幫助機器人外形更為靈巧,依靠“自身智力”去不斷學習提高能力等。
發布會上,西井科技同時宣布已開發出基于神經形態工程的類腦智能軟硬件一體化智慧港口系統——WellOcean,并已在全球排名前十的一家港口碼頭上線試運營。通過模擬人腦神經“高效低能”的工作機制,從而使系統能夠像人腦一樣飛速識別集裝箱號碼。有別于傳統OCR識別,WellOcean最明顯的優勢就在于速度和準確率,能自動捕獲進、出港口的任一尺寸集裝箱,識別速度不到0.1秒,比OCR技術快了50倍。

WellOcean夜間雙箱快速準確識別
發布會結束后,很多參會者與雷鋒網都非常關心一個問題,此次展示的數據相對于ImageNet上千萬的圖片庫相比實在毫無比對度,那么所謂100%的準確度的含金量有多大。對此,西井科技的工作人員表示,數據不是問題,未來會在實際應用中不斷地積累,而其芯片在實現“片上學習”后通過不斷學習,準確率也自然會不斷提高。因此,或許未來計算機不僅能輕易識別出一只貓,還能識別出這是什么種類的貓。

西井科技展示其Deep South類腦神經元芯片
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。