0
| 本文作者: 亞萌 | 2016-12-05 21:09 |
當人工智能領域大牛在西班牙NIPS會議酒店吃早餐的時候,Open AI 宣布開源了其新平臺“宇宙”(Universe)。這家由伊隆·馬斯克資助的非贏利性AI開源組織,在周一的上午搞了個大新聞,相信NIPS的餐桌上一定熱鬧非凡。當然,Open AI后續也在NIPS的會場展示了自己的成果。
Open AI 聯合創始人Greg Brockman 在Twitter上說道,“這個AI 訓練架構,是我們從Open AI建立之初就在計劃著的”。可見Open AI對這個平臺的重視。

那么這個敢以“宇宙”命名的 Universe是個什么東西呢?
OpenAI官網的介紹是:Universe軟件平臺,通過全世界的游戲、網頁和其它應用,來測量和訓練AI的普通智力。
在Universe上,AI智能體像人一樣使用電腦:觀看視頻,并操作鍵盤和鼠標(只不過是虛擬的)。總而言之:人類可以在網絡上做的事情,Universe都可以讓AI智能體經歷一遍,目的就是訓練智能體掌握類似于人類的“普通智力”。

如今的AI技術,已經使計算機能看、能聽和翻譯,還能產生圖像、聲音和文本,AlphaGo甚至擊敗了李世石。
但是如今的AI技術仍然逃脫不了“窄AI”的范疇,也就是說,它可以在某一個特定領域達到超強表現,但是一旦超過這個領域,就無法工作。AlphaGo能在圍棋上輕松贏過任何人,但是沒法去玩其他的棋類游戲。
而Universe平臺,就是為了打破“窄AI”的樊籬而誕生的。其核心架構由 Greg Brockman, Catherine Olsson和Alex Ray三人一起建構。
OpenAI創始人Ilya Sutskever在接受《連線》采訪時說道:“一個AI智能體就是應該能夠解決你扔給它的任何問題。”這聽起來有點過于大膽了,甚至有點“天方夜譚”。但Sutskever將Universe與ImageNet作類比,他認為ImageNet幫助計算機能夠像人一樣地“看見”,如今谷歌和Facebook的眾多app已經可以做到這一點了,而Universe要做的,就是將人工智能朝向每一個維度擴展。
早在今年4月,OpenAI 發布了一個名為Gym的工具包,用來開發和比較增強學習算法,包括了眾多訓練環境(Environments)。如今在Universe上,任何一個程序都可以轉變成一個Gym環境。
今天發布的Universe,可以在1000多個環境里運行,包括Flash 游戲、瀏覽器任務等。Universe 搞定了 Valve 和 Microsoft這樣的游戲巨頭,獲得了游戲授權。

(Universe平臺的部分合作方)
其實在游戲里訓練智能體不是新鮮事兒,因為游戲的內容是可控的,有清晰的獎懲機制,所以智能體在其中可以穩定地學習什么可以做,什么不可以做。比如加拿大阿爾伯塔大學提供了經典游戲Atari的學習環境,微軟則基于Minecraft游戲打造了Malmo系統。
可以說,從訓練智能體這一點來看,視頻游戲已經給真實世界帶來了積極的影響。
不過相比而言,Universe不僅可以在眾多游戲環境里,還能在瀏覽器任務等任何網絡環境里運行,其覆蓋面超過了以往任何同類系統。
DeepMind之前建立了一個可以在Atari游戲里訓練的智能體,并使用相似的技術來對谷歌全球數據中心網絡進行精細化訓練,以此來節省每年數百萬美金的成本支出。
Craig Quiter目前是Otto公司的工程師,這家自動駕駛卡車公司今年夏天被Uber收購。 在任職Otto之前,Quiter曾參與過Universe的開發工作,由于此前對該平臺早已熟悉,他對 Universe“省錢”的功能興致勃勃,正在打造一個可以玩“俠盜獵車手V”游戲的智能體。

目前Otto的自動駕駛系統可以在相對平穩的環境下運行,但是在未來幾年,該公司希望可以隨時對路上遭遇的惡劣狀況做出反應,而“俠盜獵車手V”里此起彼伏的驚險車況,對于Otto的自動駕駛系統是個很好的訓練素材。
Sutskever表示,在長期看來,Universe平臺以后甚至可以用于“遷移學習”:智能體把一個場景中學到的東西應用到另一個場景。他表示目前已經在著手建立一些智能體,將一個賽車游戲里學到的東西,應用在新的游戲里。
相關文章:
OPEN AI LAB,這個實驗室如何加速人工智能的“進化”? | 深度
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。