^{<sub id="jgr5k"></sub>}

OpenAI發布“宇宙”平臺，用1000+訓練環境賦予AI“類人智力”

本文作者：亞萌

2016-12-05 21:09

導語：Open AI 宣布開源了其新平臺“宇宙”（Universe）。這家由伊隆·馬斯克資助的非贏利性AI開源組織，在NIPS 2016開始之前就搞了個大新聞。

當人工智能領域大牛在西班牙NIPS會議酒店吃早餐的時候，Open AI 宣布開源了其新平臺“宇宙”（Universe）。這家由伊隆·馬斯克資助的非贏利性AI開源組織，在周一的上午搞了個大新聞，相信NIPS的餐桌上一定熱鬧非凡。當然，Open AI后續也在NIPS的會場展示了自己的成果。

Open AI 聯合創始人Greg Brockman 在Twitter上說道，“這個AI 訓練架構，是我們從Open AI建立之初就在計劃著的”。可見Open AI對這個平臺的重視。

OpenAI發布“宇宙”平臺，用1000+訓練環境賦予AI“類人智力”

那么這個敢以“宇宙”命名的 Universe是個什么東西呢？

掌握人類的“普通智力”

OpenAI官網的介紹是：Universe軟件平臺，通過全世界的游戲、網頁和其它應用，來測量和訓練AI的普通智力。

在Universe上，AI智能體像人一樣使用電腦：觀看視頻，并操作鍵盤和鼠標（只不過是虛擬的）。總而言之：人類可以在網絡上做的事情，Universe都可以讓AI智能體經歷一遍，目的就是訓練智能體掌握類似于人類的“普通智力”。

OpenAI發布“宇宙”平臺，用1000+訓練環境賦予AI“類人智力”

如今的AI技術，已經使計算機能看、能聽和翻譯，還能產生圖像、聲音和文本，AlphaGo甚至擊敗了李世石。

但是如今的AI技術仍然逃脫不了“窄AI”的范疇，也就是說，它可以在某一個特定領域達到超強表現，但是一旦超過這個領域，就無法工作。AlphaGo能在圍棋上輕松贏過任何人，但是沒法去玩其他的棋類游戲。

而Universe平臺，就是為了打破“窄AI”的樊籬而誕生的。其核心架構由 Greg Brockman, Catherine Olsson和Alex Ray三人一起建構。

OpenAI創始人Ilya Sutskever在接受《連線》采訪時說道：“一個AI智能體就是應該能夠解決你扔給它的任何問題。”這聽起來有點過于大膽了，甚至有點“天方夜譚”。但Sutskever將Universe與ImageNet作類比，他認為ImageNet幫助計算機能夠像人一樣地“看見”，如今谷歌和Facebook的眾多app已經可以做到這一點了，而Universe要做的，就是將人工智能朝向每一個維度擴展。

1000+訓練環境

早在今年4月，OpenAI 發布了一個名為Gym的工具包，用來開發和比較增強學習算法，包括了眾多訓練環境（Environments）。如今在Universe上，任何一個程序都可以轉變成一個Gym環境。

今天發布的Universe，可以在1000多個環境里運行，包括Flash 游戲、瀏覽器任務等。Universe 搞定了 Valve 和 Microsoft這樣的游戲巨頭，獲得了游戲授權。

OpenAI發布“宇宙”平臺，用1000+訓練環境賦予AI“類人智力”

（Universe平臺的部分合作方）

其實在游戲里訓練智能體不是新鮮事兒，因為游戲的內容是可控的，有清晰的獎懲機制，所以智能體在其中可以穩定地學習什么可以做，什么不可以做。比如加拿大阿爾伯塔大學提供了經典游戲Atari的學習環境，微軟則基于Minecraft游戲打造了Malmo系統。

可以說，從訓練智能體這一點來看，視頻游戲已經給真實世界帶來了積極的影響。

不過相比而言，Universe不僅可以在眾多游戲環境里，還能在瀏覽器任務等任何網絡環境里運行，其覆蓋面超過了以往任何同類系統。

意義：省錢

DeepMind之前建立了一個可以在Atari游戲里訓練的智能體，并使用相似的技術來對谷歌全球數據中心網絡進行精細化訓練，以此來節省每年數百萬美金的成本支出。

Craig Quiter目前是Otto公司的工程師，這家自動駕駛卡車公司今年夏天被Uber收購。在任職Otto之前，Quiter曾參與過Universe的開發工作，由于此前對該平臺早已熟悉，他對 Universe“省錢”的功能興致勃勃，正在打造一個可以玩“俠盜獵車手V”游戲的智能體。

OpenAI發布“宇宙”平臺，用1000+訓練環境賦予AI“類人智力”

目前Otto的自動駕駛系統可以在相對平穩的環境下運行，但是在未來幾年，該公司希望可以隨時對路上遭遇的惡劣狀況做出反應，而“俠盜獵車手V”里此起彼伏的驚險車況，對于Otto的自動駕駛系統是個很好的訓練素材。

Sutskever表示，在長期看來，Universe平臺以后甚至可以用于“遷移學習”：智能體把一個場景中學到的東西應用到另一個場景。他表示目前已經在著手建立一些智能體，將一個賽車游戲里學到的東西，應用在新的游戲里。

OPEN AI LAB，這個實驗室如何加速人工智能的“進化”？ | 深度

雷峰網原創文章，未經授權禁止轉載。詳情見轉載須知。

3人收藏

亞萌

編輯

關注人工智能（AI）報道

掃描關注作者微信

發私信

當月熱門文章