1
7月5日雷鋒網(wǎng)消息,國家會議中心,百度AI開發(fā)者大會,百度度秘總經(jīng)理景鯤現(xiàn)場講解百度DuerOS戰(zhàn)略,以及宣布百度全資收購KITT.AI的消息。據(jù)雷鋒網(wǎng)了解,此前KITT.AI拒絕了來自Facebook的收購。
景鯤表示,喚醒萬物的核心三要素是要做好聽清、聽懂、滿足。聽懂是人工智能時代用數(shù)據(jù)和技術(shù)解決的關(guān)鍵問題。景鯤稱,在這個時代,只有百度在中國市場是唯一具備聽清、聽懂、滿足的實力,打造一個開放賦能的生態(tài)系統(tǒng)。
“聽清”
百度的語音識別率做到了近場識別的準確率97%以上,但這些在AI時代還不夠。在AI時代,技術(shù)要與場景相結(jié)合。百度希望將語音放到真正的場景里面去解決問題,研發(fā)了麥克風陣列、回聲消除、語音喚醒、人像識別等技術(shù)。這些都是百度逐漸推進的世界先進技術(shù),將被放到各種場景中實現(xiàn)用戶聽清的需求。
“聽懂”
數(shù)據(jù)多、介入深是打造對話系統(tǒng)的必然條件,具備這兩點才能做好一個真正可以對話的“聽懂”系統(tǒng)。景鯤表示,百度是具備數(shù)據(jù)量最大的公司,擁有億級的多輪對話數(shù)據(jù)、十億級的知識圖譜數(shù)據(jù)。
“滿足”
聽懂并滿足“聽一首某某的歌”這樣的用戶需求還不夠,真正用戶想要的是更自然、更復雜的需求,比如“我要聽我手一杯品嘗你的美這首歌”,比如“想聽哥哥的歌”,只有把用戶在真實場景中表達的復雜請求做好,才能真正做出一個真正聽懂用戶需求的產(chǎn)品。
“‘聽懂’的目標,就是要FreeStyle,讓用戶最自然地跟設(shè)備進行交互,毫無拘束。”景鯤現(xiàn)場演示了利用DuerOS的多輪交互過程,這種交互只有百度的技術(shù)才能驅(qū)動。
現(xiàn)場,景鯤公布的另一個重大消息,是全球頂級AI創(chuàng)業(yè)公司KITT.AI正式加入百度。百度將把KITT.AI的語音能力和自然語言處理能力融入到百度平臺中,全面免費向百度的合作伙伴賦能開放。
據(jù)雷鋒網(wǎng)了解,KITT.AI專注語音喚醒和自然語音交互技術(shù),是世界上唯一一家獲得亞馬遜Alexa和微軟聯(lián)合創(chuàng)始人Paul Allen投資的公司,并入選了CB Insights人工智能創(chuàng)業(yè)一百強。
KITT.AI聯(lián)合創(chuàng)始人、CTO陳果果先生現(xiàn)在演示了如何使用KITT.AI語音喚醒技術(shù)快速打造一個語音喚醒設(shè)備。根據(jù)陳果果先生演示,進入Snowboy的喚起詞庫并新建喚起詞“你好景鯤”后,接著只需要說三遍“你好景鯤”,即可完成喚起詞的訓練。在測試環(huán)節(jié),設(shè)備只會對喚起詞“你好景鯤”進行響應。
最后,景鯤表示,DuerOS將為開發(fā)者提供最容易上手的軟硬件一體化解決方案,包括多樣化的開發(fā)套件和完全開放的參考設(shè)計:
1、搭載樹莓派,利用科勝訊技術(shù)的個人版。即刻申請就可以搭載一個個人可以對話的語音設(shè)備。
2、輕量版。把一元錢大小的芯片放在任何一個設(shè)備里面,設(shè)備就可以對話。
3、標準版。兩麥、四麥、六麥、八麥的標準版都可以即可申請。
4、完整一體化的參考設(shè)計。如開放電路板設(shè)計、開放結(jié)構(gòu)設(shè)計、開放麥克風陣列等等。
手機、電視、冰箱等任何設(shè)備,都可以搭載DuerOS,變成一個能“聽懂”的設(shè)備。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。