0
| 本文作者: 陳伊莉 | 2017-07-24 23:11 | 專題:GAIR 2017 |
“智能+其實是個甜蜜又辛酸的過程。最后產生價值自然很甜蜜,但結果的過程常經歷一系列復雜的磨合與調整,需要業務和技術多方的協同合作,其中業務人員的理解和支持至關重要?!?/p>
當雷鋒網問到,擁有金融全牌照,業務產品線繁多的平安集團在打通全體系數據的背后,是否隱藏什么故事時,平安科技首席科學家肖京由衷感慨道。

平安集團是業界較早布局新金融的傳統金融機構,目前也已經擁有不少代表作。最廣為人知的是陸金所、平安好醫生、平安金管家、一賬通等 2C 產品。此外,作為平安集團探索金融科技道路上的一步重棋,平安科技人臉識別準確率突破99.8%的消息也刷足了今年各大平臺新聞。平安金融云也是平安力推產品之一,據了解,平安70%核心系統群以及數十家中小銀行已經上云。
為了更深入挖掘平安集團的Fintech實踐經驗,在由中國計算機學會主辦,雷鋒網與香港中文大學(深圳)承辦的第二屆CCF-GAIR全球人工智能與機器人峰會的第二天,肖京作為金融科技專場的嘉賓分享了平安的“智能+”過去、現在和未來發展之路。作為平安科技的首席科學家,肖京在平安內部主要負責大數據和人工智能技術研發及在平安金融和醫療健康相關業務中的應用產品和服務,管理智能引擎部、技術研究院、后臺大數據平臺及前端客戶關系管理CRM等多個核心部門。
“智能+”脫胎于“互聯網+”概念,平安將此視為業務升級最關鍵的發展方向。相較于重在模式創新的“互聯網+”,平安認為“智能+”實質是技術創新,需要由數據、行業專家、場景、技術(算法和計算能力)四因素協同合作來實現。
毫無疑問,數據是一切的基石。2013年大數據概念興起,平安開始做數據集中。前后花費了近一年時間,才打通了集團內部的數據孤島,整合到一個平臺上,并配置了自動更新及質量控制機制。
搭建數據平臺只是起點,如何利用這些數據實現業務智能化才是最終的目標。肖京告訴雷鋒網,他在2015年加入平安科技,并統領大數據部,制定的第一個計劃就是平安腦智能引擎規劃,幫助核心業務做智能分析與決策。
平安腦智能引擎可分為四層。
第一層是感知層,主要是進行數據的接入、采集和整合。
第二層是索引層,刻畫畫像臉譜如用戶畫像、產品畫像、渠道畫像,分別做好模型。
第三層是中樞層,聚集了商務智能、預測推薦、異常監控、深度智能等算法能力。
第四層是執行層,是平各相關核心業務的解決方案和應用場景實現層,主要有八個核心板塊,分別為風險控制、欺詐識別、運營優化、精準營銷、智能監控、商務智能、智能金融、智能客服。
在演講中,肖京還強調了第三層算法能力實現的三部曲,指出不能簡單應用深度學習這樣的復雜算法。
第一階段是需要建立全面的確定性專家系統和規則引擎。業務流程中的許多環節深度依賴規則、經驗和知識,這些規則往往不能從歷史數據中獲取。
第二階段是商務智能階段,例如用戶分群和關聯分析。對用戶分群可以進行不同的營銷和風控策略,通過關聯分析發現銷售線索或者風控因子,很長時間以來在大量場景中產生了良好的效果。然而商務智能一般是對單一目標關聯因素的統計分析,往往難以深入挖掘多目標多因素復雜的關聯關系,尤其是對弱相關因子的挖掘和利用,而在大數據時代有顯著的長尾現象,需要盡可能挖掘大量的弱相關因子,才可能充分利用大數據的價值。因此我們需要進入第三階段。
第三階段是人工智能階段,利用機器學習及深度學習等人工智能技術,深度挖掘并充分利用大數據的價值,實現更精準分析。
當前興起的這波人工智能技術是歷史上的第三次復興。這一次主要依托基于大數據的機器學習,屬于人工智能中的聯結主義范疇。這些技術分別在對結構化數據和非結構化數據的分析挖掘方面產生了良好的效果,但也存在一些不足。例如表現在,對因果關系考慮不足,過于依賴數據的相關性,這往往導致可解釋性不足。另外,相關方法常針對的是大數據場景,欠缺快速吸收業務規則和知識的機制。而在金融和醫療的業務場景中,決策時常常要求知道因果關系,也常常面臨需要小數據學習的場景,并且需要能快速應對規則的改變。基于此,平安在這三個方面都做了相應的改進。
在肖京演講結束后,雷鋒網對他進行了一次專訪。以下是采訪實錄,雷鋒網作了不改變原意的編輯:
雷鋒網:平安集團內部的數據服務部門機制是怎樣的?垂直業務線與數據部門如何配合工作?
肖京:平安集團有三地五個數據中心,這是基礎架構服務。此外,平安科技針對每個垂直業務線設立了相應的IT服務部門,包括數據服務部門。這些部門和業務公司的相關業務部門協同合作,共同解決相應的業務數據分析需求。
雷鋒網:曾采訪過的一位互金企業CEO表示,他們不會特意研究前沿技術,因為高風險與高收益并存。風險有二,一是新技術的研發投入非常大,二是商用表現還是未知數。而平安不同,涉足了各個新興技術領域,請問內部是怎么看待新技術的研究工作?或者說,平安在研究新技術時的追求是什么?
肖京:我認為前沿科技并不一定意味著高風險。平安會讓專業的人做專業的事,首先做好目標分析規劃才會大規模投入。如果定性目的不清楚,目標、可行性無法確定,我們不會盲目地大規模投入,所以不會有太高的風險,這就像是研究院做了一個項目的小嘗試。
如果目標、可行性都有所依據,在平安大體量系統中嘗試一下,可以快速看到趨勢性業務效果。例如說定價風控模型,若有很強的執行力和足夠大的體量,那么就能像互聯網一樣快速迭代,驗證效果的好壞并進行調整改進。這也是平安綜合金融大平臺相比其他單一小平臺或者單純技術公司的優勢之一。
另一方面,集團本身就非常重視科技,投入力度很大,也很愿意創新嘗試。董事長馬明哲一貫強調科技引領金融,平安未來5-10年更大的收入和成來自于技術,而不是資本。
雷鋒網:作為傳統金融機構旗下的技術公司,跟其他科技公司相比各有什么優劣勢?
肖京:在人工智能基礎技術研發方面,學校和研究機構是主力軍。產業界的競爭優勢體現在應用方面,演講中我提過“智能+”的四要素——數據、行業專家、場景、技術。平安的優勢也體現在這幾點。
首先是數據優勢。平安是一家全牌照金融機構,擁有絕大多數科技公司無法比擬的數據優勢,包括廣度和深度??萍脊靖嗟厥欠治鲇脩舻臄底趾圹E來猜測哪些服務有效,平安能更快速洞察用戶需求并提供合適的產品和服務。
第二是專家優勢。我們經過29年的發展,在金融和醫療領域有大量的行業專家。AlphaGo之所以比其他采用相似深度學習技術的機器人圍棋水平更高,一個重要原因在于其核心研發團隊不僅是技術專家,也是圍棋高手。
第三是場景優勢。平安的金融和醫療應用場景非常豐富,而大多數科技公司并不具備豐富的應用場景,要想驗證技術效果,需要與業務公司磋商。從說服他們合作到最后的應用,需要經歷很復雜的磨合過程,在得到甜蜜成果之前,這個過程會充滿辛酸,絕不是一件容易的事情。實際上沒有豐富的類似磨合經歷的技術團隊,最后的落地能力是要打個巨大問號的。
在技術層面,平安的綜合性優勢比較明顯,經過多年的建設,平安擁有上萬技術人才,搭建了強大的金融等級的基礎架構及云平臺,包括深度學習集群的集團大數據管理及分析平臺。
當然,金融和醫療是兩塊非常大的蛋糕,有極其眾多的技術應用的機會。科技公司深耕某一垂直領域,技術可能會更加深入。
雷鋒網:平安會以什么形式與Fintech公司合作呢?
肖京:主要是技術合作方式,一般不涉及業務合作。我們已經跟MIT等多個頂級科研機構合作很多年了。此外,還包括承接平安的研發項目,或者直接合作應用對方已經成熟的某項技術等等。速度高效是我們決策的最重要因素之一,我們等不起,時不我待??傊畬τ诩夹g合作我們是很開放的。
雷鋒網:相較于傳統金融機構旗下的科技公司,平安有什么差異性?
肖京:在金融科技方面,大部分金融機構戰略戰術上可能偏保守,缺乏足夠的創新投入,對自身隊伍能力的培養也常常比較欠缺,因而不得不依賴技術外包,購買別人的解決方案,但是外包會存在一些很大的問題,技術始終沒有掌握在自己手中,恐受制于人,若是與小公司合作,穩定性也不太能保障。其實這也沒關系,尤其是中小金融機構,像平安這樣自建能力可能太困難了,但提高業務能力是必要的,只是要選對合作方。
雷鋒網:目前的AI都是專用人工智能,您覺得與通用AI相比較而言,誰更有應用價值?
肖京:人工智能可以分為弱人工智能、強人工智能和超人工智能。目前人工智能處在弱人工智能階段,這意味著它只是某些方面比人強,而有些方面還差得很遠,它的能力是有限定領域的,而通用AI起碼要到強人工智能這個階段才會出現,現在還沒有出現通用AI。
通用人工智能是個有意思的研究方向,但在大多數實際業務中未必能帶來附加的應用價值。個人認為這應該留給科研機構來研究攻關,企業應該更專注于研發智能技術解決實際的業務痛點。即便要做也應該作為遠期目標來規劃,否則就有不切實際之虞。
現階段人工智能技術要應用好,定義清楚目標場景和問題是很重要的。問題定得太大太通用,常常得不到很好的效果。目標清晰有的放矢,應用獲得成功后,再考慮如何標準化并拓展應用。
雷鋒網:那么,怎樣將專用的AI技術快速復制到其他領域?
肖京::既然是討論業務應用,而不是純技術研究,我們一般認為,研發任何一項AI應用,首先要有明確的目的和目標,進行可行性分析,通過后再進行具體的規劃和實施。
AI技術應用復制到其他領域,也應該采用類似的方式方法。先確定新領域相應的業務應用的目的、目標、可行性,再借鑒前期應用的工程經驗,將前期成功的技術應用標準化并調整做出新領域應用的規劃和實施方案。
雷鋒網:有一種觀點是,在金融行業,往往是5%的關鍵小數據發揮著作用。那么95%的弱相關數據怎樣才能發揮作用?
肖京:5%關鍵小數據是強相關的,95%是弱相關數據。只看強相關的5%,是典型的商務智能的說法,還處于之前提到的智能化第二階段,主要通過關聯分析來挖掘數據價值。
而現在的AI技術不僅可以利用強相關數據,也能對弱相關數據進行深度的分析挖掘。弱相關數據也是有價值的,若方法使用得當,也能發揮作用提高模型效果。比如深度神經網絡這樣的端到端機器學習模型,不需要通過特征工程定義顯性因子,可以充分結合所有數據深入分析挖掘自動找到最佳組合,以得到最優的業務應用效果。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。