0
| 本文作者: 李雨晨 | 2021-10-20 10:15 |

“Think big”是領創智信技術研發負責人王芳林在采訪中提及次數最多的詞匯,某種程度而言,它已經成為了這家公司基因的一部分。五年前,正是這組基因的內生動力驅使著這家初出茅廬的初創公司,將目光放得更長遠,率先瞄準了東南亞市場,并穩步擴張到南亞、非洲和拉丁美洲。
如今,領創智信已經先后在新加坡、中國、印度、印尼、越南、菲律賓設立辦公室,服務超過800家行業客戶,成為了新加坡獨立科技創業企業中最耀眼的明星之一。
對于王芳林來說,“think big”至少有兩個維度的涵義:
首先,在宏觀戰略層面要立足高遠。“比如我們設計一款產品,首先要思考它是否有機會拓展到全球。如果可以服務全球客戶,我們應該怎樣來制定戰略,團隊應該是什么樣的人員配比,跟合作伙伴要建立怎樣的合作機制。”
其次,在微觀技術實現層面,也要有全局思維。比如開發算法模型時,要先把橫向和縱向的相關因素都思考清楚,而不是只看到眼前的一畝三分地。
王芳林的全局思維和他的職業發展路徑不無關系。加入領創智信前,王芳林在新加坡本土的一家創業公司擔任CTO,是個純粹的技術派。2017開始,王芳林和領創智信的創始團隊接觸,但考慮到當時離開對原公司影響較大而作罷。而在經過一年多的觀察后,王芳林最終選擇了加入。

領創智信技術研發負責人 王芳林
入職之初,王芳林的角色是某條AI產品線的負責人。“有點類似一個小型CEO的角色,不僅要管產品和研發,有時候還要和商務團隊一起推動產品的商業化。”
后來隨著公司發展壯大,為集中力量辦大事,更好地服務客戶,資源整合逐漸被提上日程。組織架構調整后,王芳林重新回到研發崗位,但這段特殊的經歷卻給他打下了深刻的烙印,使他看待問題有了新的視角。“也許正是因為這近三年全棧式的職業經歷,我現在會主動地去做全局思維,和包括產品、運營、商務在內的兄弟團隊合作起來會更加容易和順暢。”
商場如戰場,作為一名久經沙場的老兵,王芳林自然懂得“兵無常勢,水無常形”的道理。市場瞬息萬變,不管戰略規劃做的多么細致周到,終歸是趕不上變化。所以他的“think big”其實還有后半句,那就是“act small”。
“作為創業公司,我覺得最重要的是不要怕犯錯。方向性的東西是比較容易想到的,但它適不適合你當前所處的市場環境,這是書本和方法論沒辦法解決的問題。所以你需要做的就是小步快跑、快速試錯,通過不斷總結和復盤來驗證策略并讓自己迅速成長。”
加入領創智信三年,王芳林看著公司一步步發展壯大。如今他帶領的技術研發部門已經擁有70多人的規模,雖算不上龐大,但也已經五臟俱全。
王芳林向雷鋒網介紹,他的部門包含四個團隊——工程團隊、數據標注團隊、AI團隊和數據科學團隊,各自有不同的分工。
數據標注團隊,顧名思義,其主要職責就是給數據加上標簽。
目前行業內的數據標注團隊主要有三種類型:一是AI公司自建的數據標注團隊,二是專業的數據標注平臺,三是承接數據標注服務的外包公司,三者各有優劣。
AI公司自建團隊的人員素質更好、效率更高,但數據標注需求并不固定,維持一支龐大的數據標注團隊性價比往往不高。
專業的數據標注平臺相比自建團隊擁有完善的產業鏈,具有盈利能力,能較好地平衡成本和質量。
此外,在國內三四線城市也存在一些承接數據標注服務的外包公司,由于勞動力成本較低,他們在價格上最具優勢,但在標注質量和效率上存在許多不足。
領創智信的數據標注團隊在建立時就希望能夠發揮東南亞的低成本、高素質的人力優勢,結合自身的AI經驗,除了服務公司內部AI團隊,也要具備承接外部項目的能力,結合三種不同類型數據標注團隊的優勢。
領創智信的數據標注團隊負責人張新田認為,隨著AI技術逐步發展和深入,數據標注勢必將從簡單類數據標注轉向專業性數據標注,對標注人員的專業知識提出更高要求,數據的標注模式也將由勞動密集型轉向AI輔助人力標注的新型模式。
因此,未來擁有專業數據標注能力的企業將展現出巨大優勢。目前,領創智信已經在AI輔助標注方面取得了初步成果。“根據我們統計,AI輔助人工標注的方法可以將我們的效率提升75%。”
有了更好的數據基礎和規模,才能為專注于AI算法模型的AI團隊和聚焦于信用評分模型的數據科學團隊提供更好的“養分”。
AI團隊負責人余江波介紹,在領創智信聚焦的東南亞市場,計算機視覺等技術有著非常廣闊的應用前景,尤其是在金融風控、反欺詐等領域。東南亞的金融體系發展起步較晚,各機構之間猶如信息孤島,缺乏關聯,很難實現統一化、集中式的征信管理。銀行賬戶和信用卡持有率偏低,以及官方身份驗證相關技術基礎設施缺失,導致在做風控和征信時缺少相關技術與數據。
因此,引入計算機視覺等人工智能技術以防范各種金融風險就成為當地相關行業用戶的迫切需求。
除了計算機視覺,信用評分模型也是金融機構應用AI技術頻率最高的領域之一。判斷一個信用評分模型好壞,穩定性是考量的重要維度之一。
數據科學團隊負責人王爭光介紹,領創智信的數據科學團隊會從兩個方面入手來保障模型的穩定性:一是覆蓋盡可能多的樣本,二是選擇具有持續穩定性的數據特征來建模。
信用評分模型中的很多數據特征都是跟時間強相關的,因此選擇具有持續穩定性的特征至關重要。特征的持續穩定性可以分成兩個維度來看:一是分布的穩定性,即該特征在一段比較長的時間內,走勢是比較穩定的;二是效果的穩定性,即一個特征現在是有效的,一年后依然有效。
通過這兩種方式,目前領創智信的信用評分保證了模型的穩定性,同時AUC也可以實現業界領先的效果。
數據標注團隊、AI團隊和數據科學團隊各具特色,不過單純從規模來看,人數最多的還是工程團隊,作為連接內外部的橋梁,工程團隊肩負著雙重使命。

一方面,領創智信有先進的算法和模型,但最終交付給客戶,還需要將其轉化成簡單易用的服務。工程團隊負責人張云樂介紹,領創智信的產品交付有兩種模式:
一種是云上部署的SaaS服務,用戶登錄賬號后就可以非常簡單方便地調用接口;另一種是私有化的本地部署,可以在安全合規的內網環境下快捷訪問API。
“無論哪一種交付模式,客戶都無需理解模型文件的內容,就可以輕松調用其背后的能力。”
另一方面,AI數據標注團隊、CV+NLP團隊和數據科學團隊內部也有很多可以協作的地方,工程團隊就承擔一個中臺、連通器的作用。“比如CV+NLP團隊的OCR、人臉識別等產品會產生很多結構化的數據,是數據科學團隊可以直接拿去用的。數據中臺的作用就是把我們對數據的所有需求統一起來,實現內部共享”。
各個團隊在開發和訓練模型時需要處理大量數據,最常見的需求之一就是從數據中提取特征。為幫助大家更加方便地提取和管理特征,提高開發效率,領創智信的工程團隊正在嘗試搭建一個特征平臺。基于特征平臺,開發團隊僅需要簡單編程就可以獲取到數據特征,實現低代碼的敏捷開發。
技術研發負責人王芳林介紹,目前領創智信的技術研發團隊仍在快速擴充當中,預計年底會增加到上百人的規模。
在一個快速成長的團隊中,如何迅速讓新成員融入進來,把大家擰成一股繩,對于管理者來說是個不小的挑戰。從結果來看,王芳林勝任得還不錯,團隊戰斗力十足,已經成了公司快速成長的重要引擎之一。
王芳林認為,企業管理可以劃分成兩個大的維度——戰略和組織能力。戰略決定了航行的方向和目標,而組織能力是這艘輪船能否有足夠動力快速駛向終點的關鍵。
他向雷鋒網表示,在大型企業里,管理者傾向于通過文化和規則來提升組織力,而在領創智信這樣的創業公司,有一個因素比文化和規則更加重要,那就是企業和個人成長的協同一致性。
“很多人可能覺得這個很難,或者沒有把它的優先級放得那么高,或者沒有決心去做,但其實這才是非常重要的組織成長的驅動力。思考整個團隊的發展方向,制定流程和組織架構時,這是我要考慮的核心要素之一。”
在技術研發團隊的支撐下,領創智信已經將業務觸角延伸到了多個領域,不過金融行業仍是其最主要的賽道。
王芳林表示,金融是AI技術應用最早的領域之一,信用評分和身份驗證等技術很早就在歐美落地了。近年來,隨著數字化程度不斷提升,基于結構化數據進行線上反欺詐的需求也日趨旺盛。
盡管金融行業是AI的“先行示范區”,可東南亞地區互聯網化程度較低的現狀還是給金融AI技術的普及帶來了一定的挑戰。在國內,金融機構非核心業務上云已經是非常普遍的事情,而在東南亞地區受限于監管,更多采用的仍然是傳統IDC的部署形式,不僅成本高昂,效率也有待提升。
同時,由于網絡基礎設施較差,領創智信在部署產品時也需要針對性地做很多優化。比如,針對圖像、視頻等多媒體信息,如何在最大限度減少對帶寬消耗的情況下,實現精準的識別和判定。這些經驗需要長期實踐和總結才能一步步沉淀。
王芳林介紹,盡管深度學習技術是當前人工智能領域最大的熱門,但在金融信用評分和反欺詐方面并沒有特別廣泛的應用。相反,傳統機器學習技術要更加常見。其中一個主要原因是因為金融是一個強監管的行業,要求算法模型具備可解釋性,而深度學習模型大多數情況下仍然是一個“黑盒子”。
同時,深度學習算法就像一個以數據為食的“巨獸”,需要大量數據的“飼喂”才能得到較好的運用效果。但金融行業受限于監管,企業能夠使用的數據仍然比較稀缺。
不過他也樂觀地表示,“深度學習算法在監管要求不高的領域仍大有可為,而且隨著數據的積累和技術的迭代,未來深度學習算法也一定可以被解釋得更加合理清晰,并在金融行業占有一席之地。”
AI團隊負責人江波介紹,為了解決數據標簽稀缺的問題,除了使用傳統的遷移學習技術外,領創智信也在積極探索數據合成、半監督/無監督、主動學習等當下熱門的人工智能前沿技術。
以圖像識別領域的遷移學習為例,目前網絡上有很多公開的圖像數據集。這些數據可以作為“第一手資料”,幫助數據積累薄弱的初創公司迅速完成模型訓練的“冷啟動”。
領創智信經過近4年服務大量客戶的實踐經驗,已經積累了不少數據,這些不同國家的數據通過遷移學習,可以幫助其在進入一個新市場時,迅速開發出適應新市場特性的模型和產品。
“就拿OCR來說,基于我們過去的數據積累,如果要開發一個新的證件識別產品,只需要1天。”
企業進入新的行業或市場時,除了面對數據稀缺的難題,也要經歷對算法設計泛化能力的考驗。
為了讓算法模型具有更好的泛化能力,領創智信在做算法開發時就會強調算法模型的可復用性,抽出一些通用的模塊。后續做進一步的產品開發時,只要將這些泛化的抽象模塊像搭樂高積木一樣搭起來,再針對不同客戶進行上層的定制化開發,就能取得較為理想的效果。
作為一家深耕東南亞的出海企業,相比技術上的挑戰,領創智信遭遇更多的還是業務上的難題。
和國內市場相比,海外市場的客戶更注重產品全生命周期的標準化和合規性。但東南亞地區國家數量眾多,不同國家之間的宗教、文化、政治、經濟和技術基礎設施差異顯著,這又導致他們對于產品標準化和合規性的需求是不完全相同的。
王芳林說到,“早期我在做AI產品線的時候,非常強調標準化。但后來逐漸發現不同國家的客戶在其特有的監管要求下,普遍擁有定制化的需求,這時候就不得不去做一些調整和改變。”
領創智信找到平衡點是,用標準化的方式做產品中間最通用、核心的部分,同時引入合作伙伴比如本地的系統集成商,客戶定制化需求交給合作伙伴,達到客戶、合作伙伴、自己的三贏。
某種程度而言,領創智信已經初步構建起了自己的生態,而“標準化產品+ISV定制開發”正是其生態的根本內核。再深一步說,這也是對于金融這個行業的認知和實踐不斷深入的過程。
在AI獨角獸們紛紛遭遇發展瓶頸的當下,領創智信能在短短五年內就在東南亞市場闖出一片天,絕不是用“幸運”兩個字就能輕松解釋的。
事實上,它已經在快速奔跑和大量的市場實踐中總結出了自己獨特的價值觀和方法論。王芳林將其歸功于公司的三個“Centric”文化——Customer Centric、Data Centric、People Centric。強調對客戶需求的滿足,以數據為中心,同時注重人才培養,尋求企業和員工成長的協同一致性。
王芳林表示,未來公司還將繼續圍繞這三大核心價值向前推進。至于下一個五年,他們能達到怎樣的新高度,時間會慢慢給出答案。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。