5
繼百度深度學習研究院、騰訊優圖以及Face++之后,小米最新的人臉檢測算法日前也在業界最權威的FDDB數據集上拿下了第一的成績。
根據小米聯合創始人黃江吉公開的信息,小米此次研發的新算法基于深度卷積檢測網絡(Faster RCNN Bootstrapped by Hard Negative Mining),即利用深度卷積檢測網絡,同時學習人臉和非人臉特征,從而準確識別出人臉的位置和大小。

雷鋒網第一時間聯系了參與這一項目的小米聯合創始人黃江吉,他表示小米人臉檢測改良了現有的方法,尤其是針對比較模糊的人臉有明顯的優化,不過具體細節還要等到相關論文公布才能知曉。
當然,在此之前我們需要了解的是,人臉測試可分為人臉識別、人臉檢測、人臉表情、人臉年齡、人臉性別等等,這其中人臉識別和人臉檢測是最主流的兩個方向。
人臉識別的目的就是找出圖片中的人臉,然后識別人臉是誰,目前,全球人臉識別的數據集最多,如WebFace、MegaFace以及LFW(Labeled Faces in the Wild)等。LFW是人臉識別研究領域比較有名的人臉圖像集,LFW庫共有5749個人的13233幅圖像,其中1680人有兩幅及以上的圖像,4069人只有一幅圖像。
例如,Facebook Deepface、香港中文大學湯曉鷗教授的DeepID以及Face++都在LFW上進行了相應的測試。
事實上,相比人臉識別,人臉檢測的任務要稍微簡單一些,它只關注前者的第一步,就是給出一張照片,找出有人臉的區域(橢圓型或矩陣)就達到目的了。
FDDB(Face Detection Data Set and Benchmark)是最具權威的人臉檢測評測平臺。FDDB和LFW一樣,都是馬薩諸塞大學的人臉數據庫,它包含2845張圖片,共有5171個人臉作為測試集。測試集范圍包括:不同姿勢、不同分辨率、旋轉和遮擋等圖片,同時包括灰度圖和彩色圖,標準的人臉標注區域為橢圓形。小米人臉檢測的測試就是在FDDB進行的。

“檢測和識別都是基于特征提取,檢測相當于一張圖上有足夠多的選框(例如:20X20 的選框,各個像素點逐一篩選。)可先識別出人臉的位置,然后做選框,再根據選框內部的像素點逐一篩選。”宇泛智能CEO趙弘毅如是說。
通俗點講,在圖片上任意給出一個框,判斷框是不是人臉,然后選框逐漸移動去判斷是不是人臉。這個過程在學術領域稱為“滑窗”,是特征提取的一個過程。所以,在一張圖片中至少需要對幾萬個框做分別提取特征,從而來識別人臉。
FDDB的數據集,有人臉的位置都會用橢圓形框好。要求自動算法標識出來的區域和真實有人臉的區域,重疊部分(交集)對比并集超過一個閾值(例如50%),就算識別準確了。
雷鋒咨詢了幾位業內人士,一起看看他們是如何評價小米人臉檢測算法的。
深圖智服創始人吳鵬程:
FDDB數據集有兩個組,一個是有公開方法的,另一個是沒有公開方法的。小米這次特別厚道的把方法公開了,因此大家都可以去重現。
從結果看,他們在公開方法的組里,performance特別好,基本上和不公開方法的組里最好的很接近。
另外,小米這次也是改進了faster RCNN來做人臉檢測,faster RCNN原本是孫劍(Face++首席科學家)提出來用來做對象檢測的,國內不少用其來做人臉檢測,包括我們自己,效果確實不錯。
涂圖科技CMO王楠:
技術指標只是一方面,還要看如何落地,因為難點都在商業化。
小米作為大公司有豐富的資源,BAT都在涉足這一領域,人臉識別還是最簡單的一部分。
閱面科技創始人趙京雷:
模糊的圖片會影響檢測和識別的準確率,可以通過算法和數據等方式進行優化。小米所用的模糊人臉優化應該是刷了不少數據,FDDB刷數據大家都能做到,但實際應用如何又是另一回事了。
圖普科技創始人李明強:
從這個評測結果來看,小米的人臉檢測確實做得還不錯,不過這個榜單中大家的水平都差不多,而且在LFW、FDDB甚至是ImageNet庫中都存在統計誤差。
宇泛智能CEO趙弘毅:
單一的刷榜單意義不大,國內有些企業就在FDDB這些數據集惡意刷榜單,但要注意的是人臉檢測不僅要求精度還要速度。
另外還有業內人士告訴雷鋒網,小米這一表現確實很優秀,但也不能說明什么問題。FDDB的庫只有2000多張圖片,而Wider庫比它的照片數量多兩三個數量級,而且單張圖片多的有將近一百個人臉,雖然FDDB是主流的數據集,但沒有挑戰性。
從幾位業界專家的觀點可以得出結論,小米在跑分上擊敗其它企業和機構已經證實了其人臉檢測算法的能力,但是回到應用層,跑分的意義就大打折扣了。小米官方已經確認這一技術將很快運用到MIUI面孔相冊中,所以具體表現如何,我們將持續關注。
推薦閱讀:
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。