0
| 本文作者: 汪思穎 | 2018-06-13 18:10 |
雷鋒網 AI 研習社按,CVPR 2018 圖像壓縮挑戰賽(CLIC)結果已經出爐,騰訊音視頻實驗室和武漢大學陳震中教授聯合團隊于該項挑戰賽上取得壓縮性能第一。(騰訊音視頻實驗室憑借在 CLIC 中 PSNR 指標第一在雷鋒網學術頻道 AI 科技評論旗下數據庫項目「AI 影響因子」中增加 10 分。)
CVPR 是計算機視覺領域的盛宴,全世界相關領域的頂尖學者、研究人員和企業都會積極參與。今年,CVPR 新增了圖像壓縮 workshop 和挑戰賽議程,這場挑戰賽由 Google、Twitter、Amazon 等公司聯合贊助,是第一個由計算機視覺領域的會議發起的圖像壓縮挑戰賽,旨在將神經網絡、深度學習等一些新的方式引入到圖像壓縮領域。
圖像壓縮技術對于互聯網信息傳輸有至關重要的意義。一張未經壓縮的 1200 萬像素的圖片就會占用 36MB 的存儲空間,而目前網絡上每天圖片傳輸、存儲數量數以億萬計,為了節省帶寬資源、存儲資源,減少服務器的壓力,高效的圖像壓縮算法必不可少。
據大會官方介紹,此次挑戰賽分別從 PSNR 和主觀評價兩個方面去評估參賽團隊的表現。峰值信噪比(PSNR)衡量的是壓縮前后兩張圖逐像素統計所產生的誤差,峰值信噪比越高,代表兩張圖誤差越小,也就意味著壓縮后的圖與原圖越接近、圖片質量損失越小。
騰訊音視頻實驗室和武漢大學陳震中教授聯合團隊 iipTiramisu 在 PSNR(Peak Signal-to-Noise Ratio,峰值信噪比)指標上占據領先優勢,在決賽數據集上比第二名高了 0.13 dB,位列第一。
據陳震中教授介紹,iipTiramisu 團隊使用了基于傳統混合框架(hybrid image coder)融入深度學習的編碼模塊 CNNMC 以及 CNN in-loop filter,以及基于不確定性的資源分配策略,最終可以在數據集壓縮性能上比 BPG 提升 30% 以上。
從下圖可以看到,與業界最優秀的開源圖像壓縮算法之一 BPG 相比,iipTiramisu 在峰值信噪比上有顯著的優勢:

Fig.1 The Rate-PSNR curve of different encoders. (bit-rate range 0.05-0.35 bpp)
信噪比不變的情況下,在性能優先模式下 iipTiramisu 比 BPG 節省 30.8% 的碼率,速度優先模式下比 BPG 節省 27.9% 的碼率。
Fig.2 Compressed by BPG, bit rate:0.14 bpp, PNSR:31.45 dB.

Fig.3 Compressed by iipTiramisu, bit rate:0.14 bpp, PNSR:33.03 dB
在碼率都為 0.14 bpp 的情況下,iipTiramisu 的峰值信噪比比 BPG 高 1.58 dB,質量損失率明顯減少。
關于該比賽的更多信息,可參見如下地址:
http://www.compression.cc/challenge/
雷峰網版權文章,未經授權禁止轉載。詳情見轉載須知。