摘要:「魔鏡魔鏡告訴我,誰是世界上最美的女人?」這句伴隨童年的話也有現實版哦~神經網絡可以預測人臉顏值,這方面也出現了不少研究。 今年年初華南理工大學的研究者發布論文,並公開了數據集
SCUT-FBP5500
「魔鏡魔鏡告訴我,誰是世界上最美的女人?」這句伴隨童年的話也有現實版哦~神經網絡可以預測人臉顏值,這方面也出現了不少研究。 今年年初華南理工大學的研究者發布論文,並公開了數據集
SCUT-FBP5500。 本文作者 Dima Shulga「復現」了該論文,並用自己的照片做了試驗。
數月前,華南理工大學發布了關於「顏值預測」的論文和數據集,數據集包括 5500 人,每人按顏值魅力打分,分值在 1 到 5 分之間。
數據集中還有很多名人。 Julia Robert 的這張照片得到了 3.78 的平均分:
以色列名模 Bar Refaeli 這張照片得分 3.7:
似乎分也不高 嘛 ,但是 3.7 的得分意味著比數據集中大約 80% 的人要好看。
數據集作者利用該數據集訓練多個模型,嘗試根據人臉照片預測這個人的魅力。
結果
該論文使用 2 種技術訓練模型:5-fold 交叉驗證、60%-40% 的訓練集-測試集分割。 論文作者使用皮爾遜相關係數(PC)、平均絕對誤差(MAE)和均方根差(RMSE)對結果進行衡量。 5-fold 交叉驗證的結果如下:
我將使用 80%-20% 的訓練集-測試集分割,類似執行他們的交叉驗證的 1-fold。 結果如下:
RMSE: 0.301799791952313MAE: 0.2333630505619627PC: 0.9012570266136678
相當不錯。 此外,查看分數散點圖和直方圖很方便:
原始分數分佈(正態):
預測分數分佈(正態):
結果看起來不錯。 現在我們來看下這個深度神經網絡給我打幾分吧。 我一開始用了這張照片:
得分 2.85,我只比該數據集中 52% 的人好看……不得不說有點失望,我原本以為結果比這好,於是我決定再試試。
我拍了很多照片,最終有一張得了 3.15 分,這意味著我比該數據集中 64% 的人更好看~
好多了~老實講我還是想得更高分~ 🙂
最後說明一下,我使用 Google Colaboratory 構建和調整模型,它提供 Python notebook,可以免費使用 GPU!
論文:SCUT-FBP5500: A Diverse Benchmark Dataset for Multi-Paradigm Facial Beauty Prediction
論文鏈接:https://arxiv.org/abs/1801.06345
摘要: 顏值預測(facial
beauty
prediction,FBP)是使人臉魅力評估達到人類感知程度的重要視覺識別問題。 為了解決該問題,不同的數據驅動模型,尤其是當前最優的深度學習技術被引入,基準數據集成為實現
FBP 的必要因素。 之前的研究將顏值識別作為一個特定的分類、回歸或排序的監督學習問題,表明 FBP
本質上是一個具備多個範式的計算問題。 但是,大部分 FBP
基準數據集是在特定的計算約束下構建的,這限制了在該數據集上訓練的模型的性能和靈活性。 本論文中,我們認為 FBP
是一個多範式的計算問題,並提出一種新的多元化基準數據集 SCUT-FBP5500,來實現多範式顏值預測。 該數據集共有 5500
個人臉正面照片,這些照片具備不同屬性(男性/女性,年齡等)和不同標籤(面部地標、顏值得分(1~5)、顏值得分分佈),允許具備不同 FBP
範式的不同計算模型,如基於外表/身材的亞洲人/高加索人的男性/女性的顏值的分類/回歸模型。 我們使用不同的特徵和預測器組合、不同的深度學習方法評估
SCUT-FBP5500 數據集,結果表明在該數據集上 FBP 有所改進,且具備潛在應用。
版權聲明
本文僅代表作者觀點,不代表百度立場。
本文係作者授權百度百家發表,未經許可,不得轉載。