據報道,早前微軟從互聯網上刪除了MS Celeb數據庫,該數據庫包含了超過1000萬張、約10萬人的人臉圖像,主要被用於臉部識別。
為什麼要刪除MS Celeb數據庫?
MS Celeb是世界上最大的公開臉部識別數據庫,其中包含的人臉圖像基本都來自公眾人物。但據報道,數據庫中採集的很多圖像的主人並沒有授權這一行為,MS Celeb數據庫是透過「知識共享」(Creative Commons )許可證來搜索圖像的。
另外,雖然MS Celeb稱數據庫中照片均來自於名人,但是柏林研究員Adam Harvey認為這裡「名人的定義相當廣泛,該數據庫中還包含了很多記者、藝術家、音樂家、活動家、決策者、作家和學者的照片。當事人們表示並不知道自己的照片已經被收錄,其中作家Adam Greenfield表示:「我絕不是一個公眾人士,沒有辦法放棄自己的隱私權。」
由於數據庫所使用的照片,沒有徵得照片當事人的同意,所以微軟根據《知識共享許可協議》已將他們的面部數據信息從搜索引擎和視頻中刪除。微軟方面表示:「當初建立該網站的目的是為了學術需求。後來該網站交由不再與微軟合作的員工運營,而現在該網站已被移除。」
MS Celeb是什麼?
MS Celeb數據集是由全球100萬位名人的圖像組成的數據集,主要用於身份鑒定研究。MS Celeb的訓練數據集會從這100萬名人中,根據受歡迎程度挑選排名在前10萬的名人,然後利用公共搜索引擎為每個名人搜索大約100張圖片,最終產生1000萬張網絡圖像。
雖然MS-Celeb數據庫現在已經被微軟移除,但是在被移除之前,已經被廣泛應用於面部識別程序。據了解,目前有多個商業組織使用了 MS Celeb 數據庫,包括 IBM、松下電氣、阿里巴巴、輝達、日立、商湯科技、曠視科技等。
此次微軟移除 MS Celeb數據庫,並不意味著它再也不能被使用了。據了解,之前下載過MS Celeb的研究人員和公司仍可正常使用,而且用於處理數據庫的工具也可被正常訪問。柏林研究員Adam Harvey表示:「雖然msceleb.org網站關閉了,但該數據集仍然存在於GitHub上的存儲庫中,這是無數研究人員的硬碟,並且可能會繼續用於世界各地的研究項目。」
私隱安全?
事實上,關於隱私安全和臉部識別的討論早已有之,反對臉部識別的一方更注重隱私安全,他們認為隨著AI技術的發展,臉部識別的應用已經超過了實際用途,甚至變成了實時監控公民隱私的危險工具。2019年5月,美國舊金山立法機構通過了禁止官方使用臉部識別技術的新法令,舊金山成為了全球首個官方被禁止使用臉部識別技術的城市。
與其相反,中國卻是一個積極應用臉部識別技術的國家。
支持一方認為大家對臉部識別技術過度擔心了,我們應該監管臉部識別,而不是完全禁止。根據國際權威調研機構Gen Market Insights發布的《全球人臉識別設備市場研究報告2018》顯示:「2017 年,全球臉部識別設備市場價值為10.7億美元,到2025年底將達到71.7億美元,在2018年至2025年期間將以26.8%的速度增長。」
Source:VICE
Text by Fortune Insight