Skip to content

演算法的歧視:誰被消失了?

Twitter的演算法近來頻繁引起話題,使用者主動出擊,測試社群軟體的演算法機制。面對質疑,Twitter內部團隊屢次公開回應,並且承諾修正。八月中,Twitter公佈首屆「演算法賞金比賽」結果,首獎頒給瑞士洛桑理工學院(EPFL)的研究生波哥東.庫里尼奇(Bogdan Kulynych)。他的研究指出,自動影像裁切帶有偏見,傾向選取年輕、瘦長、淺膚色的面孔。

2018年起,Twitter啟用了基於顯著性(saliency)原理的演算法,專門用來辨識圖片中最重要或最具吸引力的部分,以此為使用者自動製作預覽圖。在電腦科學裡,這項技術通常被稱作顯著性偵測(saliency detection)。為了證實演算法的疏失,庫里尼奇採取「生成對抗網路」(GAN)的機器學習框架。首先製造大量電腦生成的人臉,並在較新的模型「StyleGAN」的幫助下,使這些臉長得幾乎一模一樣,只有在膚色、大小、性別特徵與年紀上具有細微差異,再將這些圖片輸入Twitter演算法中。

波哥東.庫里尼奇(Bogdan Kulynych)以電腦製造的面容證實Twitter的演算法歧視

一如庫里尼奇的作法,學界裡,以一個演算法挑戰另一個演算法的策略正在持續發展。EPFL在新一期的學術刊物裡,即聚焦在各種演算法如何合力打造奠基於巨量數據的數位現實。其中,亦有科學寫作者提醒,機器學習技術固然可以用來處理問題,但是這種情況宛如用火救火,或許使眾人陷入一場無止盡的遊戲裡,找不到真正的解方。

在賞金比賽之前,對Twitter自動影像裁切的不滿已經出現。2020年9月,博士生柯林.麥德蘭(Colin Madland)在Zoom會議中,發現臉部偵測竟然抹掉了黑人同事的臉,讓背景白牆取而代之。他的貼文引起熱議,隨後,不少使用者上傳各自的實驗結果,如果照片上同時有黑人與白人,Twitter選擇白人作為預覽,此外,乃至於辛普森家族的角色、不同毛色的狗,Twitter的預覽圖也都捨棄帶有較深顏色或膚色的對象。

https://twitter.com/_jsimonovski/status/1307542747197239296?ref_src=twsrc%5Etfw%7Ctwcamp%5Etweetembed%7Ctwterm%5E1307542747197239296%7Ctwgr%5E%7Ctwcon%5Es1_&ref_url=https://www.theguardian.com/technology/2020/sep/21/twitter-apologises-for-racist-image-cropping-algorithm

柯林.麥德蘭(Colin Madland)發現在Zoom會議與Twitter預覽圖中,皆有演算法的膚色歧視。此外,也有人嘗試在Twitter貼文時將《辛普森家庭》的Lenny與Carl放在同一張圖裡,發現Twitter演算法會優先選擇淺膚色的Lenny作為預覽圖

對此爭議,Twitter曾公開道歉,並且聲稱,在推出預覽功能之前,他們並沒有發現演算法的偏見。今年五月,Twitter的人工智慧學習倫理部門總監盧蔓.喬德哈瑞(Rumman Chowdhury)發表部分研究成果,其中,在黑人與白人的圖片選擇上,顯著性演算法確實表現出差異。此外,為了測試演算法是否帶有男性凝視,他們也觀察圖片裁切系統選擇特定女性部位的機率,根據結果,就性別而言,演算法並沒有透露偏見。

發表內部研究的同時,Twitter宣佈停用影像自動裁切功能,藉此減低對於人工智慧的依賴,強調應由使用者自行掌握呈現影像的方式。Twitter與使用者之間的交流,也催生了這場針對演算法偏見的賞金比賽。此外,喬德哈瑞認為,機器學習倫理不是單一公司能夠應付的,公眾有能力指出許多盲點,前提是,科技公司得保持資訊透明。然而,作為一個較新的領域,負責式機器學習(responsible machine learning)發展上不乏難處,許多人都在做無償研究。喬德哈瑞表示,Twitter的賞金比賽,已經從零往前跨出一步,嘗試改善演算法可能產生的不公與傷害。


文 | 閻望雲
| Bogdan Kulynych
發佈日期 | 2021年9月13日