運用資料分析協助性平歧視字詞偵測與負面情緒判斷

:::

運用資料分析協助性平歧視字詞偵測與負面情緒判斷

最後更新日期 : 2023-01-03

SDG指標: SDGs05,SDGs04

《撰稿》葉國暉

近年來，以性別偏見作為主要研究的主題正在逐年增長，也意味著性別平等的意識漸漸地受到重視，首先，李傲[1]論及與性別有關的歧視稱為性別歧視，指基於人的生理性別或社會性別而產生的歧視與偏見。Glick等人[7]於2000年進行了一系列的跨國研究，指出性別刻板印象是具有跨國際的普同性。然而在兩性化中，對於不同的性別還是存在著不同的刻板印象（如典型的男主外女主內），而性別刻板印象常會造成某個性別在社會中發展的阻礙，在生活或職場中也會受到對於性別的歧視。現今社會追求的不再只是兩性的平等，而是更偏向於多元性別的平等。多元性別也稱為性別多元化，不只是單單的異性戀，其中還涵蓋了女同性戀、男同性戀、跨性別和變性人[2]，近年來多元性別開始逐漸受到大家的關注[3－4]，但是被社會的接受度還是很低，陳禹函[5]發現多元性別在職場會比兩性化性別受到更多的歧視與不公平的對待。

在臺灣有一起較為受到大家關注且關於多元性別議題的校園事件為葉永鋕事件，他因與眾不同的性別氣質而遭到部分同學霸凌，最後在某一天下課前去廁所後沒返回教室，被發現在廁所時已倒臥在血泊中，經搶救後隔天宣告不治。該事情會受到大家的關注是因為他的死因在各方證詞與未經證實的猜測下有不同版本，最終認定此事肇因於學校未重視他的性別特質，也沒有在校內推廣多元性別教育知識有關，所以經過這件事情教育部將兩性平等教育委員會更名為性別平等教育委員會，教育政策從兩性教育延伸轉化成為多元性別教育，此一分水嶺也代表著教育部開始重視校園性別問題[6]。

從上述的文獻中可以看出不管是在職場或是校園中其實性別歧視都是存在的，甚至可能嚴重的充斥在我們所沒看到的生活中，所以我們希望透過利用現有的資訊技術來改善校園中的性別歧視與偏見，讓校園的性別平等意識提升。此外，在面對校園中發生性別平等事件的時候，性別平等委員會便扮演著重要的角色，調查委員的背景與人生觀點會導致案件的處理方式和結果出現不同，然而在性平調查委員的短缺，且各調查委員的經歷背景皆不同的情況下，常常無法在每個事件中都給出一個令大家都滿意的結果。再者，性別教育平等法於2004公布後，學校開始落實性別平等教育，但在賴立淇[4]的實驗中提到約有96%的研究對象至少經歷過一次以上不同形式的性別歧視，從此研究中可以發現儘管落實性別平等教育，目前學生的性平意識與法規知識仍有所不足，加上社會上對性態度逐漸開放，使得部份行為人無從知悉對自身行為的嚴重性，雖然有些人認為只是開個玩笑，但是對於行為人或是被行為人所帶來的傷害可能是一輩子無法抹滅的創傷與回憶。

數位科技的進步帶來了無所不在的網路社群環境，大大地延伸了人與人之間的互動，許多訊息在未經驗證下不脛而走，而人們的性別偏見所帶來的影響也跟在社群網路中逐漸被放大，如何抑制在網路社群中的性別偏見與負面情緒擴散逐漸為人們所重視。本次專欄文章主要在介紹如何運用資料分析協助性平歧視字詞偵測與負面情緒判斷，主要為透過一套自動化程序針對繁體中文文本進行語意情緒分析，且偵測該文本是否違反性別平等準則，並在使用者情緒較高昂或是違反性平時，給予提醒與警示，提升性平意識。

圖一是為所提出的性平歧視字詞偵測與負面情緒判斷系統架構圖，主要透過LINE聊天機器人作為系統入口端點，從輸入繁體中文文本到聊天機器人給出回應會經過兩個架構，分別是BERT架構（判別文本情緒類別）和性平糾察隊（負面情緒分析與性平違反偵測）。其中BERT 架構所採用的是BERT－base－Chinese模型，利用BERT判別所輸入文本的情緒類別，當輸入的繁體中文文本進入BERT架構後會先利用WordPieces將中文文本切成字，然後對每個字做詞嵌入，並透過已經訓練過的BERT模型對文本進行情緒類別的分析，去預測輸入的文本在各個情緒類別中的機率，並透過抓取機率值最大的類別做為文本的情緒並輸出。當預測出文本的情緒後，性平糾察隊會去抓取預測的文本情緒類別後進行負面情緒的分析與性平違反的偵測。在負面情緒的分析中第一步進行文本情緒類別的判斷，將抓取到的情緒依照不同等級分類到不同類別，如快樂（happy）/正面（positive）、難過（sad）/弱負面（slightly negative）、生氣（angry）/負面（negative）、諷刺（irony）/負面（negative）與侮辱（insult）/強負面（strongly negative）等。第二步則進行文本負面情緒的分數計算，每個類別的分數都不相同，出現正面（positive）扣1分，弱負面（slightly negative）加0.3，這兩個類別的情緒不進行加權。而負面（negative）加0.8分、強負面（strongly negative）加1分，兩者權重皆為0.2，權重要連續判斷為同個情緒才會進行疊加（例如：連續出現兩次負面（negative）時第一次加0.8分而第二次會加1分以此類推）。當負面情緒值累積超過門檻值5分會跳出通知提醒使用者注意其情緒，並回應目前的情緒值和目前的負面情緒類別。性平違反偵測則是將輸入的文本和性平案例詞庫去做字詞的比對，如果有比對到詞庫中的字詞就會判定違反性平，該偵測並不受到情緒類別及情緒累積分數的影響，會立即跳出通知「性平違反」警示，提醒使用者之行為已經違反性平準則。此外，系統中所使用的性平案例詞庫皆是從已發生之性平個案中和法院判決書中的性平歧視字眼彙整而成。

圖二為法院判決書上所抓取的文本內容，該行為者懷疑和前任交往期間，A女介入了他們的感情而心生不滿，因此在社群媒體上公開發文侮罵A女，並加油添醋了一些不實的內容，而圖三則是透過本系統來判定該文本的性別歧視與情緒判斷，經系統分析，該文本被判定為違反性平且是帶有生氣意味的一篇文章，而法院判決書的結果則是以妨礙名譽結案。

經由上述實驗分析與結果，可確立本系統之有效性與正確性，亦即確定該系統能有效判斷文本之情緒類別與是否違反性平準則，並在使用者情緒較高昂或是違反性平時，給予提醒與警示，以提升其性平意識。載舟之水，亦可覆舟，數位科技的進步帶來了社群網路，提供人與人之間的豐富互動，卻也擴大傳遞了網路社群中的性別偏見與負面情緒，本次專欄文章所介紹之資訊系統期為預防並抑制網路社群中的性別偏見與負面情緒之擴散與影響，希望透過資訊技術提升無所不在社群網路環境下的性別平等意識與友善度。

參考文獻

[1]李傲（2007），性别歧视的界定，河北法学，25（1），68－72。

[2]多元性別，〈https://zh.wikipedia.org/w/index.php?title=%E5%A4%9A%E5%85%83%E6%80%25%20A7%E5%88%A5&oldid=69550957〉（存取時間2022/12/29）

[3]張曉佩、李宜蓉（2018），多元性別議題諮商能力：訓練方案對知識，覺察與技能影響之研究，中華輔導與諮商學報，（52），51－80。

[4]賴立淇（2019），大專院校場域學生性別歧視知覺、性別角色與心理健康之相關研究，國立清華大學碩士論文。

[5]陳禹函（2010），藏鏡人的心內話－同性戀公務人員的職場處境，政治大學公共行政研究所學位論文。

[6]葉永鋕事件， 〈https://zh.wikipedia.org/w/index.php?title=%E8%91%89%E6%B0%B8%E9%8B%95%E4%BA%8B%E4%BB%B6&oldid=71484579〉 （存取時間2022/12/29）

[7]Glick, P., Fiske, S. T., Mladinic, A., Saiz, J. L., Abrams, D., Masser, B., & López, W. L.（2000）, Beyond prejudice as simple antipathy： hostile and benevolent sexism across cultures, Journal of personality and social psychology, 79（5）, 763.

《English Version》

瀏覽數:

《東華永續暨學術文化專欄》

運用資料分析協助性平歧視字詞偵測與負面情緒判斷

《English Version》