機器學習算法量化天文學領域性別歧視
導讀一項利用機器學習對性別歧視進行量化的研究發現,天文學領域的引用率對女性不利。據蘇黎世瑞士聯邦理工學院的研究人員估計,由于性別歧視,和男性相比,第一作者為女性的論文引用率要低10左右。引用模式上的性別
一項利用機器學習對性別歧視進行量化的研究發現,天文學領域的引用率對女性不利。據蘇黎世瑞士聯邦理工學院的研究人員估計,由于性別歧視,和男性相比,第一作者為女性的論文引用率要低10%左右。
引用模式上的性別差異此前在科學界有據可查。不過,研究人員之前并未試圖對有多少差異是性別歧視導致的結果進行量化。比如,男性和女性可能發表不同類型的論文;女性可能在不同的科學領域工作,并且擁有資歷較淺的職位。
這篇尚未接受同行評議但已在預印本服務器arXiv上發表的最新文章,試圖解釋并修正這些因素。文章作者拒絕就論文發表評論,因為他們希望將其提交給《自然—天文學》雜志發表。不過,其他專家表示,分析看上去很可靠。
“這篇文章的新穎之處在于,打破了認為引用上的性別差異可能歸因于論文的具體內容而非性別的神話。”美國印地安那大學伯明頓分校信息學家Cassidy Sugimoto表示。
研究人員分析了1950~2015年發表在5本期刊上的20萬篇論文。首先,他們訓練機器學習算法精確地計算出每篇第一作者為男性的論文的引用率。這個過程利用了盡可能多的和性別無關的因素,比如論文發表的期刊、領域和年份,第一作者所處的位置以及發表論文已有多少年。
隨后,他們讓算法分析第一作者為女性的論文。和第一作者為男性的論文相比,這部分文章(自1985年起)的實際引用率低6%左右。不過,該算法預測,這些論文本應再獲得4%的引用率。
研究人員表示,這是他們在“衡量性別歧視方面所做的最好努力”,但他們的結果應當被謹慎對待,因為該算法可能還需要將其他因素考慮進來。(徐徐)
免責聲明:本文章由會員“張悅華”發布如果文章侵權,請聯系我們處理,本站僅提供信息存儲空間服務如因作品內容、版權和其他問題請于本站聯系