人工智能偏心?AI很單純,復雜的是人

“AI很單純,復雜的是人”——在探討人工智能的公正性時,香港科技大學教授兼微眾銀行首席AI官楊強,巧妙地使用了一句流行歌詞來形容。在他看來,AI技術發展中出現的諸多有關公平類的問題,實際上是映射了人類社會已經存在的歧視和偏見。
近日,在未來論壇發起的“AI向善的理論與實踐”論壇上,眾多行業專家圍繞“AI公平”這一主題展開了深入的討論。
AI和誰學會了“偏心”?
就像人類社會一樣,在AI世界中,偏見和不公正隨處可見。
在2014年,亞馬遜公司啟動了一項利用AI技術進行自動招聘的項目。這個項目用AI算法來對應聘者簡歷提供的信息進行評級。可是,第二年,亞馬遜就意識到這個機器腦瓜并非像想象中那么公平——它似乎在歧視女性!如果一份簡歷中出現了“women”這樣的字眼,那在評分上就打了折扣。
亞馬遜分析表示,這是因為他們使用了過去10年的歷史數據來對這個AI模型進行訓練,但是這些歷史數據本身就包含了對女性的偏見。此后,亞馬遜便不再使用這一算法進行招聘。
中科視拓(北京)聯合創始人山世光表示,AI的公平性問題,根本不在于技術本身,而在于人的內心,也就是說,AI公平性的根源在于社會的公平性。
他解釋道,AI技術從算法、系統的設計到走向社會應用實踐,這一過程涉及到方方面面的人,在許多環節中,都可能有意無意地引入歧視和偏見。就拿大家最熟悉的健康碼來說,這款產品在為防疫作出巨大貢獻的同時,也因為給老年人出行帶來不便等情況,引發了不少爭議。這就是由于目標人群設置不夠周全,而帶來了潛在的歧視風險。
除了不同人群使用AI遇到的公平問題外,AI公平還涉及開發者與使用者之間的不平等,通常是企業和用戶之間的不平等。
清華大學法學院院長申衛星補充了一個在生活中非常常見的案例。大量APP在使用時都會出現“知情同意”的選項,這種知情同意書往往有幾千字,多則上萬字,大量的信息讓消費者無法長時間閱讀,只好選擇同意,否則只能退出。
“過去我們對知情同意格式條款的主要要求是‘告知要充分’。 但現在更常見的問題反而是‘告知過量’,或者叫信息超載。”申衛星表示,“過分冗余格式條款,實際上正是剝奪了消費者的自我決定權。這是一種非常隱蔽的不公平。”
如何正確打開AI這把雙刃劍?
AI技術與社會公平的關系,比想象中更加復雜。
搜狗CEO王小川指出,總的來說,AI技術的高度發展有利于公平的提升。第一,在技術支撐下,教育、醫療等重大領域在資源供給的數量和質量方面將有很大的提高,供給端的繁榮有助于緩解社會資源分配不均;第二,隨著大數據的連接,人們有機會在全局層面上提煉主要矛盾,探討公平問題,進而達成社會共識。
但是它也是一把雙刃劍。王小川表示,互聯網、信息化和AI的發展為公平性提供了更好的抓手,但也將帶來更多新的挑戰。其中一個較為敏感的問題是,在機器的判斷越來越精確之后,公平定義的矛盾會更加突出。例如在金融貸款、商業保險等領域,如果對用戶進行個人畫像并作出判斷后,拒絕為該用戶提供服務,這是否公平?另外,隨著AI技術進步所帶來的資源極大繁榮,很容易產生“馬太效應”,導致資源向金字塔頂端集中,拉大社會差距。在人類歷史上,這個問題不斷出現,值得警惕。
對于這一點,山世光強調:“作為AI從業人員、開發者、運營者,我們必須意識到:我們所開發的AI既可能被用來促進社會公平和消除歧視,同時也可能被濫用,甚至助紂為虐。
因此,人類該如何揮動這把雙刃劍,使其向善而不作惡?山世光說:“問題的最終解決不僅取決于技術的進步,還有賴于技術專家和社會學家這兩個群體的順暢溝通,深入對話。”
為更加公平的AI而奮斗
論壇上,專家們介紹了產業界、學術界、法律界等在AI公平性上做出的種種努力。
華為公司AI治理首席專家段小琴說:“人們已經開發了許多工具,包括分析數據集形態和質量的工具,能讓開發者、工程師清楚地看到他們用于訓練的數據特征的分布,例如性別、年齡等,至少要滿足統計學意義上的合理分布,從而減少潛在的偏差;還有分析算法模型的工具,可以對模型的公平性進行評估,并作出相應的修正和優化;還有幫助開發者對決定模型輸出的關鍵數據特征進行探索的工具;以及公平性約束條件下的算法訓練工具等。
“AI公平性的一個重要方向就是數據的可獲得性和可使用性。”在這次論壇上,楊強強調了“聯邦學習”在抵制數據“馬太效應”、促進AI公平性方面的作用,“我們研究聯邦學習,一個更大的目標是實現‘數據可用不可見’,它的特點是:隱私保護、權益保障、缺陷保障以及確權,而確權和權益保證需要通過經濟學來完成。”
申衛星則指出,在這一問題上,企業和技術自律,要與以法律為代表的‘他律’結合起來,未來相關領域的立法應該是三駕馬車——技術、法律、倫理——并行不悖,技術是根本,法律是保障,倫理是社會基礎。
他進一步補充道,就AI技術立法問題而言,法律應解決形式上的公平、機會上的公平、程序上的公平,以及形式公平與實質公平的統一。個人建議,當時機成熟時,應該引入綜合立法。這一過程既要考慮到個人數據的保護,也要考慮到保護與創新之間如何平衡。