全球新聞業人工智能應用調查報告

機器會接管新聞業嗎?在倫敦政經學院的查理·貝克特教授看來,答案是否定的。
AI(人工智能)、機器學習和數據處理的實際應用狀況和其具備的潛力表明,它們將賦予新聞工作者全新的力量:發現、創造與連接。
未來我們可以期待的是,新聞工作者能夠通過算法進行“充電”,以更有效的新方式發揮人類擅長的技能。人工智能還會改變新聞編輯室,使其從單一性生產線轉變為網絡信息和參與中心,讓工作者推動新聞行業進入數據時代。
算法將為系統提供動力。但是,新聞中的人情味——來自新聞工作者的洞察和判斷——將彌足珍貴。新聞界能否抓住這個機遇?
互聯網、社交媒體和移動通信為新聞業提供了新的工具和途徑。現在,人工智能將帶來新一次技術飛躍。但它同時也會帶來經濟、倫理和編輯層面的威脅,而我們是否意識到其中的問題?在21世紀,依靠算法獲得增強的新聞工作者,以及使用人工智能的新聞機構,都在進入另一大過渡階段。新聞如何維持其公共價值?
為了了解新聞媒體對人工智能的看法,以及新聞界接下來的可能做法,倫敦政經學院的查理·貝克特教授率領團隊進行研究并發布了《全球新聞業人工智能應用調查報告》。
報告基于對來自32個不同國家的71個新聞機構在人工智能(AI)和相關技術方面的態度和使用情況的調查,邀請了許多正在使用AI的記者回答以下問題:對AI的理解、在新聞編輯室中如何使用AI、對AI新聞業潛力及風險的看法、對AI倫理的了解。除此以外,研究團隊在新聞業相關會議上還進行了采訪,與新聞業相關從業者溝通交流,以作為補充。其中大多數受訪者都是技術專家,是最早運用數字技術的人,所以他們比隨機抽取的記者樣本要更了解AI。此次報告選取了116名來自不同部門的記者,并展現他們對AI的觀點。
通過這份長達4萬字的報告,我們能夠理解全球范圍內的媒體機構是如何理解并運用AI的,以及如何從內容到組織對AI進行全流程的配套。
本文共包括七個部分:
1.報告核心摘要
2.人工智能在新聞編輯室中的定義
3.當今新聞業如何使用AI
4.AI策略的制定
5.編輯與道德倫理
6.人工智能和新聞的未來
7.結語:人工智能對新聞業意味著什么?
溫馨提示:由于報告篇幅較長,若有需求可直接滑至文中感興趣部分進行閱讀,以提高效率。
報告核心摘要
1. 人工智能(AI)是一系列包括機器學習、自動化和數據處理的技術,目前已成為新聞業的重要組成部分,但應用地域分布不均。
2. 它對未來的影響尚不確定,但人工智能對新聞的產生和消費具有廣泛而深遠影響。
3. 即使是對AI運用在行業領先的新聞編輯室,也認為AI只是作為新聞業的附加品和催化劑,而非具有變革性影響。
4. 本報告中描述的“力量”和“潛力”清楚地表明,所有新聞編輯室都應該警惕AI的作用。
5. 新聞編輯室將AI定義為與人類或技術相關的事物。
6. 未來應該對AI進行系統定義來幫助制定策略并促進對新聞編輯室中的AI的理解和溝通。
7. 不到一半的受訪者表示,他們使用AI進行新聞采訪,三分之二的人表示他們將其用于生產,一半以上的人表示他們使用AI進行分發。
8. 受訪者普遍希望提高效率騰出資源,以增強編輯室的功能,并提供新的或經改進的內容和服務。
9. 使用AI的三個主要動機是:使新聞工作者的工作更有效率(68%);向用戶提供更多相關內容(45%);提高業務效率(18%)。
10. 三分之一多一點的受訪者表示自己有一個積極的人工智能戰略。
11. 布局AI戰略的主要方法有四種:對現有部門的管理;設立獨立團隊從事AI項目;整合技術和編輯架構;實驗小組制——分散或整合。
12. 新聞編輯室大概可以分成兩類,一類是已經做好了運用AI的準備,另一類則剛剛開始或仍在計劃中。
13. 人們非常擔心自己的新聞編輯室落后。對于小型新聞編輯室來說,這是一個特別重要的問題,因為這會導致新聞編輯室之間的不平等日益加劇。
14. 人們發現新聞編輯室的崗位正在發生更多變化:現有工作增加而非替換。現有職位的人員將會有新的任務、工作流程,但很少有針對AI的新崗位。
15. 受訪者認為運用AI的最大挑戰是財政支出(27%)和知識技能(24%)。但是與這些一樣重要的是企業文化層面的抗拒(24%),這里面包括害怕AI會導致自己改變工作習慣,以及對新技術的普遍敵視。缺乏對AI的了解(19%)以及缺乏戰略管理洞察力(占17%)也是關鍵要素。他們認為AI的搭建和管理成本通常很高。
16. 從我們的調查中可以明顯看出,這些新聞編輯室普遍缺乏戰略規劃。人工智能戰略將始終根據新聞編輯室的性質以及他們所處的階段而變,但從這項研究中得出了以下需要考慮的關鍵要素:
評估AI現在的準備階段和狀態;
了解你正在考慮使用的人工智能技術并為其分類;
確定AI如何與您的品牌和總體策略相關,它能解決的問題,或它可以滿足的需求;
評估機構的哪些領域可能使用AI及其原因;
確定主要障礙:資源、技能、文化、管理等,并計劃如何系統地解決它們;
分配角色和職責并建立溝通整個組織的結構,包括所有利益相關者;
建立監測和審查績效的系統和優先事項;
建立與合作伙伴、客戶和廣泛的AI資源的外部聯系,以調查和整合人工智能創新;
17. 大多數受訪者表示他們對AI持有信心,但前提是新聞機構保留其道德準則和編輯立場。
18. 新聞編輯室確定了六個AI可能改變的領域:
經濟:AI可能會帶來效率的提升及成本的降低,可將節省出的資源用于提高新聞質量;
算法偏見:數據使用不當可能導致編輯錯誤,例如不準確或失真信息甚至歧視某些社會群體或觀點;
錯誤信息/過濾氣泡:人工智能將助長虛假信息泛濫。粗暴地使用個性化分發會導致偏見或沖突。但是管理良好的AI可以幫助應對錯誤信息并提高公共信息質量;
增強編輯決策和透明度:人工智能可以幫助糾正偏見并增加故事及受眾的多元化。它可以幫助提高新聞的透明度;
平衡人類和人工智能:AI新聞業保留了人類的價值,甚至增強了人類的判斷力和創造力;
科技公司的作用:有人擔憂科技公司的力量可能會成為競爭對手,并擔心技術會控制研究和產品開發。但他們還被視為創新、工具和系統的來源。科技公司有必要增加透明度、與新聞業的持續對話、支持。
19. 未來將出現三個層面的思考:
第一:短期內改善和迭代現有的產品和編輯團隊;
第二:中期2-5年內對新的應用程序進行創新;
第三:長期的創新和試驗可能會使用全新的方法或結構;
20. 當我們問到他們如何面對未來AI的挑戰時,回答最多的兩個答案與技術并沒有直接關系:在新聞編輯室進行培訓、教育和掃盲(44%);招募有新技能的人才(43%)。
21. 受訪者的未來AI工具愿望清單中最常提到的三個工具是:更方便的標記/信息提取(新聞收集);更好的機器生成內容(新聞制作);更好的個性化/推薦引擎(新聞發布)。
22. 受訪者最希望接受培訓和教育的六個方面是:
AI素養:在新聞機構中促進理解;
AI技能:基本技能,例如編碼和數據培訓;
更高級的AI技能:促進創新并作為全體員工職業發展的一部分;
對于管理人員:提高全體意識并了解AI系統和其他AI模型;
道德倫理:了解如何減少算法或數據偏差并提高準確性和可靠性;
對AI的總體了解:對AI及其對用戶和社會的影響具有更科學的了解。
23. 盡管存在競爭壓力,但人們仍希望提高標準和創新并提倡協作:
新聞機構內的各個部門;
新聞機構之間——既在故事層面也在技術發展層面;
國家內部或跨國合作;
與科技公司合作;
與初創企業和中介組織合作;
與大學/研究人員合作。
24. 人工智能將以漸進的方式重塑新聞業,但具有長期的結構性效應,反映出新聞媒體如何在技術、社會和商業的作用下發生變化。在一個更加網絡化的世界里,人工智能將在所有領域變得更加重要。
25. AI將使新聞媒體更加“不平等”和多樣化,并改變工作結構、新聞流以及與公眾的關系。
26. AI將為新平臺和工具提供動力,例如AR、無人機、語音、圖片和文字生成以及可穿戴設備。
27. 人工智能將為信息和公眾議題的探討提供動力,盡管通常并不通過新聞媒體發生作用。新聞編輯室必須適應新的編輯權威和信任的形式。
28. 新聞業可以從其他行業中學到很多東西,包括科技公司和初創公司、營銷公司和廣告主,以及法律、游戲、賭博和音樂行業:他們如何使用技術來改變工作流程、營銷習慣,他們與用戶的關系以及道德倫理。
人工智能在新聞編輯室中的定義
在我們了解受訪者對AI的評價之前,應當首先明確AI的含義。通用人工智能(AGI)在操作上尚不存在,仍然只是一個假設。
機器無法像《2001太空漫游》中Hal計算機那樣完全自主思考。“通用”或“強大”的AI距離今天還有數年之遙,或者可能根本無法實現。
如今在新聞和其他行業中使用的AI被定義為“窄”AI或“弱”AI,這種AI受編程限制較多。它們或許比人類更快或更有效,但實際上這只是“機器學習”(ML)或“自然語言處理”(NLP)。
許多被當作AI的技術流程通常都包含更多常規技術。這些是由人類創建或“訓練”的系統,它們響應能力強且適應性強,但通常只能執行非常簡單的自動化或數據處理任務。
對于此報告,我們借用了一個簡單的定義:人工智能是一個與計算機系統執行能力有關的思想和技術的集合,所執行的任務通常需要人類智慧才能完成。
我們將使用“AI”作為總括性術語,并始終認為它指的是相關技術的集合。AI由算法驅動,是“為解決特定問題或完成已定義的步驟而采取的一系列步驟”。這些可以都編程為機器學習或自動化,被當作“機器人”之類的工具。
關鍵因素是它們在一定程度上具有的自主性和適應性程度。極端情況下,“計算機可以決定一切,自主行動,無視人類”。低端一點,“計算機提供了一套完整的決策/行動方案”供人類參考。
人工智能的運作涉及三個領域,幾乎涵蓋了新聞生產的所有過程:新聞收集、制作和分發。我們首先詢問受訪者他們使用哪種“人工智能”的操作定義。這些定義反映了主題的復雜性和方法的多樣性。此外,這些定義部分反映了受訪者對于AI的理解,也反映了使用該技術的動機。
盡管有些人對AI有客觀或科學的定義,但大多數人還是將其定義與技術的用途和目的聯系在一起,他們始終認為AI是對新聞業現有的補充——“增強型新聞”。有時,該術語的使用方式十分特殊,例如,它被用來描述用于分析數據集(例如法院記錄)以進行調查的工具。此外,該術語還有更系統的使用方法,例如通過受眾數據為用戶提供持續的個性化內容。
新聞室定義AI的方式通常反映了AI在其組織中的作用。這些定義通常用于與同事、公眾或合作伙伴進行溝通。新聞界對AI的理解也需要考慮到這些利益相關者的觀點。
技術定義基于算法、自然語言處理、自動化和數據分析的思想。對于約三分之一的受訪者而言,“機器學習”是關鍵術語:
“從技術上講,AI是機器學習/神經網絡驅動的系統,但從新聞編輯室的層面而言,我將其更多地視為自動化系統,而不僅僅是一個非常簡單的工具。”
考慮到技術快速發展的特性,受訪者意識到他們的定義不可能就是最終定義。當我們詢問受訪者更具體的想法時,部分人表示需要將其定義與“人工智能”一詞的炒作區分開:
“通常而言我們根本不使用這個術語。我們對AI的定義更狹窄,例如“機器學習”,或者當我們談論某個特定領域時,我們使用的術語是NLP(自然語言處理)或深度學習。‘AI’對我們來說只是個時髦的詞。”
更多的人對AI在技術層面上的定義強調了AI的工作方式。例如,通過在管理大量數據中創建模式識別,或使用預測和分類的原理來定義AI。
與人類或任務相關的定義方法將AI視為執行、復制或模仿與人類的認知能力或“人類智能”相關的任務的能力。一般而言,他們不僅與新聞記者有關,而且與受眾有關。人們幾乎總是將AI定義為增強或擴展人類能力的工具:
“AI可以利用計算能力來解決基于數據的問題,并進行人力無法實現的分析——通過學習/自我完善或通過處理和分析大量數據。”
我們的受訪者都是在新聞編輯室中工作或與新聞編輯室合作,而不是進行純粹的研究。因此,幾乎所有人對AI的定義都具有功能性這一點也就不足為奇了。尼克·迪亞科普洛斯曾提到關于混合AI新聞的想法:“我們將AI視為可以獲取、理解信息并得出結論,然后從其決策中學習的技術。”
四分之一的受訪者表示,他們的組織沒有對AI的正式定義,或者正在進行討論:
“我們沒有一個對AI的正式定義。我們正在討論這件事呢。”
英國廣播公司(BBC)是個有趣的例外。也許由于其規模和操作的多樣性,它對AI下了多個定義:
“英國廣播公司(BBC)對人工智能沒有一個特定的定義。本來不同的人會對AI從不同的角度有不同的定義,并且通常用于指代前沿先進技術。但在BBC里人們所說的“人工智能”一詞指的是一些常見的事物:(1)基于任何形式的機器學習技術(尤其是神經網絡);(2)表示智能代理(例如語音代理,聊天機器人);(3)使以前需要人們完成的任務自動化進行的技術(例如,使用NLG (自然語言生成)撰寫文章,自動翻譯或轉錄等)。“人工智能”產品常常同時屬于這三類。”
這個定義很重要,因為它反映了新聞編輯部可能會如何考慮其AI策略。對AI定義是為了有助于思考它與其他技術的不同之處。它反映了組織中AI素養水平以及與同事、與外界進行交流的能力。新聞編輯室采用任何新技術的核心壓力之一是技術專家與其他部門之間的文化沖突。新聞機構如何定義AI可能有助于解決該問題。
隨著技術的進步,新聞編輯室將擁有越來越多具有執行系統和自治功能的AI。了解什么是人工智能對于實現其潛力以及所涉及的機遇和風險至關重要。但是,新聞編輯室具有多樣性,人工智能也是如此。技術及其用途不斷發展,因此其定義也會改變。定義的靈活性反映了該技術及其應用的復雜現實。
第1章:當今的新聞業如何使用AI
01
新聞編輯室使用AI做什么及其原因
我們問新聞編輯室他們在使用什么AI,為什么使用它以及有什么成效。答復大致分為三個方面:
新聞收集:信息的來源,故事創意的產生,確定趨勢,調查,跟蹤事件,提取信息或內容。
新聞制作:內容生成,編輯,用于不同形式和平臺的包裝,文本、圖像和視頻生成,為不同受眾重新提供內容。
新聞分發:個性化分發,營銷,尋找受眾,了解用戶行為,訂閱。
不到一半的受訪者表示他們使用AI進行新聞收集,三分之二用于生產,一半以上用于分發。但是,在當代的“網絡化” 或“混合” 新聞業的背景下,投入與產出是一個高度相關的過程。
人工智能和新聞學的關鍵聯系之一是,人工智能可以使整個新聞業變得更加完整,并在生產和傳播過程的不同部分之間形成反饋循環。例如,AI可以將用戶評論的審核視為收集、生成或編輯該內容,以及增加受眾參與度的一種方式。這是一個幾乎所有新聞編輯室都會進行的操作:
“推薦相關文章、機器人新聞(例如體育賽事報道)、個性化新聞源、預測性分析可優化新聞策劃、語音轉文字服務可提高編輯人員的工作效率、流失預測和訂閱傾向預測、標簽/實體識別、糾錯檢查。”
我們通常可以將新聞編輯室使用的AI更具體地描述為機器學習、自動化和數據處理等形式。“ AI”標簽下的某些流程可能存在不同程度的限制,不可避免地會有一些灰色地帶。新聞業繼續經歷著徹底的改革和創新過程,但我們并不是很清楚某種技術將在何處產生影響。
支撐所有AI流程的是數據:有關受眾的數據,例如受眾行為;有關報道主題的數據,例如官方文獻;有關新聞的數據,例如情感和語言。無論使用哪種分類,我們都可以明顯看出人工智能的使用正在滲透新聞業。這使得識別和評估人工智能的作用變得更加困難,但同時也反映了該技術的適應性及其與新聞業的緊密結合。
受訪者對AI如何改善工作這個問題提出了“競爭力”、“效率”和“節省時間”幾個答案。但是主要回答還是“AI能夠更好地將創作的內容與受眾有效地聯系起來,從而使受眾更加忠誠,能夠為新聞業付出更多的精力或金錢”。還有一些回答包括處理錯誤信息和事實核查。總體而言人們普遍希望使用AI來節省成本以強化新聞編輯室的功能以及提供新的內容和服務。受訪者還認為使用AI需要跟上技術和市場變化的步伐。總的來說,人們感覺到AI正在發揮重要作用。
02
新聞收集
與AI相關的新聞收集是數據驅動生產的一部分。人工智能可以幫助收集資料,也可以幫助評估用戶的興趣所在:
“相對于我們的產品,我們將更多的精力放在支持我們編輯團隊的決策上,而不用重新建立決策流程。我們關注的一個主要方面是信息的分析處理:我們每天都會攝取大量視頻內容。我們希望AI幫助記者處理大量信息,以確定哪些信息與受眾相關。”
AI可以幫助你篩選來自官方的內容,也可以篩選來自公共和社交媒體的內容,例如自動過濾UGC(用戶生產內容)。人工智能程序可以按不同目的對信息或材料進行大規模分類。
為了使AI正常工作,材料就必須轉換成數據,這意味著標記數據或“元數據”的過程至關重要。人工智能可以在某種程度上實現自動化。雖然這實施起來很困難,但是卻為其他一切奠定了基礎:
“我們為CMS(內容管理系統)內置了文章自動標記器(該標記器使用主題/關鍵字標記文章,以前這是由編輯完成的)。”
人工智能可以幫助新聞編輯室做內容決策:
“我們有一個內部工具,結合了數據分析和語言生成系統,可以編寫全部或部分故事,并提醒記者注意數據中存在的機會。”
借助機器學習算法,發現新的新聞也成為可能,該算法可幫助新聞工作者發現可能被遺漏的趨勢和事實:
“我們需要建立一個新聞檔案庫,去收集墨西哥盡可能多的出版物,這樣我們就可以跟蹤全國的每日報道。在墨西哥各地收集的大量本地和國家新聞報道的Google News就非常合適。這項工作要求我們確定正式記錄的兇殺案數量與Google新聞上這些殺人事件的新聞報道數量的差別。這要求機器學習算法能夠識別一個報道的故事,然后查明事件發生的地點。有了這些信息,我們就能將媒體報道的事件與墨西哥2400多個城市的兇殺案政府報道聯系起來。”