聚焦個人隱私與版權保護,警惕深度偽造濫用,探究“AI治理AI”新模式,堅持人本主義,是生成式人工智能風險治理的關鍵。
人工智能的創新應用形塑社會互動模式。在信息傳播、醫療、交通、教育等場景中,人工智能成為社會互動的代理,促使人與人的互動越來越多地轉換成人機互動。智能技術重構新聞傳播的業態和生態,深度嵌入信息獲取和決策過程,影響公眾的社會闡釋框架。
作為社會的信息傳遞基座,新聞傳播業在接受人工智能技術賦能的同時,也成為人工智能風險生成、擴散和演變的關鍵場域。自2022年以來,人工智能的內容生成和交互水平取得突破性進展。人工智能聊天機器人程序ChatGPT、人工智能圖片生成平臺Midjourney和文生視頻大模型Sora等生成式人工智能出現,掀起內容生產和信息消費熱潮。生成式人工智能的數據訓練、程序設計和生成結果應用等環節,也可能產生“被制造的風險”(manufactured risks),[1]涉及人機關系、深度偽造、產業變革等多個維度。
一、新聞傳播業對人工智能的創新采納
人類歷史從根本上是人與物、物與物糾纏的歷史。[2]人與技術物的關系大致有具身關系、詮釋關系、它異關系和背景關系四種,[3]技術物是身體認知的放大器,也是人類觀察、理解和操縱世界的中介,可以作為它者或準它者與人類共存,也可以融為生活環境的一部分,潛移默化地發生作用。作為一類技術物的人工智能與人類展開長期的互動實踐,新聞生產和傳播實踐就是其中之一。從數據處理到信息分發再到內容生成,人工智能成為新聞傳播業的創新驅動力和生產力。
(一)人工智能的發展:“類人”化與“類物”化
無論是將人工智能視作“工具”還是“潛在的合作伙伴”,公眾對它的存在已習以為常。人工智能發展和應用是基于不可見的基礎設施支撐體系,包含計算、存儲、網絡硬件等硬件基礎設施體系和多樣化的機器學習框架、算法以及相關工具軟件、PaaS平臺、服務等軟性基礎設施體系。近年來,人工智能的研發致力提升人工智能與人類社會的適配性,沿著“類人”和“類物”兩個方向使人工智能融入社會的過程“自然化”。[4]所謂的“類人”,是指不斷豐富人工智能算法模型的情感和心理維度,如通過分析文字詞頻、音頻文本中的聲調語速、圖像文本中的面部表情特征等推測情感類型。所謂的“類物”是將易于交互的人工智能物嵌入人類熟悉的場景,如家庭生活場景中的育兒機器人、養老護理機器人和智能音箱等。
(二)智能化信息生產:人工智能成為生產主體
人工智能在不同場景中“類人”和“類物”的應用發展,也包括對傳統信息生產流程的重構。繼專業生產內容(PGC)和用戶生產內容(UGC)后,人工智能生成內容(AI-Generated Content, AIGC)成為一種新型內容。作為一個復合型概念,人工智能生成內容“既是從內容生產者視角進行分類的一類內容,又是一種內容生產方式,還是用于內容自動化生成的一類技術集合”[5]。而生成式人工智能(Generative Artificial Intelligence, GAI)是指通過復雜的算法和模型對大規模數據進行集中學習,具有“文本、圖片、音頻、視頻等內容生成能力的模型及相關技術”[6],是“根據人類制定的規則訓練而成的有立場、一定程度上受控的智能內容生成工具”[7]。在狹義上,人工智能生成內容是生成式人工智能參與生產的結果,但生成式人工智能更聚焦于技術、模型和工具。
生成式人工智能可以完成多模態文本轉換,還能模仿人類的不同情緒口吻來輸出內容。目前,按照任務類型劃分,傳媒機構生成式人工智能的應用形態有寫作機器人、數智記者和AI主播等。人工智能在災害事件(地震和暴雨等)、天氣預報、財經、體育等垂直領域的報道方面,具有明顯的時效性優勢。包含生成式人工智能在內的人工智能,將記者從轉錄、翻譯、校對等流程性工作中解放出來。傳媒機構希望利用智能工具提升生產力,放大人類記者在新聞深度和事實核查等方面的獨特優勢,發展解釋性報道和建設性新聞,進而鞏固行業邊界。
(三)智能化信息分發:從個性化走向定制化
人工智能應用于平臺型媒體,以場景化、個性化的智能算法分發滿足用戶需求。通過收集用戶的個人信息數據和使用數據,智能算法分析總結出不同的用戶畫像,根據歷史偏好、相似群體偏好以及社交關系進行推薦。同時,平臺算法會根據用戶的點擊量、閱讀時長、完播率、個性化設置等不斷調整內容推薦模式。
生成式人工智能實現跨平臺內容聚合和分析,還能根據用戶需求提煉總結出核心關鍵信息,產出定制化內容。因此,生成式人工智能有望發展成為“下一代網絡入口”,[8]也將再次改變內容分發邏輯。
(四)智能化內容呈現:從“認知新聞”到“體驗新聞”
人工智能豐富新聞呈現形式,推動“認知新聞”向“體驗新聞”轉變。面對新聞回避和新聞疲勞的雙重挑戰,新聞業轉型的重要策略是進一步增加音視頻形態的新聞數量,[9]以滿足用戶需求。新聞的數據可視化、碎片化、視頻化等趨勢,豐富了新聞閱讀體驗。2023年,安徽寒潮來襲時,大皖新聞的數智記者“小朱姐”迅速上鏡播報,省略拍攝場地準備、妝造彩排等步驟,保障了新聞的時效性。川觀新聞的數字記者矩陣包含20個真人記者的數字分身,可以充分發揮多線程播報的優勢,提升內容生產效率。
近期發布的Sora類文生視頻模型,引發使用生成式人工智能進行時空模擬和時空再造的豐富想象。Sora雖然在新聞現場采集、新聞調查和信源核實等方面有缺陷,但能夠幫助記者還原一些“難以重回的現場”或制作便于理解和傳播的解釋性影像,提升新聞覆蓋率和受眾參與度。
未來,生成式人工智能和AR/VR等技術結合,將會以逼真的感官體驗和自由設定,讓用戶沉浸式體驗各類新聞場景。此外,生成式人工智能還能對新聞內容作出調整,以滿足不同用戶群體的閱讀習慣偏好。新聞閱讀程序“Artifact”,可以用不同的風格總結用戶感興趣的文章內容,將其改寫成Z世代喜愛的風格或一系列便于在社交媒體傳播的表情符號。智能社會與圖像社會疊加,使世界更加趨于圖像化、影像化。用戶的認知模式也隨之轉變,從借助全面、客觀、深度的信息進行“認知”轉向習慣于通過影像和主觀情感聯想進行“體驗”。
(五)智能化內容治理:用AI治理AI
虛假信息的生產傳播是人類社會存在的長期問題之一。事實核查主體和技術變遷主要經歷了三個階段:傳統的新聞事實核查;基于大數據、區塊鏈等智能技術的事實核查;用AI治理AI的事實核查。
一是傳統的新聞事實核查。傳統的事實核查依賴人力核實新聞信源與經過,主要由職業新聞從業者完成,所需時間和人力成本較高。
二是基于大數據、區塊鏈等智能技術的新聞事實核查。大數據和區塊鏈技術出現后,人們能夠通過爬梳并分析信息來源的賬號特征、文本特征、傳播路徑特征等信息,開展數據管理、追蹤和溯源,核實信息真實性。新冠疫情期間,社交媒體上混合著大量有關疫情擴散與治療的信息,淹沒了可信任的信息來源,影響公眾的健康認知和決策,形成“信息疫情”。[10]大數據和區塊鏈技術以分析高效、難篡改、易追蹤等優勢,為真實防疫信息的共享和傳遞提供技術支撐。
三是用AI治理AI的新聞事實核查。人工智能推動事實核查進入新的發展階段,各國傳媒機構和科技公司逐步探索“AI治理AI”模式。國際事實核查網絡(IFCN)等組織以及相關主題國際會議,推動全球事實核查創新運動的制度化發展。其中,機器作為行動者的角色受到重視。谷歌DeepMind團隊和斯坦福大學研究人員開發的搜索增強事實評估器(Search-Augmented Factuality Evaluator, SAFE),可通過大型語言模型分解聊天機器人生成的文本,再分別核查其中所涉及的事實信息準確性。相較于文字文本的核查,音頻檢測工具的發展應用相對滯后。美國西北大學計算機科學教授蘇夫拉曼尼(V.S. Subrahmanian)開展人工智能音頻檢測實驗,測試了14種現有、免費且公開的音頻深度偽造檢測工具,結果卻不盡如人意。盡管目前使用AI工具識別深度偽造內容的難度較大,但構建行動者網絡、開展人機協同、“AI治理AI”仍是發展趨勢。
二、人工智能技術的媒體采納帶來的行業焦慮
機器主體的參與給人類記者帶來職業發展憂慮。生成式人工智能融入新聞生產場域的過程,不是簡單的“技術使用”,而是人類行動者與非人類行動者間的交互、協商與磨合。[11]面對新技術的沖擊,身處生產一線的記者和編輯能更加敏銳地捕捉到人機權力關系的變化與職業邊界的流動。組織、制度、文化變革往往會滯后于技術采納,形成一段與技術發展不相匹配的轉型陣痛期。因此,面對生成式人工智能嵌入導致的新聞生產工作常規重構、組織機制變革、新聞文化重塑,不少一線從業者表現出不同于機構管理層的懷疑和冷漠,甚至是抗拒和抵制。[12]作為傳播主體的機器改變了以人為主體的傳播生態。記者與編輯要應對行業內外的雙重壓力,迎接包含機器生產者在內的多元主體的挑戰。
生成式人工智能及相關技術的發展帶來高階智能社會的迷思。ChatGPT和Sora等便于交互、面向公眾的生成式人工智能出現,帶動新的內容創作和消費方式流行。在Sora發布的女性漫步東京街頭的視頻中,人物在布滿霓虹燈牌和廣告牌的街頭走動,五官和肢體動作都較為自然。盡管Sora生成視頻中還存在著細節處理不夠精細、自然規律和文化理解錯位、敘事邏輯斷裂等問題,它仍然承載著公眾對于高階智能社會的想象。
生成式人工智能的應用加劇新聞傳播從業者的職業技能恐慌。生成式人工智能通過人機交互來產出內容,因此需要國家、群體或個體具備一定的數字資源調用能力。生成式人工智能可以根據指令實現多模態文本轉換,進一步降低了生產門檻,但也考驗著使用者自身的綜合素質。自主性的提升常被認為具有賦權意味,例如提升個體傳播能力和彌合數字文明社會的能力溝,或是增強個體的知覺與連接能力等。[13]然而,技術擴散會受到社會資本不平等的制約。“技術帶來的特權越來越多地只屬于那些負擔得起的人,特別是當國家退出基礎設施和公共服務供給時。”[14]當前,生成式人工智能的賦能所需的前置條件涵蓋語言能力、創意能力、信息獲取能力、技術使用素養和可接入設備條件等多方面。
三、生成式人工智能應用于新聞傳播業的多元風險
生成式人工智能的新形態嵌入新聞傳播業,不僅會改變新聞生產、分發和接收環節,也會推動相關制度和文化環境發生轉型。技術創新、制度創新與知識創新的時差,給新聞業帶來多元風險,并經由信息傳播擴散至其他社會領域。
(一)數字信任危機:信息真實性和可靠性下降
生成式人工智能參與信息生產,導致人類生成的版權內容與AI生成內容混雜。生成式人工智能的模型訓練、內容生產及生成物應用環節,都存在著侵犯版權的風險,如未經授權使用文本數據或者生成結果中模糊版權信息等。2024年2月,Raw Story、The Intercept、AlterNet等新聞機構指控OpenAI及微軟的生成式人工智能刪除了文章作者和標題等版權識別信息。無版權識別信息的人類產出內容與人工智能生成內容一同出現在信息流當中,客觀上會對用戶產生誤導,干擾用戶對生成式人工智能可信度的判斷。
生成式人工智能加劇了深度偽造內容泛濫。2024年初,世界經濟論壇發布的《2024年全球風險報告》提出,“未來兩年全球十大風險”的首位是“人工智能生成的錯誤信息和虛假信息”。[15]以深度偽造的負面使用為代表,生成式人工智能正在危害公民和國家安全。ChatGPT出現后不久,就被發現用強大的文本處理能力來拼湊、編造虛假信息,對用戶“一本正經地胡說八道”。相比之前的Pika、Runway等視頻生成模型,Sora生成視頻時長較長、分辨率較高且在多角度多景別的鏡頭變換中能夠保持一定的主體一致性。脫離了生產主體等背景信息,許多人工智能生成內容看起來與人類生產的內容極為相似,幾乎能夠以假亂真。作為深度偽造最典型的應用,“AI換臉”和音頻深度偽造也被用于欺詐和侵權。普通用戶利用公開數據和生成工具,就可以輕易生成政治名人、娛樂明星甚至普通社交媒體用戶的有害內容,侵犯其名譽權和隱私權。鑒別深度偽造內容和控制其傳播的成本遠遠高于生成成本,被侵犯者常常難以自證。此前,有用戶故意使用Elevenlabs公司的軟件來制作傳播種族主義言論的明星發言視頻。深度偽造的負面使用不僅僅是用戶的個人行為,平臺的內容篩選、信息分發等設計也會產生引導作用。相較于圖像/視頻深度偽造內容,音頻的制作成本和技術門檻更低,且缺少視覺線索,增加了鑒別難度。2024年1月,新奧爾良街頭魔術師保羅·卡彭特(Paul Carpenter)只花了20分鐘和1美元,偽造了美國總統拜登勸阻民主黨人投票的音頻。深度偽造音頻常常通過電話而非在線播放的形式傳播,其內容難以被暫停、回放、留存和截取片段分析。
生成式人工智能的應用,使“后真相”征候更加嚴重。傳統新聞生產中,新聞現場的人、物、環境等諸多要素,既是啟發記者進行個性化表達的靈感來源,也是新聞真實性的佐證。記者的身體在場和專業素養使現場變為新聞現場,“將各類事情轉化為新聞事件”。[16]隨著互聯網成為信息傳播基礎設施,新聞傳播主體范圍拓展至非專業新聞機構、普通社會個體甚至是機器。UGC和AIGC生產模式普及開來,使新聞生產規范受到沖擊。監控攝像頭和各類傳感器等媒介作為記者身體的延伸,開始代替記者進入現場。“身體離場”的方式提升了新聞生產的效率,但也制約了“現場感”的表達和實證功能的發揮。[17]在融合傳播環境下,新聞的傳播和接收遷移到社交媒體平臺,新聞生產流程和新聞文化發生轉變。“流量為王”的利益驅動機制以及信息核查的高昂成本,致使部分媒體轉而用制造同意替代追求真實。大量不以事實為基礎且信息、情感和立場混雜的復合體層出不窮。“后真相”征候頻繁出現,表現為“成見在前、事實在后,情緒在前、客觀在后,話語在前、真相在后,態度在前、認知在后”[18]。訓練數據庫中信息質量良莠不齊,會影響人工智能生成內容的質量。在互動過程中,生成式人工智能所“臆造”的內容根據用戶要求不斷被改寫完善,變得更加難以辨別。