AD

2017年7月16日星期日

還在相信網絡小視頻?AI讓音視頻偽造更難分辨

在6月8日參議院情報委員會的一次會議上,前聯邦調查局局長詹姆斯·科米(James Comey)如是指出:"我打心底希望用磁帶(驗證真相)。"柯米之所以希望用磁帶紀錄的聲音作為證據,是因為目前在我們的社會,將聲音和視頻文件作為證據並不完全可靠,其並不等同於真相。

現在而言,當人們看到暴力、犯罪等視頻,特別是那些具有一定質量,沒有明顯編輯痕跡的視頻時,往往可認為視頻所描繪的事件實際上真正發生了。

但是,眼見為實的真相視頻即將被人工智能所改變。

我們的分析預測,大數據和機器學習等技術有助於監控現實並辨別事實。但從另一方麵,這些技術也能夠幫助我們說謊。如同人工智能技術的飛速發展一樣,音頻和視頻偽造技術也正在取得驚人的進步,這主要得益於人工智能技術的不斷提升。在未來,人們需要處理更多真假難辨的音視頻。無論是音頻,視頻,圖像或是文本,人們很難弄清真真假假。

Lyrebird是一家位於蒙特利爾的深度學習技術創業公司。目前該公司正在開發一項技術,使任何人都可以用任何個人的聲音創造出令人驚訝的逼真演講。 Lyrebird通過演示器技術,仿造出唐納德·特朗普,巴拉克·奧巴馬以及希拉裏·克林頓等名人的演講。目前看來,Lyrebird的模擬雖然令人印象深刻的,但質量不高,機器合成的跡象明顯,甚至於常人也能夠輕鬆分辨出其是機器合成的。不過,類似的技術進步很快。創意軟件巨頭Adobe正在開展類似的技術,宣布了打造音頻界的圖像編輯軟件(Photoshop for audio)這一目標。

斯坦福大學以及其他機構的研究人員在視頻偽造技術中取得了竟然的進展開。研究人員僅使用現成的網絡攝像頭,通過人工智能軟件就能夠改變YouTube視頻中個人的麵部表情以及與言語相關的口腔運動。一位研究員重新編輯了關於前美國總統喬治·W·布什(George W. Bush)的視頻,在其中實時插入了新的麵部表情和言語表達動作。

其他人工智能研究小組已經證明了反向運行圖像識別功能的技術,這種技術允許在文本描述的基礎上生成合成圖像。領導這項工作的研究人員傑夫·克朗(Jeff Clune)指出,"人們向我發來真實的圖像,我會懷疑這些圖像是否是假冒的。反而當他們給我發送假圖像時,因為質量很好,我會認為是真實的。"

綜合來看,偽造音視頻的質量越來越高,成本越來越低,這難免令人擔憂。按照目前的進度,兩三年之內音頻偽造技術足夠騙過公眾的耳朵,而在五到十年之後,偽造者甚至可以到辦案專家。當製作假視頻的工具能夠生成更高質量的視頻,同時在公眾中普及的話,這些偽造音視頻或將會影響到整個信息生態係統。相關技術的發展將在新聞,政府交流,刑事司法證據以及國家安全領域改變證據和真相的定義。

據報道稱,俄羅斯情報部門雇用了數千名全職工作人員,他們在主流網站上提供假新聞文章,社交媒體帖子和評論。這些代理人反過來又控製著數百萬社交媒體僵屍賬戶。牛津互聯網研究所的計算宣傳研究項目的一項研究發現,俄羅斯進行評論的Twitter帳戶中有一半是機器人。這些行動並沒有限製在其境內:在美國,俄羅斯社交媒體機器人已經表現出了推動主流媒體報道假冒新聞甚至影響美國股票價格的能力。

當這些代理人和僵屍網絡開始分享假高清視頻和音頻時,會發生什麼?技術產業和政府不應該無動於衷。這種技術的威脅是多方麵的。所以需要有相應的解決方案。

有些將是技術性質的,類似於試圖阻止像Photoshop這樣的圖像軟件被用來偽造貨幣的技術解決方案一樣,也會有相應的技術解決方案來減輕人工智能偽造的最壞影響。 在這一方麵,區塊鏈技術Blockchain,提供了一種可能性:這種技術為比特幣交易的排序提供了加密的可靠證據。我們大可以設計使用塊鏈技術的相機和麥克風來創建無法篡改的視頻錄製日期燈記錄。雖然這不會阻止再次編輯或偽造,但是至少能保證在特定日期存在特定文件的加密安全相關證據。

其他解決方案將是監管和程序性的。警察和檢察官必須製定證據標準,以證明特定照相機或麥克風形成的監管鏈。匿名電子郵件的視頻文件可能最終不會成為有效證據。由於電話和視頻聊天不僅可以被數字攔截,還可以數字模擬,因此人們在高級別會議中會盡可能采用麵對麵的交流方式。

自19世紀末以來,隨著照片和留聲機的發明,人們通過一些重要的音視頻資料找到答案。理查德·尼克鬆總統表示,他不知道水門事件。但錄音帶證明了在他說謊。麵對音視頻偽造的發展,需要社會的正確麵對,否則我們必會生活在得不到真相的社會。

相關文章

没有评论:

发表评论