破解 AI 假新聞：紐時、Adobe、推特替影音加上溯源標籤

#292

許明恩

Aug 05, 2020

∙ Paid

嗨，早！

人工智慧不僅可以用來寫文章、修圖、創造假聲音，甚至已經能用來製作假影片。其中，近期最受矚目的就是深僞技術（deepfake）。這篇討論深僞技術的正反面用途，以及科技公司打算如何破解它。

我的聲音不是我的聲音

每次錄 podcast 的時候，我都會先用以下這段話，讓來賓放心錄音：「錄音內容會經過事後剪輯才上架公開。所以即便講錯，只要再重講一次就好了。經過剪輯之後，人人的口才都會變得很好。」

寧願來賓多講，也不要少講。這是因為剪掉聲音很容易，無中生有卻很困難。但現在有一套非常厲害的 podcast 剪輯軟體 Descript，它會運用深僞技術模擬來賓聲音，讓創造聲音和刪除聲音一樣簡單：

Descript 會將錄音檔案輸出成逐字稿，等於是將原本 podcast 的剪輯工作，從剪接音軌變成修改文字。剪輯人員只要把特定文字刪除，Descript 就會自動地將那段話的音軌剪掉。這等於是把聲音剪輯，變得像文字編輯一樣簡單。
厲害的不是聲音剪輯，而是無中生有。只要剪輯人員在逐字稿內新增一段文字，Descript 就可以替來賓在音軌中創造出一段聲音。Descript 運用深僞技術模擬來賓聲音，輸出的效果就像是直接從來賓口中說出來一樣自然。

雖然目前 Descript 只支援英文，但已經可以在這裡玩玩看。

Descript 可以替換出任何人的聲音。說不定未來我與來賓 LINE 上的文字聊天紀錄，就可以用來「錄」好一集 podcast 節目。如果我打了「哈哈哈」，Descript 還能自動配上我的笑聲。

深僞技術擅長無中生有。

深僞可以憑空創造聲音，也可以創造畫面。將聲音和畫面搭配在一起，就成了深僞影片。例如下方這段影片其實是由電影《逃出絕命鎮》導演、知名喜劇演員 Jordan Peele 錄製的內容，只不過它運用深僞技術將自己的臉和聲音都換成歐巴馬，藉此警告人們注意這項技術。

Continue reading this post for free, courtesy of 許明恩.

Or purchase a paid subscription.

區塊勢

破解 AI 假新聞：紐時、Adobe、推特替影音加上溯源標籤

#292

我的聲音不是我的聲音

Continue reading this post for free, courtesy of 許明恩.