嗨,早!
人工智慧不僅可以用來寫文章、修圖、創造假聲音,甚至已經能用來製作假影片。其中,近期最受矚目的就是深僞技術(deepfake)。這篇討論深僞技術的正反面用途,以及科技公司打算如何破解它。
我的聲音不是我的聲音
每次錄 podcast 的時候,我都會先用以下這段話,讓來賓放心錄音:「錄音內容會經過事後剪輯才上架公開。所以即便講錯,只要再重講一次就好了。經過剪輯之後,人人的口才都會變得很好。」
寧願來賓多講,也不要少講。這是因為剪掉聲音很容易,無中生有卻很困難。但現在有一套非常厲害的 podcast 剪輯軟體 Descript,它會運用深僞技術模擬來賓聲音,讓創造聲音和刪除聲音一樣簡單:
Descript 會將錄音檔案輸出成逐字稿,等於是將原本 podcast 的剪輯工作,從剪接音軌變成修改文字。剪輯人員只要把特定文字刪除,Descript 就會自動地將那段話的音軌剪掉。這等於是把聲音剪輯,變得像文字編輯一樣簡單。
厲害的不是聲音剪輯,而是無中生有。只要剪輯人員在逐字稿內新增一段文字,Descript 就可以替來賓在音軌中創造出一段聲音。Descript 運用深僞技術模擬來賓聲音,輸出的效果就像是直接從來賓口中說出來一樣自然。
雖然目前 Descript 只支援英文,但已經可以在這裡玩玩看。
Descript 可以替換出任何人的聲音。說不定未來我與來賓 LINE 上的文字聊天紀錄,就可以用來「錄」好一集 podcast 節目。如果我打了「哈哈哈」,Descript 還能自動配上我的笑聲。
深僞技術擅長無中生有。
深僞可以憑空創造聲音,也可以創造畫面。將聲音和畫面搭配在一起,就成了深僞影片。例如下方這段影片其實是由電影《逃出絕命鎮》導演、知名喜劇演員 Jordan Peele 錄製的內容,只不過它運用深僞技術將自己的臉和聲音都換成歐巴馬,藉此警告人們注意這項技術。
Keep reading with a 7-day free trial
Subscribe to 區塊勢 to keep reading this post and get 7 days of free access to the full post archives.