一家名為“華麗琴鳥”(Lyrebird)的加拿大初創(chuàng)公司發(fā)明了一套人工智能系統(tǒng),用戶只需使用一段長約1分鐘的錄音,便可合成講話者的聲音。該人工智能系統(tǒng)可利用語音模仿算法仿制某人的聲音,還能聲情并茂地朗讀各類文本,雖然這一語音復制技術聽上去挺有趣,但也可能產生嚴重后果,因為使用者可用其假冒他人身份。
該初創(chuàng)公司以蒙特利爾大學博士生們研發(fā)的深度學習模型為基礎。公司名為“華麗琴鳥”,這是一種原產澳大利亞的鳥類,可同時模仿20種不同生物的聲音。
該公司使用人工智能系統(tǒng),將一段語音中的個人特征壓縮成一段獨特的編碼。研發(fā)人員稱,將該編碼輸入算法后,不到半秒鐘便可生成1000個句子,該算法不僅能合成語音,還能對聲音進行控制,賦予其憤怒、同情或緊張等情感,官網上以特朗普、奧巴馬和希拉里的聲音為例,演示了該技術的準確程度。
研發(fā)人員稱,這一技術可得到廣泛運用,如充當個人助理、用名人的聲音閱讀有聲書、或為殘疾人合成“演講”等,在動漫電影和視頻游戲中也將有用武之地。
“錄音常被視作強有力的證據(jù),許多國家的司法系統(tǒng)尤其看重這一點。而不法分子可利用我們發(fā)明的技術輕易操縱錄音,從而破壞了錄音作為證據(jù)的可信度。”研發(fā)人員承認,該技術可能導致危險后果,如“通過竊取他人身份誤導外交官、或進行欺詐等”,該團隊認為,等到該技術對公眾開放之后,錄音便不應被視作驗明正身的證據(jù)。
該公司表示,這一技術目前仍處在研發(fā)階段,且未提及具體發(fā)布時間及費用。