OpenAI推出准確驚人的語音模擬工具,配音演員要被代替了

縱橫千古與八荒 2024-04-02 21:00:09

周五(3月29日),Open AI公司推出一款人工智能語音工具——“語音引擎”(Voice Engine),能夠以驚人的准確性模仿人類的聲音。

Open AI發布了Voice Engine早期測試的樣本,可以用隨便一個人15秒的語音樣本,來生成他說話和朗讀的長篇語音。生成的語音與原始人聲的相似度令人驚歎,而且語速、語調和情緒還可以進行變化。

Voice Engine這類人工智能語音生成器具有一系列潛在應用,比如在輔助功能服務方面。它們可以幫助翻譯,幫助兒童閱讀或幫助那些失去說話能力的人。

不過,這種高准確性的智能語音模擬技術存在很大的應用風險。網絡詐騙分子和集團可能將其用于模擬親友和目標人進行通話,進而開展詐騙行爲。

因此,OpenAI公司表示,Voice Engine目前僅開放給“一小群值得信賴的合作夥伴”使用,包括教育和衛生技術公司。它將使用它們的測試情況來確定是否或如何更廣泛的應用。

OpenAI稱,這些測試人員已同意在未經他們明確同意的情況下不重現人們的聲音,並向聽衆明確表明他們聽到的是人工智能産生的語音。

另外,OpenAI在周一還宣布,它正在向人們開放ChatGPT,任何人無需注冊即可使用該服務。這可能是面臨其他公司同類産品競爭的緣故。

OpenAI表示,它可能會使用加載到ChatGPT中的任何文本來改進其模型。如果不想要這個功能的話,即使沒有賬戶,也可以通過設置來關閉。然而,如果沒有賬戶,用戶將無法保存或查看聊天曆史記錄或訪問其他各種功能,包括語音對話和自定義說明。

OpenAI的Voice Engine搶在了之前已經披露的視頻生成工具Sora之前發布,顯示出其公司在人工智能研發方面突飛猛進的進展。

現在OpenAI的ChatGPT、Voice Engine和Sora三個人工智能工具分別在文本、語音和視頻方面齊頭並進的快速發展,都取得了重大成果,形成了全方面的人工模擬狀態。

這種生成式人工智能更加可怕的地方是,它會自學習。不但可以集中式灌輸學習,還能通過與使用者的溝通來不斷吸取知識。以這種速度,可能在一兩年之能就能把人類幾千年的知識吸收完畢,還能不斷及時的吸收新的知識。

更甚至更恐怖的是它可能可以學習自己研究出來的知識。

現在文字、語音和視頻的人工智能模型都達到了比較實用的水平,其實對一般性的白領辦公室工作已經形成了很強的替代作用。

我們已經處在第四次工業革命的進程之中。

0 阅读:40

縱橫千古與八荒

簡介:天下大勢,浩浩湯湯;縱論千古,橫瞰八荒。