您的位置: 首頁 >科技 >

這個開源的AI工具可以快速隔離任何歌曲中的人聲

2022-09-08 19:05:31 編輯:宣香棟 來源:
導讀 對于制作人,DJ以及任何想使用隔離音頻進行演奏的人來說,將歌曲拆分為單獨的人聲和樂器一直是頭疼的問題。有很多方法可以執(zhí)行此操作,但是...

對于制作人,DJ以及任何想使用隔離音頻進行演奏的人來說,將歌曲拆分為單獨的人聲和樂器一直是頭疼的問題。有很多方法可以執(zhí)行此操作,但是該過程可能很耗時,并且結果通常不完美。新的開源AI工具使這項棘手的任務變得更快,更輕松。

該軟件稱為Spleeter,由音樂流媒體服務Deezer為研究目的而開發(fā)。昨天,該公司以開源軟件包的形式發(fā)布了該代碼,并將代碼放在Github上,供任何人下載和使用。只需向Spleeter提供一個音頻文件,它就會將Spleets分為兩個,四個或五個獨立的音軌,稱為莖。結果并不完美,但是非常有用,Spleeter本身非???。在專用GPU上運行時,它可以將音頻文件分成四個莖,比實時速度快100倍。

技術專家Andy Baio撰寫了一篇有關Spleeter的出色博客文章,其中包含許多自己的例子。Baio表示,該軟件產生的孤立人聲“有時會獲得機器人自動調整的感覺,但相對于其他解決方案,其出血量卻令人震驚地低。”

該工具似乎功能強大,但請注意:您需要一些技術知識才能使用它。除非您定期使用Python或Google的AI工具包TensorFlow(用于訓練Spleeter)之類的軟件,否則必須下載一些程序才能啟動和運行Spleeter。而且,您將不得不使用命令行輸入(盡管非常簡單)而不是更易于訪問的可視界面。

Deezer指出,這不是人們第一次使用機器學習來自動執(zhí)行此特定任務,并且該公司已建立在許多早期研究的基礎上。Deezer的首席數(shù)據(jù)和研究官Aurelien Herault在通過電子郵件對The Verge講話時說,該公司在20,000種音樂曲目上使用各種類型的預分離人聲對其軟件進行了培訓。通過此信息,該軟件學習了如何隔離軌道本身。

總體而言,Spleeter是另一個出色的例子,說明了AI工具如何使復雜的創(chuàng)意工作變得更簡單。機器學習目前正用于自動執(zhí)行一系列耗時的任務,從刪除圖片上的背景到升級舊視頻游戲中的紋理。從Adobe的Photoshop到Runway ML之類的新競爭者,這些工具越來越多地被并入消費軟件。

Deezer說,它沒有計劃將Spleeter變成一個消費工具,但是其他人可以承擔他們的工作,并在其上打一個簡單的界面。對于希望將孤立的人聲整合到混音中的DJ和制作人,或者對于希望創(chuàng)建自制卡拉OK伴奏音軌的人來說,顯而易見的應用是它們。(根據(jù)最終產品的分發(fā)方式,此類活動可能不符合版權法。)

Deezer本身將Spleeter用于一系列研究應用程序,以幫助改善其流媒體服務。“在內部,我們將其用作預處理工具,以完成諸如音樂分類,轉錄和語言檢測之類的復雜研究任務,” Herault說。


免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯(lián)網(wǎng) 版權歸原作者所有。