對于習(xí)慣了佩戴支持主動式降噪(ANC)耳機的用戶們來說,你會發(fā)現(xiàn)市售產(chǎn)品的解決方案仍有一定的改進(jìn)空間 —— 麥克風(fēng)會拾取諸多音頻,而不是你想要集中注意力的那部分。好消息是,來自華盛頓大學(xué)的一支研究團隊,介紹了一款名叫 ClearBuds 的真無線耳機,特點是能夠利用實時機器學(xué)習(xí)來增強語言體驗。
ClearBuds 是華盛頓大學(xué)三名研究人員(COVID 大流行期間的室友們)的一個項目成果。
作為一個開源項目,ClearBuds 旨在通過引入深度學(xué)習(xí)和音頻處理層,來化解這方面的問題。
可知其系統(tǒng)中包含了一套麥克風(fēng)系統(tǒng)、以及能夠在智能手機上運行的實時機器學(xué)習(xí)系統(tǒng)。
盡管大多數(shù)耳機僅使用了其中一個耳塞將音頻發(fā)送到手機,但 ClearBuds 系統(tǒng)卻能夠發(fā)送兩路音頻流。
通過快速分析和處理,其相關(guān)信息能夠被用于視頻 / 電話呼叫等實時音頻的體驗改進(jìn)。算法會抑制非語音信息,以增強用戶通話時的聲音。
Paul G. Allen 計算機科學(xué)與工程學(xué)院博士生 Maruchi Kim 表示,ClearBuds 有兩個關(guān)鍵特性。
首先,這款真無線耳機使用了雙麥克風(fēng)陣列,用于創(chuàng)建兩個同步音頻流,提供信息并允許我們在更高解析力的空間上分離來自不同方向的聲音。
其次,通過引入輕量級的神經(jīng)網(wǎng)絡(luò),ClearBuds 得以進(jìn)一步增強通話者的聲音。研究合著者 Ishan Chatterjee 補充道:由于講述者的聲音離兩個耳機很近、且距離大致相等,因而神經(jīng)網(wǎng)絡(luò)訓(xùn)練可專注于其語音并消除其它背景噪聲。
這種方法與人耳的工作方式非常相似,即利用聲音傳入左右耳的時間差,來判斷聲音到底來自哪個方向。
展望未來,我們希望該研究團隊能夠很快將 ClearBuds 或其實時機器學(xué)習(xí)音頻增強技術(shù)推向市場。
原標(biāo)題:ClearBuds團隊介紹基于實時機器學(xué)習(xí)的通話音頻增強技術(shù)
昵稱 驗證碼 請輸入正確驗證碼
所有評論僅代表網(wǎng)友意見,與本站立場無關(guān)