亞馬遜可讓Alexa聽取一小段聲音資料後,即可模擬原始音色說話

管理員 | 科技新知
【此文章來自:Mashdigi】
 

將可推動更自然的數位助理聲音互動,或是推動更多聲音互動應用發展

在稍早舉辦的re:Mars開發者大會上,Alexa資深副總裁暨首席科學家Rohit Prasad展示新技術成果,將可讓Alexa聽過一小段聲音內容後,即可快速學習、模仿聲音風格。

圖一:亞馬遜宣布台灣可直接購買Echo系列智慧音箱,內附Alexa服務為家庭帶來語音控制的便利性拷貝.jpg



透過實際展示影片內容說明,Rohit Prasad表示Alexa可以透過1分鐘不到的錄音內容,藉此學習聲音特徵,進而可模仿其發音方式。例如在影片內容中,小男孩詢問Echo智慧喇叭的Alexa數位助理服務是否能用已故奶奶的聲音念《綠野仙蹤》故事內容,即可將原本聲音切換成先前已經學習的奶奶聲音,並且開始用奶奶聲音為小男孩講故事。

Rohit Prasad說明,依照目前的技術,將可透過簡短的學習資料進行訓練,進而呈現擬真的聲音內容,無須像過去必須花費大量時間成本進行後製。而打造此項技術,有一部分也是希望能讓更多人可以再次聽見已故親人的聲音。



另一方面,這樣的技術也有助於更多以聲音互動為主的數位助理互動服務發展,並且能以更貼近真人方式吸引人互動,或是用於內容創作,例如配合數位擬真人像讓已故演員、歌手再次登上螢幕演出。

不過,目前亞馬遜並未公布此項技術具體細節,同時也位說明此項技術預計在何時問世,但預期未來此類技術可能會面臨較嚴謹的使用倫理規範,避免應用在不法用途。
 

Mashdigi

Mashdigi

出生自台灣高雄的楊又肇,以前聯合新聞網 (udn.com)數位頻道主編,以及在各網站頻道以本名或Mash Yang名稱維持提供撰寫、授權內容等身分,持續在網路、科技相關活動、展覽出沒。撰寫內容涵蓋個人感興趣內容,包含手機、網路、軟體、零組件,以及科技市場動態,另外也包含各類惡趣味內容,並且持續關注蘋果、微軟、Google、Intel、AMD、Nvidia等經常在你我生活中出現的科技廠商動態。