近日,標貝科技語音合成音色庫又有新進展。針對智能客服場景,上新兩個溫和風格音色,適用于服務(wù)回訪、業(yè)務(wù)咨詢、產(chǎn)品介紹等細分業(yè)務(wù)場景。加上前不久的兩款嚴肅客服音色,標貝科技已累計上線20多個風格迥異的男女客服發(fā)音人,全力加速企業(yè)客服中心的智能化轉(zhuǎn)型。
此外,本次也同步上線兩個泰語女聲音色和法語女聲音色,以滿足更多細分場景的應(yīng)用需求。
大模型驅(qū)動語音合成更“擬人”
傳統(tǒng)的語音合成,因為技術(shù)上的限制,通常是采集標準的播音風格錄音,以保證數(shù)據(jù)的穩(wěn)定性。但是用它合成出來的聲音也會過于標準、刻板,程序化,不接地氣,容易讓用戶產(chǎn)生聽覺疲勞。
在大模型爆發(fā)的背景下,作為生成式AI的重要課題,語音合成也取得了飛速發(fā)展。從引人入勝的有聲小說,到準確無誤的語音導航,再到豐富多彩的視頻內(nèi)容配音、問答流暢的虛擬數(shù)字人。人機語音交互場景越來越深入,聲音體驗的價值也被持續(xù)不斷挖掘出來,富有情感表現(xiàn)力的擬人化語音合成成為當下的語音交互新態(tài)勢。
超自然的大模型合成音色定制 ?
結(jié)合當前智能語音產(chǎn)業(yè)需求現(xiàn)狀,標貝科技持續(xù)在多風格、多情感語音合成能力上不斷深耕細作,打造全鏈路語音定制方案。憑借其強大的語言理解和生成能力,為企業(yè)客戶服務(wù)、陪伴式語音交互、沉浸式聽書等場景,提供更自然、更準確的語音輸出。
相較于傳統(tǒng)語音合成效果,標貝科技語音合成音色定制方案依托語音大模型遷移學習和深度神經(jīng)網(wǎng)絡(luò)技術(shù),具備更多的多樣化和高延展優(yōu)勢。它能夠比較準確捕捉到數(shù)千種音色的語調(diào)、情感等特征,讓模型更好地復刻出真人說話時的猶豫停頓、變速等副語言習慣,在不同的應(yīng)用場景下,輕松創(chuàng)造出無限的聲音變化、情感和風格。
據(jù)評測,通過標貝科技語音合成音色定制方案輸出的合成音色,在韻律表現(xiàn)、音色層次感、情感擬人化方面均有了大幅提升,MOS評分達到4.5以上,充滿“人情味”。
此外,標貝科技語音合成音色定制方案可以支持客戶自選聲音及提供語料定制,并提供包括錄音棚、錄音師、韻律標注、MOS 評測任務(wù)等定制音色所需的全鏈路服務(wù)。有效降低音視頻內(nèi)容生產(chǎn)成本,讓音頻內(nèi)容的生產(chǎn)和分發(fā)更為有效。
據(jù)中商情報網(wǎng)發(fā)布的《2023年全球及中國智能語音市場規(guī)模預(yù)測分析》,預(yù)計2023年我國智能語音市場規(guī)模將達到382億元,同比增長34%。隨著智能語音助手、自動語音響應(yīng)系統(tǒng)等應(yīng)用的廣泛推廣,智能語音市場前景廣闊。
標貝科技語音合成音色定制方案已經(jīng)在醫(yī)療、金融、數(shù)字人、泛娛樂等領(lǐng)域得到應(yīng)用,助力中國銀行、人民日報、湖南電信、恒生電子、清博智能等多家行業(yè)頭部企業(yè)實現(xiàn)AI語音能力的應(yīng)用與拓展。未來,標貝科技將繼續(xù)依托語大模型底座支撐,通過不斷的技術(shù)創(chuàng)新和產(chǎn)品迭代,推動AI語音技術(shù)落地至更多應(yīng)用場景,為用戶帶來更加便捷、智能、人性化的語音交互體驗。
(推廣)