11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
AssemblyAI最新研究成果展示了他們的Universal-1模型在多語言環(huán)境中的表現(xiàn),該模型在準(zhǔn)確性和魯棒性方面均取得了行業(yè)領(lǐng)先地位。Universal-1比WhisperLarge-v3更準(zhǔn)確,比fastWhisper更快,38秒可以處理60分鐘音頻。值得一提的是,非開源,僅提供API調(diào)用。
領(lǐng)先的開源對話AI工具包NVIDIANeMo宣布推出ParakeetASR模型系列,這是一系列最先進的自動語音識別模型,能夠以出色的準(zhǔn)確性轉(zhuǎn)錄英語口語。ParakeetASR模型與Suno.ai合作開發(fā),是語音識別領(lǐng)域的一大突破,為實現(xiàn)更自然高效的人機交互鋪平了道路。要在本地訪問模型并探索工具包,請訪問NVIDIANeMo的Github頁面。
備受期待的多人合作VR游戲《星際迷航:艦橋船員(Star Trek Bridge Crew)》將在5月30日發(fā)布。在這款游戲當(dāng)中,玩家將使用語音命令與其它游戲玩家和AI角色交流。玩家將很快就可以使用聲音命令電腦控制的角色。這個過程將由IBM VR Speech Sandbox實現(xiàn)。"