快科技4月15日消息,谷歌公布了一款名為DolphinGemma”的大型語言模型,旨在幫助科學(xué)家理解海豚的聲音,并生成類似海豚的聲音序列。
研究人員預(yù)計(jì)在未來幾個(gè)月內(nèi)測試DolphinGemma及其配套的Cetacean Hearing Augmentation Telemetry(CHAT)發(fā)聲系統(tǒng),以探索是否能夠翻譯并模仿海豚的聲音,進(jìn)而實(shí)現(xiàn)與海豚的某種對話”。
海豚是地球上最聰明且最善于溝通的動(dòng)物之一,其社交互動(dòng)極其復(fù)雜,不僅能通過各種聲響辨識不同的個(gè)體,還能在不同活動(dòng)中發(fā)出不同的聲音。
科學(xué)家們長期以來一直試圖破解”這些聲音的含義,并嘗試模擬海豚的聲音與它們溝通。
為此,谷歌與野生海豚計(jì)劃”(WDP)組織以及美國喬治亞理工學(xué)院合作,利用WDP收集的大量海豚哨聲、喀嗒聲和脈沖聲數(shù)據(jù),訓(xùn)練了DolphinGemma這一AI模型。
DolphinGemma基于與谷歌Gemini系統(tǒng)相同的技術(shù)構(gòu)建,擁有約4億個(gè)參數(shù),其運(yùn)作方式與ChatGPT等生成式語言模型類似,但生成的是海豚聲音而非文字。
目前的研究方向是讓DolphinGemma在聽完海豚聲音的前半部分”后,由AI生成后半部分”,并比對AI生成的后半部分與海豚實(shí)際發(fā)出的后半部分是否一致,以初步判斷海豚語”是否有固定的單詞或結(jié)構(gòu)。
研究計(jì)劃初期定位在將海豚喜歡的物體與特定的合成聲”相關(guān)聯(lián),期望海豚在想要這些物體時(shí)能發(fā)出對應(yīng)的合成音,達(dá)成初步溝通。
但DolphinGemma究竟能達(dá)到什么程度,以及是否能讓海豚與人類真正對話,目前仍是一個(gè)遙遠(yuǎn)的課題。
(舉報(bào))