无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

能理解海豚聲音！谷歌開發(fā)全新AI模型DolphinGemma

2025-04-15 17:45 · 稿源：快科技

快科技4月15日消息，谷歌公布了一款名為DolphinGemma”的大型語言模型，旨在幫助科學(xué)家理解海豚的聲音，并生成類似海豚的聲音序列。

研究人員預(yù)計(jì)在未來幾個(gè)月內(nèi)測試DolphinGemma及其配套的Cetacean Hearing Augmentation Telemetry（CHAT）發(fā)聲系統(tǒng)，以探索是否能夠翻譯并模仿海豚的聲音，進(jìn)而實(shí)現(xiàn)與海豚的某種對話”。

能理解海豚聲音！谷歌開發(fā)全新AI模型DolphinGemma

海豚是地球上最聰明且最善于溝通的動(dòng)物之一，其社交互動(dòng)極其復(fù)雜，不僅能通過各種聲響辨識不同的個(gè)體，還能在不同活動(dòng)中發(fā)出不同的聲音。

科學(xué)家們長期以來一直試圖破解”這些聲音的含義，并嘗試模擬海豚的聲音與它們溝通。

為此，谷歌與野生海豚計(jì)劃”（WDP）組織以及美國喬治亞理工學(xué)院合作，利用WDP收集的大量海豚哨聲、喀嗒聲和脈沖聲數(shù)據(jù)，訓(xùn)練了DolphinGemma這一AI模型。

DolphinGemma基于與谷歌Gemini系統(tǒng)相同的技術(shù)構(gòu)建，擁有約4億個(gè)參數(shù)，其運(yùn)作方式與ChatGPT等生成式語言模型類似，但生成的是海豚聲音而非文字。

目前的研究方向是讓DolphinGemma在聽完海豚聲音的前半部分”后，由AI生成后半部分”，并比對AI生成的后半部分與海豚實(shí)際發(fā)出的后半部分是否一致，以初步判斷海豚語”是否有固定的單詞或結(jié)構(gòu)。

研究計(jì)劃初期定位在將海豚喜歡的物體與特定的合成聲”相關(guān)聯(lián)，期望海豚在想要這些物體時(shí)能發(fā)出對應(yīng)的合成音，達(dá)成初步溝通。

但DolphinGemma究竟能達(dá)到什么程度，以及是否能讓海豚與人類真正對話，目前仍是一個(gè)遙遠(yuǎn)的課題。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

微軟上線GPT-image-1模型通過API向開發(fā)者開放使用

OpenAI于4月24日發(fā)布全新圖像生成模型GPT-image-1，通過API向全球開發(fā)者開放。該模型支持生成高質(zhì)量圖像，具備多級定制功能，包括控制敏感度、生成效率、背景、輸出格式等參數(shù)，并推出"吉卜力模式"生成獨(dú)特風(fēng)格圖像。Adobe、Figma等多家企業(yè)已將其集成到產(chǎn)品中。API定價(jià)按token計(jì)算，低質(zhì)量圖像生成成本約0.02美元/張。OpenAI CEO Sam Altman高度評價(jià)該模型，認(rèn)為其為開發(fā)者帶來更大創(chuàng)意空間。

?OpenAI ?圖像生成 ?GPT-image-1
可靈AI發(fā)布全新2.0模型：上線多模態(tài)視頻編輯功能

快科技4月16日消息，據(jù)報(bào)道，可靈AI在北京舉行靈感成真”2.0模型發(fā)布會(huì)，正式發(fā)布可靈2.0視頻生成模型及可圖2.0圖像生成模型。據(jù)介紹，可靈2.0模型在動(dòng)態(tài)質(zhì)量、語義響應(yīng)、畫面美學(xué)等維度保持領(lǐng)先；可圖2.0模型在指令遵循、電影質(zhì)感及藝術(shù)風(fēng)格表現(xiàn)等方面顯著提升。3月27日，全球AI基準(zhǔn)測試機(jī)構(gòu)Artificial Analysis發(fā)布了最新的全球視頻生成大模型榜單，快手可靈1.6pro（高品質(zhì)模

?可靈AI ?視頻生成模型 ?圖像生成模型
超過ChatGPT、Deepseek？谷歌發(fā)布 Gemini 2.5 Flash AI 模型

新版AI模型縮短了響應(yīng)時(shí)間，節(jié)約了運(yùn)算成本；還推出了新的AI芯片“Ironwood”。谷歌發(fā)布了新的AI模型“Gemini2.5Flash”，據(jù)稱，這款A(yù)I模型的性能比OpenAI和DeepSeek的AI產(chǎn)品“更高效”。谷歌計(jì)劃在三星今年上半年推出的AI伴侶機(jī)器人Ballie上搭載生成式AI模型。

?AI模型 ?谷歌 ?Gemini
谷歌ai壟斷？谷歌每月向三星支付“巨額費(fèi)用”，讓其預(yù)裝Gemini

繼 Android 系統(tǒng)、Chrome 瀏覽器等應(yīng)用之后，谷歌又為他們的 Gemini 預(yù)裝花費(fèi)了“巨額費(fèi)用”……

?谷歌ai壟斷 ?谷歌壟斷 ?三星
“奧迪助手”來了！全新AUDI車型接入豆包大模型

2025年4月24日上海車展期間，上汽奧迪發(fā)布全新A5L Sportback和首款量產(chǎn)車型E5 Sportback。同時(shí)推出與火山引擎合作開發(fā)的"奧迪助手"智能交互系統(tǒng)，基于豆包大模型實(shí)現(xiàn)自然對話體驗(yàn)。該系統(tǒng)將搭載于兩款新車，并同步部署在車載端和手機(jī)APP端，支持跨設(shè)備對話記錄同步?；鹕揭鏋橄到y(tǒng)提供大模型技術(shù)支持，實(shí)現(xiàn)語音指令控制、車輛功能講解等智能服務(wù)，并整合抖音、汽水音樂等內(nèi)容生態(tài)。上汽奧迪表示，該合作將助力品牌打造更智能、個(gè)性化的產(chǎn)品矩陣。

?上海國際車展 ?上汽奧迪 ?奧迪
谷歌Gemini整合Veo 2視頻生成模型，8秒720P視頻輕松搞定

谷歌宣布又有一款 AI 模型將加入 Gemini，但這次它不僅僅是一個(gè)聊天機(jī)器人。

?谷歌 ?谷歌gemini ?veo2
百度Create AI開發(fā)者大會(huì)：李彥宏發(fā)布兩大新模型、多款熱門AI應(yīng)用、開發(fā)者全面擁抱MCP

4月25日，百度在武漢舉辦Create 2025開發(fā)者大會(huì)。李彥宏發(fā)布文心大模型4.5 Turbo和深度思考模型X1 Turbo，性能提升同時(shí)價(jià)格大幅下降。大會(huì)推出全球首個(gè)電商交易MCP平臺(tái)，并發(fā)布數(shù)字人、智能體心響APP等多款A(yù)I應(yīng)用。百度宣布未來5年培養(yǎng)1000萬AI人才，并點(diǎn)亮國內(nèi)首個(gè)三萬卡集群。同時(shí)啟動(dòng)第三屆"文心杯"創(chuàng)業(yè)大賽，最高獎(jiǎng)金達(dá)7000萬元。大會(huì)還包含6大分會(huì)場、40節(jié)AI公開課及5000平互動(dòng)展區(qū)，全面展示百度AI生態(tài)布局。

?百度AI大會(huì) ?李彥宏演講 ?文心大模型
薦AI日報(bào)：Kimi全新音頻基礎(chǔ)模型Kimi-Audio；階躍星辰開源圖像編輯模型Step1X-Edit；?夸克AI超級框上線 “拍照問夸克”

本期AI日報(bào)聚焦多項(xiàng)AI技術(shù)突破與應(yīng)用：1)Moonshot AI推出開源音頻模型Kimi-Audio，基于13億小時(shí)訓(xùn)練數(shù)據(jù)，支持語音識別等任務(wù)；2)階躍星辰開源圖像編輯模型Step1X-Edit，展現(xiàn)強(qiáng)大生成能力；3)夸克AI上線"拍照問夸克"功能，實(shí)現(xiàn)視覺問答；4)蘋果iOS18.5將在中國推送，帶來智能功能；5)谷歌發(fā)布601個(gè)生成式AI應(yīng)用案例，覆蓋多行業(yè)；6)微軟推出深度整合Windows的UFO2自動(dòng)化系統(tǒng)；7)OpenAI升級ChatGPT至GPT-4o版本，提升STEM領(lǐng)域能力；8)Ema公司推出高性價(jià)比語言模型EmaFusion；9)Liquid AI發(fā)布面向邊緣設(shè)備的Hyena Edge模型；10)LemonAI推出實(shí)時(shí)音視頻數(shù)字人產(chǎn)品Slice Live。此外，國內(nèi)方面，智譜與生數(shù)科技達(dá)成戰(zhàn)略合作推動(dòng)大模型發(fā)展，寶馬中國宣布新車將接入DeepSeek技術(shù)。

?AI日報(bào) ?音頻技術(shù) ?開源模型
薦AI日報(bào)：昆侖萬維開源Skywork-OR1系列模型；訊飛星辰Agent開發(fā)平臺(tái)全面支持MCP；字節(jié)跳動(dòng)布局AI智能眼鏡

歡迎來到【AI日報(bào)】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/1、Kimi開源視覺語言模型 Kimi-VL 與 Kimi-VL-Thinking，多項(xiàng)基準(zhǔn)超越 GPT-4oMoonshot AI 最近開源了 Kimi-VL 和 Kimi-VL-Thinking 兩款視覺語言模型，展現(xiàn)出卓越的多模態(tài)理解與推理能力。這些模型采

?人工智能 ?視覺語言模型 ?Kimi-VL
騰訊“物種之眼”AI全新升級高效識別數(shù)千物種

AI系統(tǒng)“物種類辨”通過少量數(shù)據(jù)學(xué)習(xí)，顯著提升了對多種生物的識別準(zhǔn)確率與召回率，尤其在高精度識別多類生物方面表現(xiàn)出色，推動(dòng)生態(tài)保護(hù)與智能技術(shù)發(fā)展。騰訊開放平臺(tái)“野生生物多態(tài)數(shù)據(jù)協(xié)作”項(xiàng)目助力野生動(dòng)物監(jiān)測及保護(hù)工作，促進(jìn)公眾科學(xué)參與。

?雪豹 ?物種保護(hù) ?AI技術(shù)

熱文

3 天
7天

站長商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM