无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > OpenAI最新資訊  > 正文

    谷歌的野心:通用語音識別大模型已經(jīng)支持100+語言

    2023-03-08 15:27 · 稿源: 機器之心公眾號

    谷歌表示,推出通用語音模型(USM)是其未來支持1000種語言的關(guān)鍵一步。去年11月,谷歌宣布推出「1000種語言計劃」,旨在構(gòu)建一個機器學習 (ML) 模型,支持世界上使用最廣泛的1000種語言,從而為全球數(shù)十億人帶來更大的包容性。然而,其中一些語言的使用人數(shù)不到兩千萬,因此核心

    ......

    本文由站長之家合作伙伴自媒體作者“機器之心公眾號”授權(quán)發(fā)布于站長之家平臺,本平臺僅提供信息索引服務(wù)。由于內(nèi)容發(fā)布時間超過平臺更新維護時間,為了保證文章信息的及時性,內(nèi)容觀點的準確性,平臺將不提供完全的內(nèi)容展現(xiàn),本頁面內(nèi)容僅為平臺搜索索引使用。需閱讀完整內(nèi)容的用戶,請查看原文,獲取內(nèi)容詳情。

    舉報

    • 相關(guān)推薦
    • 1000萬上下文!新開源多模態(tài)大模型,單個GPU就能運行

      今年2月初,谷歌發(fā)布的Gemini2.0Pro支持200萬上下文,震驚了整個大模型領(lǐng)域。僅過了2個月,Meta最新開源的Llama4Scout就將上下文擴展至1000萬,整整提升了5倍開啟千萬級時代。根據(jù)實驗數(shù)據(jù)顯示,Llama4Behemoth在MMLUPro、GPQA、MATH-500等測試的數(shù)據(jù)比GPT-4.5、ClaudeSonnet3.7、Gemini2.0Pro更好。

    • 提升大模型自動修Bug能力 豆包正式開源首個多語言類SWE數(shù)據(jù)集

      今日,字節(jié)跳動豆包大模型團隊宣布,正式開源首個多語言類SWE數(shù)據(jù)集Multi-SWE-bench,可用于評估和提升大模型自動修Bug”能力。在SWE-bench基礎(chǔ)上,Multi-SWE-bench首次覆蓋Python之外的7種主流編程語言,是真正面向全棧工程”的評測基準。相比于以往聚焦Python的單語言任務(wù),Multi-SWE-bench更貼近現(xiàn)實中的多語言開發(fā)場景,也更能反映當前模型在自動化軟件工程”方向上的實際能力邊界。

    • 阿丘科技李嘉悅:大模型驅(qū)動的AI檢測范式變革——大模型、小模型、智能體的協(xié)同進化

      3月28日,由機器視覺產(chǎn)業(yè)聯(lián)盟主辦、慕尼黑展覽有限公司承辦的VisionChina2025機器視覺展在上海新國際博覽中心圓滿落幕。阿丘科技產(chǎn)品總監(jiān)李嘉悅在機器視覺及工業(yè)應(yīng)用研討會現(xiàn)場,圍繞“大模型驅(qū)動的AI檢測范式變革:大模型、小模型與智能體的協(xié)同進化”的主題,發(fā)表了精彩演講?!苯衲?,在這個快速變化的時代,我要補充一句:“AI工業(yè)視覺的格局正在加速變革,不會用大模型的將會被善用大模型的人淘汰。

    • 時空壺接入大語言模型,跨語言溝通已成翻譯的藝術(shù)

      在當今全球化浪潮中,跨語言溝通的需求如潮水般洶涌。從商務(wù)領(lǐng)域的跨國談判,到文化交流中的思想碰撞,高效、精準的語言翻譯成為關(guān)鍵橋梁。隨著技術(shù)的不斷發(fā)展與迭代,時空壺有望持續(xù)引領(lǐng)行業(yè)變革,推動全球交流合作邁向新的高度,真正實現(xiàn)跨越語言障礙,讓世界溝通無阻。

    • AI 大模型的困境:數(shù)據(jù)才是真正的“燃料”

      一旦掉入AI墳場,幻覺將永遠存在,噩夢才剛開始。最近有許多客戶在考慮上AI大模型一體機、AI私有化、AI大模型部署等項目,但小心進入AI大模型的墳場,在光鮮亮麗的背后,AI大模型也面臨著諸多困境,其中最為核心的問題便是數(shù)據(jù)。只有擁有高質(zhì)量、多樣化、易于管理的數(shù)據(jù),AI大模型才能發(fā)揮出其真正的潛力,為企業(yè)帶來更大的價值。

    • 合合信息發(fā)布“大模型加速器 2.0”,助力大模型跨越“幻覺”障礙

      近日,上海合合信息科技股份有限公司(簡稱“合合信息”)TextIn“大模型加速器 2.0”版本正式上線,憑借其多維度升級,為降低大模型“幻覺”風險、推動大模型精準應(yīng)用提供了強大助力。訓練數(shù)據(jù)是影響大模型“認知能力”的關(guān)鍵,合合信息“大模型加速器 2.0”基于領(lǐng)先的智能文檔處理技術(shù),從數(shù)據(jù)源頭入手,對復(fù)雜文檔的版式、布局和元素進行精準解析及結(jié)構(gòu)化處理,

    • 大模型時代的新燃料|標貝科技推出大規(guī)模擬真多風格語音合成數(shù)據(jù)集

      本文探討了人工智能語音交互領(lǐng)域的發(fā)展現(xiàn)狀與挑戰(zhàn)。文章指出,大模型技術(shù)驅(qū)動下語音交互應(yīng)用場景持續(xù)拓展,但面臨數(shù)據(jù)質(zhì)量、隱私合規(guī)等挑戰(zhàn)。當前語音大模型訓練需要TB至PB級數(shù)據(jù),而傳統(tǒng)數(shù)據(jù)供給模式難以滿足需求。合成數(shù)據(jù)作為真實數(shù)據(jù)的重要補充,能通過參數(shù)化生成機制規(guī)避隱私風險,突破傳統(tǒng)數(shù)據(jù)在多樣性和場景覆蓋上的局限性。國內(nèi)外科技企業(yè)已開始廣泛應(yīng)用合成數(shù)據(jù)訓練AI模型,如Meta的LLaMA3和微軟的Phi-4模型。標貝科技推出超大規(guī)模擬真多風格語音合成數(shù)據(jù)集,包含上萬小時數(shù)據(jù),覆蓋中英混合場景,支持情感合成、風格遷移等前沿任務(wù),為虛擬偶像、數(shù)字人等元宇宙場景提供實時語音生成方案。該數(shù)據(jù)集基于32kHz高保真采樣率技術(shù),在自然度、流暢度等方面達到行業(yè)領(lǐng)先水平。

    • 奔馳新款CLA接入豆包大模型

      4月22日,奔馳與火山引擎合作的首款國產(chǎn)純電車型CLA全球首發(fā)亮相。該車搭載奔馳自研MB.OS架構(gòu),接入火山引擎大模型,支持個性化智能交互體驗。智能系統(tǒng)可識別4種情緒并給予反饋,交互效率提升50%,喚醒僅需0.2秒。虛擬助手能解答百科問題并協(xié)助車輛功能設(shè)置。這是雙方繼2024年8月達成AI戰(zhàn)略合作后落地的首款量產(chǎn)車型,結(jié)合生成式AI和大數(shù)據(jù)技術(shù),為中國用戶打造更智能的用車體驗。

    • 迅雷一鍵即可完成大模型下載

      近日,迅雷為提升用戶使用體驗,讓用戶能夠更快更好地批量下載大模型所有文件,已針對大模型下載場景進行了優(yōu)化,并上線了新版本插件,下載迅雷客戶端且在瀏覽器安裝迅雷插件即可使用。值得一提的是,在使用迅雷該插件功能創(chuàng)建任務(wù)時,將同時創(chuàng)建相對應(yīng)的文件夾,下載完成后,所有文件都將在一個文件夾中,相比傳統(tǒng)瀏覽器——需要用戶逐個手動點擊下載圖標并?

    • 九為健康聯(lián)合華為云發(fā)布神農(nóng)中醫(yī)大模型智能體,解碼如何用大模型重構(gòu)“望聞問切”

      2025 年 4 月 11 日,在華為云生態(tài)大會上,浙江九為健康科技股份有限公司(以下簡稱"九為健康")正式發(fā)布基于華為云盤古大模型的"九為神農(nóng)中醫(yī)大模型智能體"。該解決方案依托AI技術(shù),系統(tǒng)性攻克中醫(yī)藥研發(fā)周期長、作用機制解析困難、個性化方案制定復(fù)雜等產(chǎn)業(yè)難題,通過智能化手段推動中醫(yī)藥現(xiàn)代化進程,為醫(yī)藥全產(chǎn)業(yè)鏈提供覆蓋研發(fā)、診療及健康管理的全流程智能服?