无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 原創(chuàng) > 關(guān)鍵詞  > 人工智能最新資訊  > 正文

    AI日報:百川智能金融大模型發(fā)布;ChatGPT新增跨對話記憶功能;DeepSeek大模型一開發(fā)者將加盟小米;OpenAI推理模型o3

    2024-12-23 15:20 · 稿源:站長之家

    歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應用。

    新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/

    1、OpenAI發(fā)布o3:AI 推理能力的重大突破,得分高達87.5%

    OpenAI最近推出了其最新的o-Model推理系列模型o3,標志著在數(shù)學和科學推理領(lǐng)域的重大進展。o3在ARC AGI基準測試中得分87.5%,顯示出其在解決復雜邏輯和數(shù)學問題方面的顯著能力提升。該模型結(jié)合了神經(jīng)符號學習與概率邏輯,能夠有效處理多步推理挑戰(zhàn),展現(xiàn)出在教育、醫(yī)療和軟件開發(fā)等多個領(lǐng)域的廣泛應用潛力。

    image.png

    【AiBase提要:】

    ?? o3在ARC AGI基準測試中得分87.5%,展現(xiàn)出顯著的推理能力提升。

    ?? 在高級數(shù)學測試中,o3的成功率達到96.7%,科學推理準確率提升10%。

    ?? o3的應用潛力廣泛,能夠在教育、醫(yī)療和軟件開發(fā)等領(lǐng)域提供實際支持。

    2、Adobe推新AI音頻具Sketch2Sound ,只需哼唱和模仿聲音就能創(chuàng)建音效

    Adobe Research與西北大學聯(lián)合推出的Sketch2Sound是一款創(chuàng)新的人工智能工具,旨在革新聲音設計師的工作流程。用戶可以通過哼唱、模仿聲音和簡單文本描述來生成專業(yè)音效。該系統(tǒng)分析音量、音色和音高,并結(jié)合文本生成所需聲音,特別適合Foley藝術(shù)家,提升影視音效的制作效率。

    【AiBase提要:】

    ?? Sketch2Sound是一個新開發(fā)的AI工具,能通過哼唱和文本描述來創(chuàng)建音效。

    ?? 該系統(tǒng)分析音量、音色和音高,將用戶的聲音輸入與文本結(jié)合生成目標音效。

    ?? 特別適合Foley藝術(shù)家使用,能夠快速生成影視音效,提升工作效率。

    詳情鏈接:https://hugofloresgarcia.art/sketch2sound/

    3、百川智能發(fā)布金融大模型Baichuan4-Finance

    百川智能最近發(fā)布了其全新的金融大模型Baichuan4-Finance,該模型通過創(chuàng)新的領(lǐng)域自約束訓練方案,在金融能力和通用能力上實現(xiàn)了雙重提升,顯著增強了在金融場景中的適用性。根據(jù)評測數(shù)據(jù),Baichuan4-Finance在多個金融領(lǐng)域的準確率均超越了競爭對手GPT-4o。

    image.png

    【AiBase提要:】

    ?? Baichuan4-Finance通過領(lǐng)域自約束訓練方案,提升金融和通用能力。

    ?? 在多個評測中,Baichuan4-Finance的整體準確率達到93.62%,領(lǐng)先GPT-4o近20%。

    ?? 該模型在銀行、保險、基金和證券等領(lǐng)域的準確率均突破95%。

    詳情鏈接:https://platform.baichuan-ai.com/finPage

    4、清華大學聯(lián)合騰訊出品!ColorFlow:自動給黑白漫畫上色,保持角色一致性

    ColorFlow是清華大學與騰訊ARC實驗室聯(lián)合研發(fā)的新型圖像序列上色模型,旨在解決黑白圖像上色時角色身份一致性的問題。該模型通過雙分支設計和創(chuàng)新的檢索增強上色管道,顯著提升了上色效果與效率。ColorFlow在多個指標上超越了現(xiàn)有先進模型,展現(xiàn)出更高的美學質(zhì)量,適用于黑白漫畫、線條藝術(shù)等多種藝術(shù)場景。

    image.png

    【AiBase提要:】

    ?? ColorFlow是創(chuàng)新的黑白圖像序列上色模型,能夠保持角色身份一致性。

    ?? 該模型采用雙分支設計,分別用于色彩身份提取和實際上色,提升了上色的效果和效率。

    ?? ColorFlow在多項指標上超越了現(xiàn)有的先進模型,展現(xiàn)出更高的美學質(zhì)量和實用性。

    詳情鏈接:https://zhuang2002.github.io/ColorFlow/

    5、CAP4D:上傳參考圖即可生成高質(zhì)量4D角色頭像

    CAP4D模型是一項革命性的技術(shù),能夠通過任意數(shù)量的參考圖像生成高質(zhì)量的4D頭像。該模型采用雙階段工作流程,首先生成不同視角和表情的圖像,然后結(jié)合參考圖像重建可實時控制的4D頭像。通過使用先進的面部追蹤技術(shù)和隨機采樣的方式,CAP4D顯著提升了圖像重建效果和細節(jié)呈現(xiàn)。

    image.png

    【AiBase提要:】

    ?? CAP4D模型通過任意數(shù)量的參考圖像生成高質(zhì)量的4D頭像,采用雙階段工作流程。

    ??? 該技術(shù)可以生成多種不同視角的頭像,顯著提高了圖像重建效果和細節(jié)呈現(xiàn)。

    ?? CAP4D與語音驅(qū)動動畫模型相結(jié)合,實現(xiàn)音頻驅(qū)動的動態(tài)頭像,拓展了虛擬頭像的應用場景。

    6、OpenAI推出ChatGPT新記憶功能:能跨對話回憶用戶交流

    OpenAI最近推出了一項全新的記憶功能,使得其AI助手ChatGPT能夠在用戶開啟新對話時回憶起以往的交流內(nèi)容。這一更新旨在提升用戶體驗,允許用戶全面管理自己的記憶設置,包括刪除或歸檔特定信息。與此類似,谷歌也加快了其聊天機器人Gemini的記憶功能的推出,顯示出AI行業(yè)在個性化服務方面的持續(xù)努力。

    image.png

    【AiBase提要:】

    ?? OpenAI推出新記憶功能,ChatGPT可跨對話回憶用戶過往交流。

    ?? 用戶可隨時管理記憶設置,刪除或歸檔特定信息。

    ?? 谷歌也推出類似功能,旨在提升AI助手的個性化服務。

    7、震驚!你的AI聊天對象竟然偷偷學會了“讀心術(shù)”!—— INFP帶你解鎖雙人對話新姿勢

    INFP技術(shù)的出現(xiàn),標志著AI虛擬頭像在雙人對話中的互動能力得到了質(zhì)的飛躍。通過模仿人類的表情和動作,INFP使得虛擬角色能夠在對話中展現(xiàn)出真實的互動,仿佛與真人交流。其背后的技術(shù)創(chuàng)新,不僅提升了用戶體驗,也為未來的AI對話系統(tǒng)提供了新的可能性。

    image.png

    【AiBase提要:】

    ?? INFP技術(shù)通過模仿人類的表情和動作,提升了AI虛擬頭像的互動能力。

    ?? 該技術(shù)利用音頻分析,動態(tài)調(diào)整AI頭像的狀態(tài),實現(xiàn)自然流暢的對話。

    ?? DyConv數(shù)據(jù)集為INFP提供了豐富的對話素材,確保學習效果和表現(xiàn)的優(yōu)越性。

    詳情鏈接:https://grisoon.github.io/INFP/

    8、DeepSeek開源大模型開發(fā)者之一羅福莉?qū)⒓用诵∶?/strong>

    羅福莉,DeepSeek-V2的關(guān)鍵開發(fā)者,近期宣布加入小米,擔任AI實驗室的領(lǐng)導,負責大模型團隊的建設。此舉引發(fā)廣泛關(guān)注,尤其是在小米加大大模型領(lǐng)域布局的背景下。羅福莉擁有北京大學的碩士學位,并在自然語言處理領(lǐng)域表現(xiàn)突出,曾在阿里巴巴達摩院任職,參與多語言預訓練模型的開發(fā)。

    【AiBase提要:】

    ?? 羅福莉?qū)⒓用诵∶?,領(lǐng)導AI實驗室的大模型團隊。

    ?? 雷軍對小米在AI大模型領(lǐng)域的發(fā)展表示擔憂,并高薪挖人。

    ?? 小米AI實驗室已經(jīng)設立專門團隊,致力于推動大模型技術(shù)的發(fā)展。

    9、AI終于邁過這道檻!Livekit 開源模型精準識別“你是否說完”!

    在語音助手和客服機器人領(lǐng)域,如何準確判斷用戶是否說完一直是個難題。Livekit推出的開源精準語音輪次檢測模型,通過結(jié)合Transformer模型與傳統(tǒng)語音活動檢測,顯著提升了人機對話的自然度與流暢性。該模型能夠減少AI的錯誤打斷,提升用戶體驗,未來有望使人機對話更加智能和自然。

    【AiBase提要:】

    ?? 結(jié)合Transformer和傳統(tǒng)VAD技術(shù),提升語音輪次檢測的準確性。

    ?? 新模型減少AI的錯誤打斷率達85%,使人機對話更加自然。

    ?? 演示視頻展示AI耐心等待用戶說完,提升交互體驗。

    詳情鏈接:https://github.com/livekit/agents/tree/main/livekit-plugins/livekit-plugins-turn-detector

    10、李飛飛團隊前瞻性研究 多模態(tài)AI模型初顯空間智能

    斯坦福大學教授李飛飛及其團隊的研究揭示了多模態(tài)大模型在空間智能方面的初步能力,展示了它們在記憶和回憶空間的潛力。研究開發(fā)了VSI-Bench工具,評估視覺空間智能,盡管模型表現(xiàn)仍低于人類,但在某些任務上已接近人類水平。

    image.png

    【AiBase提要:】

    ??? 研究團隊推出VSI-Bench工具,評估視覺空間智能,包含5000多個高質(zhì)量問答對。

    ?? 多模態(tài)模型在某些任務上已接近人類水平,Gemini-1.5Pro在房間大小估計任務中表現(xiàn)突出。

    ?? 李飛飛創(chuàng)辦的World Labs專注于開發(fā)具備空間智能的AI模型,已獲得多家知名機構(gòu)投資。

    11、特朗普正式任命白宮AI政策高級顧問

    近日,美國前總統(tǒng)唐納德?特朗普確認Sriram Krishnan擔任白宮科技政策辦公室的人工智能高級政策顧問。Krishnan曾是Andreessen Horowitz的合伙人,將負責協(xié)調(diào)政府的AI政策,并與前PayPal首席運營官David Sacks合作。

    image.png

    【AiBase提要:】

    ?? Sriram Krishnan被任命為特朗普的人工智能政策高級顧問,負責協(xié)調(diào)政府的AI政策。

    ?? 他將與前PayPal首席運營官David Sacks合作,共同推動AI和加密貨幣相關(guān)政策。

    ?? Krishnan曾在多家知名科技公司擔任領(lǐng)導職務,并在《紐約時報》中分享了對AI趨勢的看法。

    12、閃極AI拍拍鏡宣布預售售罄:999元5萬臺一天搶光

    閃極科技最近推出了其首款AI拍拍鏡,標志著國內(nèi)AI拍攝眼鏡領(lǐng)域的重要進展。該產(chǎn)品以1499元的價格上市,首批5萬臺以999元的優(yōu)惠價迅速售罄,顯示出市場的熱烈反響。此外,閃極還推出了一個吸引人的促銷活動,用戶在300天內(nèi)打卡200天可獲得全額退款。

    image.png

    【AiBase提要:】

    ?? 這款AI拍拍鏡售價1499元,首批5萬臺以999元的優(yōu)惠價售罄,顯示出強勁的市場需求。

    ?? 用戶在300天內(nèi)打卡200天可獲得全額退款,增加了產(chǎn)品的吸引力。

    ?? 該眼鏡搭載索尼1600萬像素攝像頭,支持多種智能功能,提供豐富的用戶體驗。

    舉報

    • 相關(guān)推薦
    • 奧特曼:ChatGPT不是AGI!OpenAI最強開源模型直擊DeepSeek

      【新智元導讀】代碼截圖泄露,滿血版o3、o4-mini鎖定下周!更勁爆的是,一款據(jù)稱是OpenAI的神秘模型一夜爆紅,每日處理高達260億token,是Claude用量4倍。奧特曼在TED放話:將推超強開源模型,直面DeepSeek挑戰(zhàn)。持續(xù)的創(chuàng)新、豐富的資源和智能AI將會無縫融入日常生活,未來一代人將會覺得當前人們又辛苦又落后。

    • IQ 過AI 模型名單發(fā)布ChatGPT、Deepseek等上榜

      人工智能IQ哪家強?o3 智商高達 132、Gemini 2.5 Pro Exp. 拿下 128 分、Claude 憑借 3.7 Sonnet Extended 位列第四、Deepsee R 1……

    • 超過ChatGPTDeepseek?谷歌發(fā)布 Gemini 2.5 Flash AI 模型

      新版AI模型縮短了響應時間,節(jié)約了運算成本;還推出了新的AI芯片“Ironwood”。谷歌發(fā)布了新的AI模型“Gemini2.5Flash”,據(jù)稱,這款AI模型的性能比OpenAI和DeepSeek的AI產(chǎn)品“更高效”。谷歌計劃在三星今年上半年推出的AI伴侶機器人Ballie上搭載生成式AI模型。

    • DeepSeek+物流行業(yè),AI大模型破解五大場景效能困局

      文章探討了AI大模型在物流行業(yè)的應用現(xiàn)狀與挑戰(zhàn)。以DeepSeek為代表的AI技術(shù)正通過重構(gòu)業(yè)務流程、優(yōu)化資源配置、提升決策效率等方式,成為推動行業(yè)降本增效的核心引擎。但成功應用AI大模型需要企業(yè)具備數(shù)字化基礎、業(yè)務流程標準化和數(shù)據(jù)治理能力,而非簡單技術(shù)堆砌。G7+易流梳理出五大核心應用場景:工作效能輔助、經(jīng)營數(shù)據(jù)分析、安全審查、智能客服和知識管理。這些

    • 媲美OpenAI-o3,剛剛開源模型DeepCoder,訓練方法、數(shù)據(jù)集大公開

      今天凌晨4點,著名大模型訓練平臺TogetherAI和智能體平臺Agentica,聯(lián)合開源了新模型DeepCoder-14B-Preview。該模型只有140億參數(shù),但在知名代碼測試平臺LiveCodeBench的測試分為60.6%,高于OpenAI的o1模型,略低于o3-mini。TogetherAI剛獲得3.05億美元的B輪融資,其估值也從去年的12.5億美元翻倍至33億美元。

    • AI日報度大招!發(fā)布文心大模型X1Turbo和AI開放計劃;OpenAI免費開放輕量版Deep Research;即夢視頻3.0內(nèi)測

      【AI日報】主要報道了AI領(lǐng)域的最新動態(tài):1)百度發(fā)布文心大模型X1Turbo和4.5Turbo,性能價格優(yōu)勢顯著;2)百度推出AI開放計劃,降低開發(fā)者門檻;3)OpenAI免費開放輕量版Deep Research研究工具;4)即夢視頻3.0內(nèi)測展示流暢運鏡和精準表情捕捉能力;5)百度發(fā)布全球首個內(nèi)容操作系統(tǒng)"滄舟OS";6)百度文庫與網(wǎng)盤聯(lián)合推出GenFlow超能搭子和AI筆記工具;7)Pixverse推出MCP協(xié)議簡化AI視頻創(chuàng)作;8)Tavus發(fā)布突破性唇形同步模型Hummingbird-0;9)豆包1.5深度思考模型上線,提供免費額度;10)Adobe整合OpenAI和Google模型升級Firefly創(chuàng)意平臺;11)ImageSlider2.0即將加入Gradio核心產(chǎn)品線;12)李彥宏談DeepSeek現(xiàn)存痛點,強調(diào)多模態(tài)能力與降本需求。

    • DeepSeek領(lǐng)航大模型普惠化浪潮,xAI/微美全息加速開源AI布局打造新格局

      DeepSeek 作為當前最受關(guān)注的大模型之一,憑借其技術(shù)創(chuàng)新正在加速 AI 普惠化進程。根據(jù)機構(gòu)新報告顯示,DeepSeek已經(jīng)成為全球增長最快的AI工具,其每月新增網(wǎng)站訪問量已經(jīng)超過OpenAI的ChatGPT。DeepSeek市場份額全球第三目前,DeepSeek市場份額6.58%,僅次于ChatGPT和Canva。DeepSeek是繼ChatGPT之后的又一現(xiàn)象級AI產(chǎn)品,它的市場份額從2.34%快速增長至6.58%,展現(xiàn)出強勁的增長態(tài)勢。全球著名?

    • DeepSeek上新!開源發(fā)布DeepSeek-Prover-V2-671B新模型

      快科技4月30日消息,今日,DeepSeek 今日在 AI 開源社區(qū) Hugging Face 發(fā)布了一個名為 DeepSeek-Prover-V2-671B 的新模型。據(jù)介紹,DeepSeek-Prover-V2-671B 其參數(shù)量達到6710億,使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多種計算精度,方便模型更快、更省資源地訓練和部署。在模型架構(gòu)上,該模型使用了DeepSeek-V3架構(gòu),采用MoE(混合專家)模式,具有61層Transformer層,7168維隱藏層。同時支持超長上下文,最大位置嵌入達163840,使其能處理復雜的數(shù)學證明,并且采用了FP8量化,可通過量化技術(shù)減小模型大小,提

    • 國產(chǎn)六大推理模型激戰(zhàn)OpenAI?

      2025年春節(jié)前夕,DeepSeek-R1模型發(fā)布,標志著中國AI進入推理模型新時代。文章梳理了國產(chǎn)大模型發(fā)展歷程:從2022年ChatGPT引發(fā)國內(nèi)追趕OpenAI熱潮,到2023年"百模大戰(zhàn)",再到2024年"AI六小虎"格局形成。重點分析了六大國產(chǎn)推理模型(DeepSeek、百度、阿里、科大訊飛、字節(jié)、騰訊)的技術(shù)特點與市場表現(xiàn),指出國產(chǎn)模型在性能上已接近GPT-4水平。特別強調(diào)科大訊飛星火X1憑借全國產(chǎn)化技術(shù)路線獲得政企青睞,以及DeepSeek-R1以560萬美元超低成本實現(xiàn)高性能的突破。文章還探討了英偉達芯片斷供危機下,國產(chǎn)全棧技術(shù)路徑的重要性,認為自主可控將成為對抗國際不確定性的關(guān)鍵。最后指出,隨著推理模型成為競爭焦點,國產(chǎn)大模型正從技術(shù)追隨轉(zhuǎn)向自主創(chuàng)新階段。

    • Llama 4大模型跌落神壇:作弊刷榜、代碼能力極差、和DeepSeek比就是偽開源

      被寄予厚望的美國Meta公司的最新開源大模型Llama4發(fā)布不到2天時間,口碑急轉(zhuǎn)直下,被質(zhì)疑為刷榜作弊實際效果差、開源條件多部署門檻高是偽開源等。大模型評測平臺LMArena親自下場發(fā)文,打臉Meta提供給平臺的Llama4是“特供版”。Meta若繼續(xù)在商業(yè)控制與技術(shù)開放之間搖擺,恐將在AI競賽中進一步失去開發(fā)者支持。