11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵眚v訊云選購吧!
歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容,聚焦開發(fā)者,助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、昆侖萬維開源SkyworkR1V視覺思維鏈推理模型昆侖萬維推出全球首個開源多模態(tài)推理模型SkyworkR1V,具有38億參數(shù),性能接近知名閉源模型DeepSeek-R1。該功能能夠快速分析過去48小時內(nèi)的熱點話題,用戶反饋積極,顯示出Grok在信息處理方面的強(qiáng)大實力。
據(jù)報道,月之暗面公司正式宣布推出其全新的SOTA模型k1.5多模態(tài)思考模型,在多模態(tài)推理和通用推理能力上都實現(xiàn)了突破。k1.5多模態(tài)思考模型具備多模態(tài)推理能力,能夠同時處理和分析來自不同模態(tài)的信息,如文本、圖像、聲音等,從提供更全面、更準(zhǔn)確的理解和知識。用戶在使用過程中如果發(fā)現(xiàn)模型切換按鈕,即可體驗這一全新升級的模型。
VQAScore是一個利用視覺問答模型來評估由文本提示生成的圖像質(zhì)量的新方法;GenAI-Bench是一個包含復(fù)雜文本提示的基準(zhǔn)測試集,用于挑戰(zhàn)和提升現(xiàn)有的圖像生成模型。兩個工具可以幫助研究人員自動評估AI模型的性能能通過選擇最佳候選圖像來實際改善生成的圖像。他的研究成果對視覺識別、自動駕駛、和人機(jī)交互等應(yīng)用產(chǎn)生了深遠(yuǎn)影響,是該領(lǐng)域極具影響力的科學(xué)家之一。
多模態(tài)大模型初創(chuàng)企業(yè)“智子引擎”宣布完成千萬元天使輪融資,旗下?lián)碛袇?shù)規(guī)模約150億的大模型“元乘象+ChatImg”,關(guān)注微信公眾號“元乘象”即可體驗。該模型的訓(xùn)練集主要包括圖文對數(shù)據(jù)和視覺問答數(shù)據(jù),已經(jīng)在圖文匹配、圖文檢索、圖像描述生成和文本描述生成等多個任務(wù)上進(jìn)行了訓(xùn)練,表現(xiàn)出了出色的多模態(tài)處理能力。文本描述生成能力使得該模型能夠基于輸入的