11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務(wù)器首年1.8折起,買1年送3個(gè)月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享??靵?lái)騰訊云選購(gòu)吧!
近日,蘋果公司推出了300億參數(shù)的多模態(tài)AI大模型MM1.5,該版本是在前代MM1的架構(gòu)基礎(chǔ)上發(fā)展來(lái)的。該模型繼續(xù)遵循數(shù)據(jù)驅(qū)動(dòng)的訓(xùn)練原則,著重探究在不同訓(xùn)練周期中混合各類數(shù)據(jù)對(duì)模型性能產(chǎn)生的影響,相關(guān)模型文檔已在HuggingFace上發(fā)布。盡管MM1.5模型在多項(xiàng)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,但蘋果團(tuán)隊(duì)仍計(jì)劃通過(guò)進(jìn)一步融合文本、圖像和用戶交互數(shù)據(jù),并設(shè)計(jì)更復(fù)雜的架構(gòu),來(lái)提升模型對(duì)移動(dòng)設(shè)備UI的理解能力,從讓蘋果牌”AI更強(qiáng)大。
谷歌AI團(tuán)隊(duì)最近發(fā)布了一項(xiàng)名為MUSCATEL的全新時(shí)間感知框架,旨在對(duì)抗概念漂移問(wèn)題,提升圖像識(shí)別準(zhǔn)確率。概念漂移一直是機(jī)器學(xué)習(xí)領(lǐng)域的難題,即數(shù)據(jù)分布隨時(shí)間變化,影響模型持續(xù)有效性。谷歌發(fā)布的MUSCATEL方法為機(jī)器學(xué)習(xí)領(lǐng)域的概念漂移問(wèn)題提供了一種創(chuàng)新的解決方案,為模型在大規(guī)模、動(dòng)態(tài)數(shù)據(jù)集中持續(xù)準(zhǔn)確地進(jìn)行分類提供了新的思路和方法。
Anthropic公司近期宣布計(jì)劃為其聊天機(jī)器人Claude增加圖像識(shí)別功能,從使其具備分析圖像的能力。Anthropic的開(kāi)發(fā)團(tuán)隊(duì)正在致力于賦予Claude分析圖像的能力,這是Claude相對(duì)于競(jìng)爭(zhēng)對(duì)手ChatGPT和Bard所缺乏的特性之一。隨著人工智能技術(shù)的不斷發(fā)展,我們可以期待更多類似的創(chuàng)新,推動(dòng)整個(gè)行業(yè)不斷向前發(fā)展。
2024年1月18日凌晨,三星在舉辦了GalaxyAI全球新品發(fā)布會(huì),宣告GalaxyS24系列的登場(chǎng),應(yīng)用了谷歌Gemininano大模型共同迎接“GalaxyAI時(shí)代”的到來(lái)。除了這個(gè)模型,GalaxyS24的一些功能還受益于谷歌Imagen2模型,將文本到圖像的能力植入手機(jī)。S24、S24的起售價(jià)為115.5萬(wàn)韓元、135.3萬(wàn)韓元Ultra版則以169.84萬(wàn)韓元起售。
谷歌最新提出的自適應(yīng)計(jì)算模型,能夠提升圖像識(shí)別性能。自適應(yīng)計(jì)算是指ML統(tǒng)根據(jù)環(huán)境變化調(diào)整其行為的能力。他曾獲得了清華大學(xué)計(jì)算機(jī)系獲得碩士學(xué)位獲得了美國(guó)加利福尼亞大學(xué)伯克利分校計(jì)算機(jī)系獲得博士學(xué)位。
CIM是一個(gè)用于弱監(jiān)督實(shí)例分割的算法,旨在從具有弱標(biāo)簽的數(shù)據(jù)中挖掘完整的目標(biāo)實(shí)例。該項(xiàng)目提供了CIM算法的代碼實(shí)現(xiàn)。通過(guò)CIM,用戶可以在沒(méi)有完全標(biāo)注的數(shù)據(jù)集上進(jìn)行高效的實(shí)例分割任務(wù),提高工作效率并降低成本。
威聯(lián)通今天宣布推出了新一代AINASTS-AI642。TS-AI642采用了搭載6TOPSNPU的ARM8核處理器,非常適合于AI圖像識(shí)別和智能監(jiān)控應(yīng)用。企業(yè)可以實(shí)現(xiàn)海量存儲(chǔ)容量,以滿足長(zhǎng)期存儲(chǔ)和歸檔要求,同時(shí)實(shí)現(xiàn)投資回報(bào)率最大化。
微軟正在對(duì)Bing聊天中的圖像識(shí)別和視覺(jué)搜索功能進(jìn)行測(cè)試。這意味著您可以上傳一張圖片并在Bing聊天中就該圖片向它提問(wèn)。插件功能則是另一單獨(dú)的事項(xiàng),希望幾周內(nèi)開(kāi)始測(cè)試。
相信不少同學(xué)生活中都用過(guò)OCR技術(shù),小到一張手寫(xiě)筆記、紙質(zhì)發(fā)票、合同條款,大到一堆會(huì)議資料、一本書(shū)等,無(wú)論是手寫(xiě)的文字是印刷的中英文和其他語(yǔ)種,拿起手機(jī)相機(jī)拍一拍就能輕松識(shí)別提取出來(lái),成為可以復(fù)制和編輯的文本。OCR,即光學(xué)字符識(shí)別技術(shù)。文字載體為常見(jiàn)的紙質(zhì)文檔、書(shū)籍、論文、PPT等。
機(jī)器人法務(wù)應(yīng)用 DoNotPay,剛剛推出了一項(xiàng)名為 Photo Ninja 的新功能,旨在通過(guò)輕微地修改用戶照片,以使人工智能應(yīng)用程序無(wú)法辨識(shí)用戶的身份。DoNotPay 聲稱該功能可防止用戶在線上傳的照片被用于惡意目的,且一切都可自動(dòng)化完成。只需交納 3 美元的月費(fèi),即可在上傳照片給 DoNotPay 后、隱秘地?fù)饺肟勺屆娌孔R(shí)別工具產(chǎn)生困惑的信息。作為一種“對(duì)抗示例”,其利用了破壞 AI 行為的特殊手段。隨著人工智能角色的不斷發(fā)展、以及潛在