无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > AI大模型最新資訊  > 正文

    AI可以幫你做作業(yè)、寫小說(shuō)……但卻栽在了“看時(shí)間”上!

    2025-03-17 10:37 · 稿源:站長(zhǎng)之家

    image.png

    AI模型很強(qiáng)大,但它們卻在極其簡(jiǎn)單的任務(wù)上栽了跟頭!

    站長(zhǎng)之家(ChinaZ.com) 3月17日 消息:如今,人工智能能夠生成栩栩如生的圖像、寫小說(shuō)、幫你完成家庭作業(yè),甚至還能預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)。然而,一項(xiàng)新的研究卻表明,它在一項(xiàng)非?;A(chǔ)的任務(wù)上常常栽跟頭 —— 看時(shí)間。

    愛丁堡大學(xué)的研究人員測(cè)試了七款知名的多模態(tài)大言模型的“識(shí)時(shí)”能力 —— 讓它們根據(jù)不同的時(shí)鐘或日歷圖像回答與時(shí)間相關(guān)問(wèn)題。

    他們的研究將于 4 月正式發(fā)表,不過(guò),目前已經(jīng)在科研共享平臺(tái) arXiv 上發(fā)布了,該研究表明,這些大型語(yǔ)言模型在這種基礎(chǔ)任務(wù)上“變成智障”了。

    研究人員在研究中寫道:“從視覺輸入中解讀時(shí)間并進(jìn)行推理的能力,對(duì)于許多現(xiàn)實(shí)世界的應(yīng)用至關(guān)重要 —— 從事件安排到自動(dòng)駕駛系統(tǒng)等領(lǐng)域皆是如此。盡管多模態(tài)大語(yǔ)言模型(MLLMs)取得了進(jìn)展,但大多數(shù)研究工作都集中在目標(biāo)檢測(cè)、圖像描述或場(chǎng)景理解等方面,對(duì)時(shí)間推理的探索仍不夠充分?!?/p>

    本次測(cè)試的對(duì)象包括 OpenAI 的 GPT-4o 和 GPT-o1、谷歌 DeepMind 的 Gemini 2.0、Anthropic 的 Claude 3.5 Sonnet、Meta 的 Llama 3.2-11B-Vision-Instruct、阿里的 Qwen2-VL7B-Instruct、以及 ModelBest 的 MiniCPM-V-2.6。研究人員向這些模型輸入了不同的模擬時(shí)鐘圖片(這些圖片中的時(shí)鐘或帶有羅馬數(shù)字、或有不同的表盤顏色,有些則沒有指針)、以及十年來(lái)的日歷圖片等。

    AI chatGPT 人工智能

    向這些大模型上傳時(shí)鐘圖片的同時(shí),還會(huì)提出問(wèn)題:上傳圖片中的時(shí)鐘顯示的時(shí)間是多少?而對(duì)于日歷的圖片,研究人員則會(huì)提出一些簡(jiǎn)單的問(wèn)題,比如:元旦是星期幾?以及一些較難的問(wèn)題,諸如:一年中的第 153 天是哪一天?

    “讀取模擬時(shí)鐘的時(shí)間和理解日歷涉及到復(fù)雜的認(rèn)知步驟”,研究人員解釋說(shuō),“這需要進(jìn)行精細(xì)的視覺識(shí)別(例如,時(shí)鐘指針的位置、日期單元格的布局),以及不簡(jiǎn)單的數(shù)值推理(例如,計(jì)算日期偏移量)”

    總而言之,這些AI模型的表現(xiàn)很不理想 —— 它們正確讀取模擬時(shí)鐘時(shí)間的概率不到 25%。研究人員表示,無(wú)論是帶有羅馬數(shù)字和風(fēng)格化指針的時(shí)鐘,還是沒有指針的時(shí)裝,它們的表現(xiàn)都不甚理想。

    在最終的測(cè)試結(jié)果中,谷歌的Gemini 2.0 在時(shí)鐘測(cè)試中表現(xiàn)最 好,而 GPT-o1 在日歷任務(wù)上準(zhǔn)確率為 80% —— 比競(jìng)爭(zhēng)對(duì)手都要好。這也意味著, 即使最出色的AI大模型,錯(cuò)誤率也高達(dá) 20%。

    這項(xiàng)研究的共同作者、愛丁堡大學(xué)信息學(xué)院的博士生 Rohit Saxena 在一份學(xué)校聲明中表示:“大多數(shù)人從小就會(huì)看時(shí)間和日歷。我們的研究結(jié)果凸顯了 AI 在執(zhí)行對(duì)人類來(lái)說(shuō)相當(dāng)基礎(chǔ)的技能方面存在的顯著差距。如果要將 AI 系統(tǒng)成功集成到對(duì)時(shí)間敏感的現(xiàn)實(shí)世界應(yīng)用中,比如日程安排、自動(dòng)化和輔助技術(shù)等領(lǐng)域,就必須解決這些不足?!?/p>

    所以,AI 或許能夠幫你完成家庭作業(yè),但別指望它能按時(shí)完成任務(wù),至少現(xiàn)在還是這樣。

    舉報(bào)

    • 相關(guān)推薦
    • 北京鳴醫(yī)智造丁陽(yáng)談醫(yī)美安全:黑醫(yī)美騙局,都栽在“信息盲區(qū)”

      在社交平臺(tái)濾鏡與 “顏值經(jīng)濟(jì)” 的裹挾下,醫(yī)療美容成為越來(lái)越多人的選擇;然而,黑醫(yī)美市場(chǎng)的亂象卻如影隨形:1.“美容院秒變醫(yī)美診所”:小區(qū)里的生活美容院掛起“微整中心”招牌,無(wú)證醫(yī)師用牙簽比劃著設(shè)計(jì)雙眼皮,玻尿酸針劑從三無(wú)包裝盒里拆出,這類未經(jīng)審批的“黑機(jī)構(gòu)”占比超30%,消毒不規(guī)范、操作失誤等常導(dǎo)致感染、毀容甚至失明。2.“朋友圈微整大師”?

    • 業(yè)該如何注冊(cè)香港公司?小貿(mào)出海來(lái)幫你

      美國(guó)對(duì)華加征關(guān)稅力度持續(xù)升級(jí),稅率已提高至125%,給多國(guó)企業(yè)帶來(lái)沉重負(fù)擔(dān)。

    • 程序員危!微軟CEO納德拉:公司高達(dá)30%代碼是AI

      微軟CEO納德拉在Meta的LlamaCon大會(huì)上透露,微軟代碼庫(kù)中20%-30%的代碼由AI生成,其中Python應(yīng)用進(jìn)展最快,C語(yǔ)言相對(duì)較慢。微軟CTO凱文·斯科特預(yù)測(cè)到2030年,95%代碼將由AI生成。谷歌CEO皮查伊也表示,谷歌超30%代碼由AI生成。Meta CEO扎克伯格則未透露具體數(shù)據(jù)。由于缺乏統(tǒng)一的AI代碼衡量標(biāo)準(zhǔn),這些數(shù)據(jù)僅供參考。(140字)

    • 爸爸模仿一年級(jí)兒子寫作業(yè) 網(wǎng)友:太真實(shí) 血壓飆升

      網(wǎng)絡(luò)上一段視頻引發(fā)眾多網(wǎng)友關(guān)注與討論。一位來(lái)自江蘇的爸爸生動(dòng)地模仿起自家一年級(jí)兒子寫作業(yè)時(shí)的模樣。不少網(wǎng)友在觀看視頻后紛紛表示,這簡(jiǎn)直就是自家孩子寫作業(yè)時(shí)的真實(shí)寫照,仿佛看到了自家娃坐在書桌前磨磨蹭蹭、愁眉苦臉的樣子,代入感極強(qiáng),甚至有網(wǎng)友調(diào)侃說(shuō),看著視頻里爸爸的模樣,自己的血壓都跟著升高了。

    • 300元一學(xué)期,誰(shuí)在教縣城老人AI“prompt”

      我回了一趟湖北老家。只見媽媽急匆匆地出了門,丟下一句:“老年大學(xué)的AI課要趕不及了!”啥?老年大學(xué)已經(jīng)這么緊跟時(shí)代了?連我們這個(gè)三線城市都開上了AI課?我的媽媽是一名非常善于使用智能手機(jī)的退休人士,很多APP甚至用得比我都順溜。在AI時(shí)代,老年人也會(huì)面臨跟年輕人一樣,甚至更復(fù)雜的技術(shù)衍生問(wèn)題。

    • 第 一批年輕人已經(jīng)用AI創(chuàng)業(yè)了,AI應(yīng)用師成新型職業(yè)

      “比如我要做一個(gè)特效場(chǎng)景,以前需要3D建模搭一個(gè)景,現(xiàn)在一句話輸入進(jìn)去,AI馬上就能生成?!睖鼐S斯接受記者采訪時(shí)說(shuō),他已經(jīng)把AI當(dāng)成一項(xiàng)事業(yè),正式用可靈AI開始創(chuàng)業(yè)了。隨著技術(shù)加速迭代以及算力成本不斷下降,視頻大模型技術(shù)應(yīng)用的門檻和成本將實(shí)現(xiàn)“雙降”,進(jìn)將帶動(dòng)國(guó)產(chǎn)視頻大模型規(guī)?;褂?。

    • 時(shí)空AI專家路新江:用創(chuàng)新時(shí)間序列編織智慧未來(lái)

      文章介紹了時(shí)空AI技術(shù)在智慧城市建設(shè)中的創(chuàng)新應(yīng)用。通過(guò)分析歷史交通數(shù)據(jù),AI能提前15分鐘預(yù)測(cè)主干道擁堵節(jié)點(diǎn),并與智能信號(hào)燈協(xié)同優(yōu)化通行效率;在地質(zhì)監(jiān)測(cè)站,毫米級(jí)土壤位移數(shù)據(jù)被轉(zhuǎn)化為時(shí)間序列,AI模型能提前40分鐘預(yù)警滑坡災(zāi)害;在城市規(guī)劃方面,AI結(jié)合人口遷徙和衛(wèi)星數(shù)據(jù),可模擬20年后城區(qū)擴(kuò)展形態(tài)。中國(guó)學(xué)者路新江提出創(chuàng)新性D3VAE框架,結(jié)合能量模型和變分自編碼器,首創(chuàng)"生成式時(shí)序預(yù)測(cè)"模式,顯著提升預(yù)測(cè)性能。他還開發(fā)了基于大語(yǔ)言模型的Table-to-Text方法,推動(dòng)結(jié)構(gòu)化數(shù)據(jù)處理。這些技術(shù)已應(yīng)用于雄安新區(qū)規(guī)劃、風(fēng)力發(fā)電預(yù)測(cè)等多個(gè)領(lǐng)域,為城市數(shù)字化轉(zhuǎn)型提供重要支撐。

    • RK首款AI四模機(jī)械鍵盤來(lái)襲!一機(jī)多用超進(jìn)化,讓時(shí)間更自由

      2025年4月6日,RK正式發(fā)布首款A(yù)I四模機(jī)械鍵盤。作為行業(yè)革新產(chǎn)品,R87PROAI四模機(jī)械鍵盤以Deepseek-R1智能模型為核心,構(gòu)建起辦公智能生態(tài)全場(chǎng)景,突破傳統(tǒng)機(jī)械鍵盤局限,打破辦公與電競(jìng)之間的壁壘,實(shí)現(xiàn)一機(jī)多用。首發(fā)價(jià)299元起,關(guān)注抖音[RK電腦外設(shè)旗艦店]有更多直播福利獨(dú)家放送,4月10日20:00,不見不散!

    • 特朗普發(fā)動(dòng)的“關(guān)稅戰(zhàn)”,開始波及美國(guó)的 AI 業(yè)了!

      由于特朗普發(fā)動(dòng)的“關(guān)稅戰(zhàn)爭(zhēng)”,AI數(shù)據(jù)中心的建設(shè)成本將急劇增加。全球云服務(wù)領(lǐng)域的三大巨頭企業(yè)在世界各地積極競(jìng)爭(zhēng)建立數(shù)據(jù)中心,如今,人們?cè)絹?lái)越擔(dān)心這些企業(yè)會(huì)將不斷攀升的成本轉(zhuǎn)嫁給消費(fèi)者,或?qū)е峦顿Y縮減。AI行業(yè)相關(guān)人士表示:“特朗普試圖強(qiáng)化美國(guó)AI競(jìng)爭(zhēng)力的構(gòu)想,因他自己的關(guān)稅政策受到了阻礙。

    • 如何利用AI提升營(yíng)銷效率和銷售轉(zhuǎn)化率?企業(yè)如何把握AI這一歷史性機(jī)遇?塵鋒AI智能體助力企業(yè)破局增長(zhǎng)焦慮

      各行各業(yè)都在積極擁抱數(shù)字化浪潮,隨著ChatGPT、DeepSeek等AI技術(shù)的快速發(fā)展,正推動(dòng)著企業(yè)變革經(jīng)營(yíng)管理思路,以應(yīng)對(duì)AI時(shí)代的機(jī)遇與挑戰(zhàn)。企業(yè)該如何在AI驅(qū)動(dòng)的產(chǎn)業(yè)變革中,加速提升企業(yè)的數(shù)字化能力和水平,利用技術(shù)升級(jí)賦能業(yè)務(wù)模式,把握AI技術(shù)發(fā)展這一歷史性機(jī)遇?此前,隨著市場(chǎng)環(huán)境變化,許多管理者都十分焦慮:市場(chǎng)競(jìng)爭(zhēng)愈加激烈,業(yè)務(wù)成本居高不下,利潤(rùn)空間更是被不斷壓縮,在過(guò)去很長(zhǎng)一段時(shí)間,對(duì)于企業(yè)管理者來(lái)說(shuō),「降本增效」已經(jīng)是老生常談。如果您在2025年希望盡快擁抱AI新技術(shù),提高企業(yè)的競(jìng)爭(zhēng)力與增長(zhǎng)效率,不妨了解下塵鋒。