无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<sub id="c0prw"><tr id="c0prw"></tr></sub><samp id="c0prw"><b id="c0prw"></b></samp><th id="c0prw"><rt id="c0prw"><acronym id="c0prw"></acronym></rt></th>

<em id="c0prw"></em>

<ul id="c0prw"><b id="c0prw"></b></ul>

<menu id="c0prw"></menu>

<ul id="c0prw"><b id="c0prw"></b></ul>

AI可以幫你做作業(yè)、寫小說(shuō)……但卻栽在了“看時(shí)間”上！

2025-03-17 10:37 · 稿源：站長(zhǎng)之家

AI模型很強(qiáng)大，但它們卻在極其簡(jiǎn)單的任務(wù)上栽了跟頭！

站長(zhǎng)之家(ChinaZ.com) 3月17日消息:如今，人工智能能夠生成栩栩如生的圖像、寫小說(shuō)、幫你完成家庭作業(yè)，甚至還能預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)。然而，一項(xiàng)新的研究卻表明，它在一項(xiàng)非?；A(chǔ)的任務(wù)上常常栽跟頭 —— 看時(shí)間。

愛丁堡大學(xué)的研究人員測(cè)試了七款知名的多模態(tài)大言模型的“識(shí)時(shí)”能力 —— 讓它們根據(jù)不同的時(shí)鐘或日歷圖像回答與時(shí)間相關(guān)問(wèn)題。

他們的研究將于 4 月正式發(fā)表，不過(guò)，目前已經(jīng)在科研共享平臺(tái) arXiv 上發(fā)布了，該研究表明，這些大型語(yǔ)言模型在這種基礎(chǔ)任務(wù)上“變成智障”了。

研究人員在研究中寫道：“從視覺輸入中解讀時(shí)間并進(jìn)行推理的能力，對(duì)于許多現(xiàn)實(shí)世界的應(yīng)用至關(guān)重要 —— 從事件安排到自動(dòng)駕駛系統(tǒng)等領(lǐng)域皆是如此。盡管多模態(tài)大語(yǔ)言模型（MLLMs）取得了進(jìn)展，但大多數(shù)研究工作都集中在目標(biāo)檢測(cè)、圖像描述或場(chǎng)景理解等方面，對(duì)時(shí)間推理的探索仍不夠充分?！?/p>

本次測(cè)試的對(duì)象包括 OpenAI 的 GPT-4o 和 GPT-o1、谷歌 DeepMind 的 Gemini 2.0、Anthropic 的 Claude 3.5 Sonnet、Meta 的 Llama 3.2-11B-Vision-Instruct、阿里的 Qwen2-VL7B-Instruct、以及 ModelBest 的 MiniCPM-V-2.6。研究人員向這些模型輸入了不同的模擬時(shí)鐘圖片（這些圖片中的時(shí)鐘或帶有羅馬數(shù)字、或有不同的表盤顏色，有些則沒有指針）、以及十年來(lái)的日歷圖片等。

AI chatGPT 人工智能

向這些大模型上傳時(shí)鐘圖片的同時(shí)，還會(huì)提出問(wèn)題：上傳圖片中的時(shí)鐘顯示的時(shí)間是多少？而對(duì)于日歷的圖片，研究人員則會(huì)提出一些簡(jiǎn)單的問(wèn)題，比如：元旦是星期幾？以及一些較難的問(wèn)題，諸如：一年中的第 153 天是哪一天？

“讀取模擬時(shí)鐘的時(shí)間和理解日歷涉及到復(fù)雜的認(rèn)知步驟”，研究人員解釋說(shuō)，“這需要進(jìn)行精細(xì)的視覺識(shí)別（例如，時(shí)鐘指針的位置、日期單元格的布局），以及不簡(jiǎn)單的數(shù)值推理（例如，計(jì)算日期偏移量）”

總而言之，這些AI模型的表現(xiàn)很不理想 —— 它們正確讀取模擬時(shí)鐘時(shí)間的概率不到 25%。研究人員表示，無(wú)論是帶有羅馬數(shù)字和風(fēng)格化指針的時(shí)鐘，還是沒有指針的時(shí)裝，它們的表現(xiàn)都不甚理想。

在最終的測(cè)試結(jié)果中，谷歌的Gemini 2.0 在時(shí)鐘測(cè)試中表現(xiàn)最好，而 GPT-o1 在日歷任務(wù)上準(zhǔn)確率為 80% —— 比競(jìng)爭(zhēng)對(duì)手都要好。這也意味著， 即使最出色的AI大模型，錯(cuò)誤率也高達(dá) 20%。

這項(xiàng)研究的共同作者、愛丁堡大學(xué)信息學(xué)院的博士生 Rohit Saxena 在一份學(xué)校聲明中表示：“大多數(shù)人從小就會(huì)看時(shí)間和日歷。我們的研究結(jié)果凸顯了 AI 在執(zhí)行對(duì)人類來(lái)說(shuō)相當(dāng)基礎(chǔ)的技能方面存在的顯著差距。如果要將 AI 系統(tǒng)成功集成到對(duì)時(shí)間敏感的現(xiàn)實(shí)世界應(yīng)用中，比如日程安排、自動(dòng)化和輔助技術(shù)等領(lǐng)域，就必須解決這些不足?！?/p>

所以，AI 或許能夠幫你完成家庭作業(yè)，但別指望它能按時(shí)完成任務(wù)，至少現(xiàn)在還是這樣。

（舉報(bào)）

相關(guān)推薦

關(guān)鍵詞：

北京鳴醫(yī)智造丁陽(yáng)談醫(yī)美安全：黑醫(yī)美騙局，都栽在“信息盲區(qū)”

在社交平臺(tái)濾鏡與 “顏值經(jīng)濟(jì)” 的裹挾下，醫(yī)療美容成為越來(lái)越多人的選擇；然而，黑醫(yī)美市場(chǎng)的亂象卻如影隨形：1.“美容院秒變醫(yī)美診所”：小區(qū)里的生活美容院掛起“微整中心”招牌，無(wú)證醫(yī)師用牙簽比劃著設(shè)計(jì)雙眼皮，玻尿酸針劑從三無(wú)包裝盒里拆出，這類未經(jīng)審批的“黑機(jī)構(gòu)”占比超30%，消毒不規(guī)范、操作失誤等常導(dǎo)致感染、毀容甚至失明。2.“朋友圈微整大師”?

?醫(yī)療美容 ?黑醫(yī)美市場(chǎng) ?微整形
企業(yè)該如何注冊(cè)香港公司？小貿(mào)出海來(lái)幫你！

美國(guó)對(duì)華加征關(guān)稅力度持續(xù)升級(jí)，稅率已提高至125%，給多國(guó)企業(yè)帶來(lái)沉重負(fù)擔(dān)。

?美國(guó)關(guān)稅 ?外貿(mào)企業(yè) ?香港自由港
程序員危！微軟CEO納德拉：公司高達(dá)30%代碼是AI寫的

微軟CEO納德拉在Meta的LlamaCon大會(huì)上透露，微軟代碼庫(kù)中20%-30%的代碼由AI生成，其中Python應(yīng)用進(jìn)展最快，C語(yǔ)言相對(duì)較慢。微軟CTO凱文·斯科特預(yù)測(cè)到2030年，95%代碼將由AI生成。谷歌CEO皮查伊也表示，谷歌超30%代碼由AI生成。Meta CEO扎克伯格則未透露具體數(shù)據(jù)。由于缺乏統(tǒng)一的AI代碼衡量標(biāo)準(zhǔn)，這些數(shù)據(jù)僅供參考。（140字）

?AI ?代碼生成 ?微軟與Meta
爸爸模仿一年級(jí)兒子寫作業(yè) 網(wǎng)友：太真實(shí) 血壓飆升

網(wǎng)絡(luò)上一段視頻引發(fā)眾多網(wǎng)友關(guān)注與討論。一位來(lái)自江蘇的爸爸生動(dòng)地模仿起自家一年級(jí)兒子寫作業(yè)時(shí)的模樣。不少網(wǎng)友在觀看視頻后紛紛表示，這簡(jiǎn)直就是自家孩子寫作業(yè)時(shí)的真實(shí)寫照，仿佛看到了自家娃坐在書桌前磨磨蹭蹭、愁眉苦臉的樣子，代入感極強(qiáng)，甚至有網(wǎng)友調(diào)侃說(shuō)，看著視頻里爸爸的模樣，自己的血壓都跟著升高了。

?父親模仿 ?一年級(jí)學(xué)生 ?寫作業(yè)難
薦300元一學(xué)期，誰(shuí)在教縣城老人寫AI“prompt”

我回了一趟湖北老家。只見媽媽急匆匆地出了門，丟下一句:“老年大學(xué)的AI課要趕不及了!”啥?老年大學(xué)已經(jīng)這么緊跟時(shí)代了?連我們這個(gè)三線城市都開上了AI課?我的媽媽是一名非常善于使用智能手機(jī)的退休人士，很多APP甚至用得比我都順溜。在AI時(shí)代，老年人也會(huì)面臨跟年輕人一樣，甚至更復(fù)雜的技術(shù)衍生問(wèn)題。

?老年大學(xué) ?AI ?課程
第一批年輕人已經(jīng)用AI創(chuàng)業(yè)了，AI應(yīng)用師成新型職業(yè)

“比如我要做一個(gè)特效場(chǎng)景，以前需要3D建模搭一個(gè)景，現(xiàn)在一句話輸入進(jìn)去，AI馬上就能生成?！睖鼐S斯接受記者采訪時(shí)說(shuō)，他已經(jīng)把AI當(dāng)成一項(xiàng)事業(yè)，正式用可靈AI開始創(chuàng)業(yè)了。隨著技術(shù)加速迭代以及算力成本不斷下降，視頻大模型技術(shù)應(yīng)用的門檻和成本將實(shí)現(xiàn)“雙降”，進(jìn)將帶動(dòng)國(guó)產(chǎn)視頻大模型規(guī)?；褂?。

?特效場(chǎng)景 ?AI創(chuàng)業(yè) ?AIGC產(chǎn)品
時(shí)空AI專家路新江：用創(chuàng)新時(shí)間序列編織智慧未來(lái)

文章介紹了時(shí)空AI技術(shù)在智慧城市建設(shè)中的創(chuàng)新應(yīng)用。通過(guò)分析歷史交通數(shù)據(jù)，AI能提前15分鐘預(yù)測(cè)主干道擁堵節(jié)點(diǎn)，并與智能信號(hào)燈協(xié)同優(yōu)化通行效率；在地質(zhì)監(jiān)測(cè)站，毫米級(jí)土壤位移數(shù)據(jù)被轉(zhuǎn)化為時(shí)間序列，AI模型能提前40分鐘預(yù)警滑坡災(zāi)害；在城市規(guī)劃方面，AI結(jié)合人口遷徙和衛(wèi)星數(shù)據(jù)，可模擬20年后城區(qū)擴(kuò)展形態(tài)。中國(guó)學(xué)者路新江提出創(chuàng)新性D3VAE框架，結(jié)合能量模型和變分自編碼器，首創(chuàng)"生成式時(shí)序預(yù)測(cè)"模式，顯著提升預(yù)測(cè)性能。他還開發(fā)了基于大語(yǔ)言模型的Table-to-Text方法，推動(dòng)結(jié)構(gòu)化數(shù)據(jù)處理。這些技術(shù)已應(yīng)用于雄安新區(qū)規(guī)劃、風(fēng)力發(fā)電預(yù)測(cè)等多個(gè)領(lǐng)域，為城市數(shù)字化轉(zhuǎn)型提供重要支撐。

?智慧城市 ?時(shí)空AI技術(shù) ?數(shù)字神經(jīng)網(wǎng)絡(luò)
RK首款AI四模機(jī)械鍵盤來(lái)襲！一機(jī)多用超進(jìn)化，讓時(shí)間更自由

2025年4月6日，RK正式發(fā)布首款A(yù)I四模機(jī)械鍵盤。作為行業(yè)革新產(chǎn)品，R87PROAI四模機(jī)械鍵盤以Deepseek-R1智能模型為核心，構(gòu)建起辦公智能生態(tài)全場(chǎng)景，突破傳統(tǒng)機(jī)械鍵盤局限，打破辦公與電競(jìng)之間的壁壘，實(shí)現(xiàn)一機(jī)多用。首發(fā)價(jià)299元起，關(guān)注抖音[RK電腦外設(shè)旗艦店]有更多直播福利獨(dú)家放送，4月10日20:00，不見不散！

?AI機(jī)械鍵盤 ?多模機(jī)械鍵盤 ?智能辦公設(shè)備
特朗普發(fā)動(dòng)的“關(guān)稅戰(zhàn)”，開始波及美國(guó)的 AI 業(yè)了！

由于特朗普發(fā)動(dòng)的“關(guān)稅戰(zhàn)爭(zhēng)”，AI數(shù)據(jù)中心的建設(shè)成本將急劇增加。全球云服務(wù)領(lǐng)域的三大巨頭企業(yè)在世界各地積極競(jìng)爭(zhēng)建立數(shù)據(jù)中心，如今，人們?cè)絹?lái)越擔(dān)心這些企業(yè)會(huì)將不斷攀升的成本轉(zhuǎn)嫁給消費(fèi)者，或?qū)е峦顿Y縮減。AI行業(yè)相關(guān)人士表示：“特朗普試圖強(qiáng)化美國(guó)AI競(jìng)爭(zhēng)力的構(gòu)想，因他自己的關(guān)稅政策受到了阻礙。

?特朗普 ?AI競(jìng)爭(zhēng)力 ?關(guān)稅政策
如何利用AI提升營(yíng)銷效率和銷售轉(zhuǎn)化率？企業(yè)如何把握AI這一歷史性機(jī)遇？塵鋒AI智能體助力企業(yè)破局增長(zhǎng)焦慮

各行各業(yè)都在積極擁抱數(shù)字化浪潮，隨著ChatGPT、DeepSeek等AI技術(shù)的快速發(fā)展，正推動(dòng)著企業(yè)變革經(jīng)營(yíng)管理思路，以應(yīng)對(duì)AI時(shí)代的機(jī)遇與挑戰(zhàn)。企業(yè)該如何在AI驅(qū)動(dòng)的產(chǎn)業(yè)變革中，加速提升企業(yè)的數(shù)字化能力和水平，利用技術(shù)升級(jí)賦能業(yè)務(wù)模式，把握AI技術(shù)發(fā)展這一歷史性機(jī)遇?此前，隨著市場(chǎng)環(huán)境變化，許多管理者都十分焦慮:市場(chǎng)競(jìng)爭(zhēng)愈加激烈，業(yè)務(wù)成本居高不下，利潤(rùn)空間更是被不斷壓縮，在過(guò)去很長(zhǎng)一段時(shí)間，對(duì)于企業(yè)管理者來(lái)說(shuō)，「降本增效」已經(jīng)是老生常談。如果您在2025年希望盡快擁抱AI新技術(shù)，提高企業(yè)的競(jìng)爭(zhēng)力與增長(zhǎng)效率，不妨了解下塵鋒。

?數(shù)字化轉(zhuǎn)型 ?AI技術(shù) ?企業(yè)管理

熱文

3 天
7天

站長(zhǎng)商機(jī)

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM

<menu id="eub4z"><object id="eub4z"></object></menu>

<ul id="eub4z"><b id="eub4z"></b></ul>