在 2025 年全國兩會期間,人工智能領(lǐng)域的前沿話題——具身智能,成為了熱議焦點(diǎn)。具身智能作為人工智能的新興賽道,正以爆發(fā)式增長態(tài)勢,引領(lǐng)新一輪產(chǎn)業(yè)變革。
全國政協(xié)委員、天娛數(shù)科CEO賀晗聚焦具身智能、3D數(shù)據(jù)等全球科技競爭的關(guān)鍵領(lǐng)域提出建議,并闡述了天娛數(shù)科在相關(guān)領(lǐng)域的積極實(shí)踐和業(yè)務(wù)布局。
具身智能:亟待突破通用平臺瓶頸
當(dāng)下以VLA為代表的具身智能大模型技術(shù)與人形機(jī)器人本體的融合,帶來了從“機(jī)械軀殼”到“數(shù)字生命”的革命性跨越,極大拓展了應(yīng)用場景。
然而,具身智能發(fā)展面臨諸多挑戰(zhàn),其中缺乏通用平臺成為關(guān)鍵制約因素。賀晗委員認(rèn)為,目前行業(yè)內(nèi)缺乏算法通用開發(fā)平臺,導(dǎo)致企業(yè)重復(fù)投入、資源分散;通用3D數(shù)據(jù)平臺稀缺,數(shù)據(jù)獲取成本高且標(biāo)準(zhǔn)化程度低;通用標(biāo)準(zhǔn)認(rèn)證平臺缺失,不同廠商產(chǎn)品互不兼容,限制了規(guī)?;瘧?yīng)用;通用場景測試平臺不足,使得應(yīng)用場景單一;通用人才培養(yǎng)平臺匱乏,復(fù)合型人才短缺。
在此背景下,天娛數(shù)科正重點(diǎn)研發(fā)具身智能大模型一體機(jī),這一“算法+數(shù)據(jù)+算力”三位一體的平臺,實(shí)現(xiàn)了間智能MaaS平臺+3D數(shù)據(jù)平臺+云邊端算力協(xié)同,打造通用的大腦(感認(rèn)知-決策-控制一體化的具身智能大模型)+小腦(技能模型)開發(fā)平臺,實(shí)現(xiàn)跨本體互通互用,讓每家機(jī)器人本體企業(yè)即插即用。目前,天娛數(shù)科的大模型已通過中央網(wǎng)信辦備案,3D數(shù)據(jù)平臺已積累超百萬組3D數(shù)據(jù)和 50 萬組多模態(tài)數(shù)據(jù),端側(cè)算力已集成在視覺模組中。
3D數(shù)據(jù):解決產(chǎn)業(yè)痛點(diǎn)的關(guān)鍵
在眾多“AI+”產(chǎn)業(yè)中,AI與工業(yè)的融合前景尤為廣闊。目前AI在內(nèi)容創(chuàng)作、客服、編程等桌面應(yīng)用領(lǐng)域滲透率較高,但在工業(yè)領(lǐng)域應(yīng)用卻極為有限。其根本原因在于工業(yè)場景的3D空間特性與主流的2D模型存在空間計算鴻溝。而由3D大模型驅(qū)動的3D智能將為工業(yè)帶來顛覆性變革,其具備更全面的感知、理解、交互與決策能力,重新定義人、機(jī)器與真實(shí)及虛擬世界間的關(guān)系。
然而,高質(zhì)量3D數(shù)據(jù)集的匱乏成為產(chǎn)業(yè)發(fā)展的痛點(diǎn)。全球范圍內(nèi),3D數(shù)據(jù)都處于極端重要又極端缺乏的狀態(tài),已成為全球科技競爭的核心節(jié)點(diǎn)。例如, 2023 年 10 月谷歌DeepMind聯(lián)合全球 33 家優(yōu)質(zhì)學(xué)術(shù)實(shí)驗(yàn)室開發(fā)OpenX-Embodiment數(shù)據(jù)集,并基于此訓(xùn)練RT-X系列3D多模態(tài)大模型用于人形機(jī)器人; 2024 年 3 月斯坦福大學(xué)、伯克利大學(xué)聯(lián)合推出DROID分布式機(jī)器人交互數(shù)據(jù)集;同月,全球知名人工智能專家李飛飛教授領(lǐng)銜推出BEHAVIOR-1K具身智能數(shù)據(jù)平臺。
面對3D數(shù)據(jù)獲取與處理成本高昂、流程繁雜的問題,天娛數(shù)科在 2023 年攜手合肥產(chǎn)投,戰(zhàn)略投資了專注空間計算及人工智能芯片及產(chǎn)品設(shè)計的高科技企業(yè)。芯明自研的空間計算芯片相當(dāng)創(chuàng)新性,是全球僅有單芯片集成芯片化實(shí)時3D立體視覺感知、AI、SLAM(實(shí)時定位建圖)的空間智能系統(tǒng)級芯片。其具備3.5TOPS的端側(cè)算力,功耗僅約0.5W,可支持單芯片接入 6 路傳感器。依托芯明的芯片和模組優(yōu)勢,天娛數(shù)科通過部署多種高精度3D掃描設(shè)備,成功構(gòu)建起有效的數(shù)據(jù)采集體系,大幅降低了3D數(shù)據(jù)采集成本,為后續(xù)的模型訓(xùn)練和應(yīng)用開發(fā)提供了堅實(shí)的數(shù)據(jù)基礎(chǔ)。
為解決3D數(shù)據(jù)標(biāo)準(zhǔn)化程度低、兼容性差的問題,天娛數(shù)科融合大模型、3D數(shù)據(jù)集、可視算法,構(gòu)建了空間智能MaaS平臺。該平臺運(yùn)用先進(jìn)的智能解析技術(shù),對跨類型數(shù)據(jù)進(jìn)行深度處理,顯著提高了數(shù)據(jù)標(biāo)準(zhǔn)化程度和易用性。去年 10 月,天娛數(shù)科采集加工形成的“人形機(jī)器人空間動捕長程數(shù)據(jù)”“大場景空間感知模型重建數(shù)據(jù)”等 5 個3D具身智能數(shù)據(jù)集,在北京國際大數(shù)據(jù)交易所完成數(shù)據(jù)資產(chǎn)登記,成為全國頭個完成資產(chǎn)登記的3D具身智能數(shù)據(jù)集。
深耕具身智能未來
創(chuàng)新引領(lǐng)“智”變
在人工智能迅猛發(fā)展的當(dāng)下,具身智能作為前沿領(lǐng)域,正逐步展現(xiàn)出重塑人類生活與生產(chǎn)模式的巨大潛力。技術(shù)研發(fā)層面,天娛數(shù)科的具身智能大模型一體機(jī),集成了先進(jìn)的算法、海量的數(shù)據(jù)以及強(qiáng)大的算力,為機(jī)器人賦予更加智能的“大腦”和“小腦”,這種創(chuàng)新性的平臺架構(gòu),不僅實(shí)現(xiàn)了不同模塊之間的有效協(xié)同,還極大地提升了機(jī)器人在其他復(fù)雜環(huán)境中的感知、決策與執(zhí)行能力。
隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的持續(xù)拓展,具身智能將迎來更加廣闊的發(fā)展空間。天娛數(shù)科將繼續(xù)秉持創(chuàng)新精神,加大技術(shù)研發(fā)投入,持續(xù)優(yōu)化具身智能大模型一體機(jī)性能,進(jìn)一步提高3D數(shù)據(jù)質(zhì)量和規(guī)模,探索更多前沿技術(shù)在具身智能領(lǐng)域的應(yīng)用,不斷鞏固和提升自身競爭力,為推動具身智能產(chǎn)業(yè)發(fā)展發(fā)揮更大的引領(lǐng)作用。
(推廣)