聲明:本文來自于微信公眾號(hào) 光錐智能,作者:魏琳華,授權(quán)站長(zhǎng)之家轉(zhuǎn)載發(fā)布。
大模型落地如火如荼,從上一代AI浪潮中殺出來的商湯,嗅到了這里面新的機(jī)會(huì)。
在最火的具身智能賽道,這兩年誕生了許多明星創(chuàng)業(yè)公司。這些創(chuàng)業(yè)公司的創(chuàng)始人往往擁有技術(shù)明星的光環(huán),不少都是在學(xué)術(shù)界中某個(gè)技術(shù)領(lǐng)域中響當(dāng)當(dāng)?shù)念I(lǐng)頭人。
這些初創(chuàng)公司雖然在某一個(gè)單點(diǎn)技術(shù)上遙遙領(lǐng)先(大腦、小腦或者本體),但在機(jī)器人落地過程中,要突破從單一技術(shù)到整體復(fù)雜產(chǎn)品的整合。
比如,機(jī)器人要做到“能聽會(huì)看”,就要深度集成AI大模型的能力,需要與AI服務(wù)商有密切的合作。
“大家不需要從頭再去做視覺算法研發(fā),這樣效率比較低。”商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆對(duì)光錐智能稱,“比如在一些特定的任務(wù)抓取識(shí)別上,只要能快速滿足需求,廠商可能就多賣出去幾十臺(tái)機(jī)器人?!?/p>
商湯科技聯(lián)合創(chuàng)始人、大裝置事業(yè)群總裁楊帆
除了AI模型,不少具身智能公司也面臨“數(shù)據(jù)缺失”“模擬物理規(guī)則”等難點(diǎn)?!吧虦羞@方面的能力和積累,比如之前做自動(dòng)駕駛就會(huì)有一些歷史的數(shù)據(jù)和解決方案,這些和具身智能是相通的?!睏罘Q。
“不只是基礎(chǔ)設(shè)施,算力之外,還有很多相關(guān)服務(wù)?!痹诰呱碇悄苄袠I(yè)的實(shí)踐,體現(xiàn)出商湯在生成式AI時(shí)代的新商業(yè)思考——要圍繞AI做從模型、數(shù)據(jù)、算力等多個(gè)方面的技術(shù)服務(wù)商。
包括具身智能在內(nèi),加上AIGC、AI4S(AI 科學(xué))、傳統(tǒng)企業(yè)智能化轉(zhuǎn)型,商湯在4月10日的技術(shù)交流日上給出了四個(gè)行業(yè)的解決方案。這些方案,并不是商湯一廂情愿的臆想,而是過去兩年中,在行業(yè)中淬煉出的“金丹”。
扎根行業(yè),商湯的AI 基礎(chǔ)設(shè)施——大裝置落地就成了有根之木,有源之水。
一個(gè)不懂模型的AI 基礎(chǔ)設(shè)施廠商,不是一個(gè)好服務(wù)商。商湯用大裝置證明了這一點(diǎn),也希望利用這一點(diǎn)賺取新時(shí)代的“技術(shù)溢價(jià)”。
受夠了傳統(tǒng)企業(yè)服務(wù)的苦,對(duì)商湯而言,從上一代項(xiàng)目制的業(yè)務(wù)中脫身,轉(zhuǎn)而做含金量更高的AI技術(shù)服務(wù),才能真正體現(xiàn)技術(shù)的商業(yè)價(jià)值。
低門檻、高性價(jià)比
AI基礎(chǔ)設(shè)施怎么做?
直到今天,“性價(jià)比”仍然是AI大模型的生死線。
雖然DeepSeek在年初極大地推動(dòng)了大模型的普及和成本降低,但在如何讓大模型變得便宜好用的命題上,AI 基礎(chǔ)設(shè)施的潛力還遠(yuǎn)遠(yuǎn)沒有挖掘完畢。
“今天,AI 基礎(chǔ)設(shè)施供應(yīng)商對(duì)客戶的需求滿足度還遠(yuǎn)遠(yuǎn)不夠。”楊帆說,“今天最優(yōu)秀、效果最好的模型,廠商還沒辦法拿到市場(chǎng)上直接提供服務(wù),因?yàn)樗男詢r(jià)比太低。”
平衡大模型的性能和成本,卻不是一個(gè)簡(jiǎn)單的命題。一個(gè)不同的選擇,會(huì)造成截然相反的效果。
楊帆舉了一個(gè)例子:
一家廠商需要做一個(gè)基于DeepSeek的對(duì)話產(chǎn)品,并根據(jù)自有數(shù)據(jù)庫再進(jìn)行定制化訓(xùn)練。但對(duì)于這樣一個(gè)模型來說,在調(diào)用量高和低兩種情況下,如果都采用分布式部署架構(gòu),兩者的性價(jià)比相差極大。
由于分布式架構(gòu)本身硬件成本較高,在QPS(每秒查詢數(shù))高的情況下,它可以高效利用資源,實(shí)現(xiàn)極致性價(jià)比;但在QPS低的情況下,反而會(huì)造成硬件資源閑置過多,從而讓成本比傳統(tǒng)部署更高。
所以,AI基礎(chǔ)設(shè)施從來不是一門只靠硬件就能做好的生意,從算力到模型,每一層都有無數(shù)個(gè)細(xì)小的選擇會(huì)決定最終的成果。
商湯正在做的,就是通過AI基礎(chǔ)設(shè)施和模型訓(xùn)練的配合,結(jié)合AI基礎(chǔ)設(shè)施的三要素:算力、算法和數(shù)據(jù),將大模型的性價(jià)比壓縮到極致。
作為底層架構(gòu)的硬件端,商湯算力充足。到2024年底,商湯大裝置的算力規(guī)模比去年翻了近一倍,達(dá)到23000PetaFlops,超過了整個(gè)北京的公共智能算力。
同時(shí),商湯算力的構(gòu)成一部分來自于國(guó)產(chǎn)芯片,避免被單一GPU“卡脖子”風(fēng)險(xiǎn)。但多種芯片難免會(huì)降低數(shù)據(jù)處理效率,商湯國(guó)產(chǎn)芯片異構(gòu)訓(xùn)練效率為同構(gòu)的95%,保持效率的同時(shí),商湯還能做到保持算力穩(wěn)定、充足,其算力利用率高達(dá)80%。
在優(yōu)化算力的基礎(chǔ)上,商湯通過算法優(yōu)化策略,實(shí)現(xiàn)大模型訓(xùn)練、推理兩部分的性能大幅提升。以推理為例,針對(duì)DeepSeek V3等第三方模型,商湯每秒處理Token數(shù)(TGS)已達(dá)1600+,在未做專項(xiàng)優(yōu)化下,訓(xùn)練效率竟然能優(yōu)于DeepSeek的官方成績(jī),要知道,DeepSeek可是以效率和成本著稱。
除了把性價(jià)比壓到極致,商湯的另外一個(gè)努力方向,就是把大模型業(yè)務(wù)做到更加易用。
當(dāng)開源成為行業(yè)主流,商湯擁抱開源,是為了讓廠商能夠自由調(diào)用開源工具,降低大模型訓(xùn)練門檻。
“今天有很多好的開源產(chǎn)品,它們幫助廠商更快地迭代自己的模型。”楊帆舉了個(gè)例子:
一個(gè)做模型同時(shí)做應(yīng)用的極客團(tuán)隊(duì),在研發(fā)階段先用純開源的工具體系做快速搭建,驗(yàn)證PMF(Product Market Fit,產(chǎn)品市場(chǎng)匹配度),但在業(yè)務(wù)上量的情況下,企業(yè)就需要選擇一個(gè)能幫助商業(yè)化的AI基礎(chǔ)設(shè)施服務(wù)商。在這個(gè)過程中,客戶希望繼續(xù)使用原來的開源工具,但服務(wù)平臺(tái)往往接口無法對(duì)齊,需要重新實(shí)現(xiàn)。
針對(duì)一系列開源衍生的需求,商湯升級(jí)的大裝置2.0版本給出了三個(gè)能力支持:開源兼容接口幫助廠商實(shí)現(xiàn)零成本遷移;模型廣場(chǎng)讓用戶自由選擇多種開源大模型并提供調(diào)用,實(shí)現(xiàn)零門檻使用;商湯的SenseCore平臺(tái)還提供優(yōu)化過的各種開源組件,讓用戶可以根據(jù)自己的需求來自由調(diào)用。
當(dāng)千行百業(yè)對(duì)于大模型的需求提高到“拿來即用”的標(biāo)準(zhǔn)上,商湯想做的,就是把模型的性價(jià)比打下來,同時(shí)讓廠商自身業(yè)務(wù)融入大模型的門檻降得更低。
懂客戶
商湯怎么做差異化壁壘?
不過,在競(jìng)爭(zhēng)激烈的AI基礎(chǔ)設(shè)施供應(yīng)商賽道中,商湯要想把營(yíng)收做到第一梯隊(duì),它面臨的競(jìng)爭(zhēng)壓力依然不小。
面對(duì)硬件資源更加充沛,同時(shí)靠邊際效應(yīng)把成本打得更低的云廠商來說,商湯們難以燒錢奉陪打價(jià)格戰(zhàn)。
競(jìng)爭(zhēng)密切的領(lǐng)域,商湯怎么廝殺出重圍?
除了懂模型,更要懂客戶。
在和千行百業(yè)的客戶探索AI技術(shù)落地的十年中,商湯在無數(shù)個(gè)實(shí)踐結(jié)果后,最終推出了目前需求密切、落地更成熟的四大行業(yè)解決方案——具身智能、AIGC、AI4S(AI for Science)和傳統(tǒng)企業(yè)智能化轉(zhuǎn)型。
作為既做模型,也做AI基礎(chǔ)設(shè)施的服務(wù)商,商湯內(nèi)部的產(chǎn)品、技術(shù)部門擁有成熟技術(shù),把具體行業(yè)需要的對(duì)應(yīng)能力直接“復(fù)制粘貼”提供給用戶,免去后者從頭鉆研的時(shí)間和精力成本。
以具身智能行業(yè)為例,針對(duì)數(shù)據(jù)短缺的問題,商湯能通過“仿真+真機(jī)”雙通道的解決方式,生成大量可用數(shù)據(jù),直接用到模型的訓(xùn)練中。將這些能力整合到一起,商湯針對(duì)具身智能行業(yè)拿出了“端到端”式的方案,從數(shù)據(jù)生產(chǎn)、工具支撐到模型研發(fā),都能一手包辦。
這種“拿來即用”的產(chǎn)品在商湯內(nèi)部還有很多。比如具身智能同樣需要應(yīng)用的視覺算法,再到自動(dòng)駕駛的歷史數(shù)據(jù),還有模型訓(xùn)練中需要的適配工具。
除了具身智能行業(yè)外,商湯還把這種能力延伸到了其他行業(yè)。
“實(shí)際上,無論是互聯(lián)網(wǎng)類客戶,還是一些線下傳統(tǒng)行業(yè)客戶,他們除了資源、平臺(tái)、訓(xùn)練和推理的成本和性價(jià)比之外,還有很多不同的需求?!睏罘信e了很多來自客戶的具體需求:
比如,有的廠商需要做模型定制,但模型需要在網(wǎng)信辦備案審核,但整體流程對(duì)于廠商來說復(fù)雜耗時(shí),商湯可以把審核能力開放給用戶;有的廠商需要數(shù)據(jù)私有化,不僅要保護(hù)數(shù)據(jù)安全,甚至可能需要國(guó)密認(rèn)證,商湯也能提供對(duì)應(yīng)關(guān)鍵能力。
拿出成熟技術(shù)、打出“更懂客戶”旗幟的商湯,并未止步于基礎(chǔ)的MaaS服務(wù),而是選擇再加碼人才,幫客戶走完落地的每個(gè)關(guān)鍵點(diǎn)。
在技術(shù)交流日中,楊帆提及,商湯在2023年專門成立了一個(gè)子業(yè)務(wù)板塊“AI專家服務(wù)”。
“其實(shí)在給產(chǎn)業(yè)智能化客戶提供服務(wù)時(shí),我們發(fā)現(xiàn),追求一鍵式部署、無代碼編輯等自動(dòng)化功能對(duì)于這些廠商來說意義甚微?!睏罘f。
企業(yè)一般的需求是希望基于一個(gè)基礎(chǔ)模型,根據(jù)自己已有的數(shù)據(jù)做定制化模型,并且要求推理能夠滿足他們對(duì)性價(jià)比的要求。
對(duì)于需求明確,但對(duì)AI技術(shù)不夠熟悉的客戶來說,標(biāo)準(zhǔn)化的解決方案沒辦法解決所有問題。在這種情況下,商湯往往需要在配置AI基礎(chǔ)服務(wù)的基礎(chǔ)上加上服務(wù)能力,派出專家提供支持。
靠著人才服務(wù)的支持和技術(shù)know-how的輸出,商湯擁有了超越其他AI企業(yè)的差異化壁壘。
抓住生成式AI浪潮
商湯蝶變
技術(shù)的浪潮滾滾向前,一個(gè)殘酷的事實(shí)是,能真正穿越周期的企業(yè)是極少數(shù)。
2016年的深度學(xué)習(xí)浪潮中,如今留下還能堅(jiān)持做通用大模型的已經(jīng)寥寥無幾;2023年的大模型浪潮中,六小虎也開始分化,不少已經(jīng)退出通用大模型的研發(fā)。
在巨頭之外,商湯是一個(gè)幸運(yùn)兒。
目前,商湯自己一邊做模型,一邊把這個(gè)過程中習(xí)得的能力和優(yōu)勢(shì)復(fù)制給客戶,把經(jīng)驗(yàn)做成真正有用的商品,成為了AI基礎(chǔ)設(shè)施服務(wù)中價(jià)值更高的附屬品。
在AI基礎(chǔ)設(shè)施服務(wù)+大模型服務(wù)的配合下,商湯的轉(zhuǎn)型已經(jīng)初見成效。
根據(jù)IDC報(bào)告,2024年H1,商湯以14.8%的市場(chǎng)份額位居中國(guó)大模型解決方案市場(chǎng)第二。
目前,生成式AI也成為了商湯營(yíng)收的中流砥柱,這代表了營(yíng)收質(zhì)量的提升。據(jù)財(cái)報(bào),2024年,商湯生成式AI相關(guān)業(yè)務(wù)收入超過24億元,同比增長(zhǎng)103%;其收入占總業(yè)務(wù)比例從2023年的34.8%,升至2024年的63.7%。商湯董事長(zhǎng)兼CEO徐立曾表示,生成式AI也是商湯最快突破20億元規(guī)模的業(yè)務(wù)。
從AI1.0時(shí)代到2.0時(shí)代,生存超過十年的商湯,一直埋頭做AI技術(shù),保證核心技術(shù)在第一梯隊(duì)。
大裝置業(yè)務(wù),是商湯“反向求解”的一次實(shí)踐。
早在2018年,由于做感知智能時(shí)遇到了海量數(shù)據(jù)處理的問題,商湯基于技術(shù)需求,打造了國(guó)內(nèi)首個(gè)AI千卡集群原型機(jī)。2020年,商湯又建立了國(guó)內(nèi)首個(gè)智算中心。彼時(shí),這樣的重資產(chǎn)投入對(duì)于商湯來說,是一筆不小的成本。
但正如英偉達(dá)為了游戲的極致視覺體驗(yàn)鉆研GPU,從而在深度學(xué)習(xí)的時(shí)代“無心插柳柳成蔭”,成為當(dāng)下AI時(shí)代的最大贏家。商湯在AI1.0時(shí)代的資產(chǎn)投入,變成了AI大模型訓(xùn)練的“礦井”。
再以AI基礎(chǔ)的三要素算力、算法和數(shù)據(jù)作為維度評(píng)判,商湯在擁有充足算力的基礎(chǔ)上,既有底層硬件優(yōu)化、自研大模型的經(jīng)驗(yàn),又有合成數(shù)據(jù)的能力和歷史數(shù)據(jù)沉淀。這就使商湯從一般的AI基礎(chǔ)設(shè)施供應(yīng)商中脫穎而出。
技術(shù)交流日上,商湯大裝置面向具身智能、AIGC、AI4S以及傳統(tǒng)企業(yè)智能化轉(zhuǎn)型推出四大行業(yè)解決方案,則又是一次“反向求解”的成果。
對(duì)于一家公司而言,高舉高打的戰(zhàn)略固然重要,但貼地飛行的經(jīng)驗(yàn)總結(jié)才是制勝關(guān)鍵。畢竟,實(shí)踐出真知。
商湯在和客戶合作的過程中,能深度洞察到行業(yè)的痛點(diǎn)和需求,再根據(jù)自身落地的實(shí)踐成果,把成功的經(jīng)驗(yàn)重點(diǎn)做批量復(fù)制,最終完成商業(yè)的閉環(huán)。
重技術(shù)的商湯,在一次次反向求解中,終于找到了屬于技術(shù)主義者的勝利。
(舉報(bào))