4月18日,2024中國(guó)生成式AI大會(huì)上李未可科技正式發(fā)布為眼鏡等未來(lái)終端定向優(yōu)化等自研WAKE-AI多模態(tài)大模型,具備文本生成、語(yǔ)言理解、圖像識(shí)別及視頻生成等多模態(tài)交互能力。
該大模型圍繞 GPS 軌跡+視覺+語(yǔ)音打造新一代 LLM-Based的自然交互,同時(shí)多模態(tài)問答技術(shù)的加持,能實(shí)現(xiàn)所見即所問、所問即所得的準(zhǔn)確服務(wù)。此外,融合了人類意圖理解、長(zhǎng)期記憶機(jī)制、情感大模型及TTS 克隆,可以為用戶提供超擬人的情感陪伴服務(wù)。
為保證實(shí)時(shí)交互場(chǎng)景的智能性及響應(yīng)速度 ,WAKE-AI 使用 MOE 架構(gòu),F(xiàn)lashAttention 混合精度訓(xùn)練、知識(shí)蒸餾等技術(shù)大幅降低算力需求跟計(jì)算時(shí)間。該大模型針對(duì)眼鏡端用戶的使用方式、場(chǎng)景等進(jìn)行了優(yōu)化。在語(yǔ)音返回速度上能做到90%,ASR字錯(cuò)率低于2%。同時(shí)為用戶提供在室外多個(gè)場(chǎng)景,如戶外運(yùn)動(dòng)、文化旅行、日程管理及實(shí)時(shí)翻譯的多模態(tài)AI服務(wù)。
據(jù)悉,李未可將于近期正式發(fā)布搭載WAKE-AI能力的新終端,從室外場(chǎng)景切入為用戶提供更智能、更全面的AI+服務(wù)。
會(huì)上,李未可科技合伙人&AI負(fù)責(zé)人古鑒表示W(wǎng)AKE-AI 將逐步開放平臺(tái)能力,便于更多企業(yè)及開發(fā)者調(diào)用WAKE-AI能力,共建AI+硬件生態(tài)。
(推廣)