文章概要:
1. Reka發(fā)布Yasa-1,一款多模態(tài)AI助手,可與文本、圖像、視頻和音頻互動(dòng),有望與OpenAI的ChatGPT競(jìng)爭(zhēng)。
2. Yasa-1支持20種語言,能處理長(zhǎng)達(dá)100,000個(gè)標(biāo)記的文檔,并執(zhí)行代碼,速度比Anthropic的Claude2快八倍。
3. 目前Yasa-1處于私人測(cè)試階段,Reka計(jì)劃在未來幾周內(nèi)擴(kuò)大對(duì)更多公司的開放,以提高其功能并解決一些限制。
站長(zhǎng)之家(ChinaZ.com)10月7日 消息:由DeepMind、Google、百度和Meta的研究人員共同創(chuàng)立的AI創(chuàng)企Reka,最近宣布了最新產(chǎn)品一款多模態(tài)AI助手Yasa-1。這款助手被設(shè)計(jì)成可以理解和互動(dòng)文本、圖像、視頻和音頻等多種媒體形式,被認(rèn)為有望成為OpenAI的ChatGPT的競(jìng)爭(zhēng)對(duì)手。
Yasa-1目前正在進(jìn)行私人測(cè)試,與OpenAI的ChatGPT競(jìng)爭(zhēng),后者已經(jīng)進(jìn)行了多模態(tài)升級(jí),包括GPT-4V和DALL-E3。Reka的團(tuán)隊(duì)表示,他們?cè)贕oogle Bard、PaLM和Deepmind Alphacode等項(xiàng)目的開發(fā)中有過經(jīng)驗(yàn),這使得Yasa-1更具競(jìng)爭(zhēng)力。
Yasa-1的獨(dú)特之處在于它的多模態(tài)能力。它可以支持文本提示與多媒體文件的結(jié)合,以提供更具體的答案。例如,它可以使用圖像創(chuàng)建社交媒體帖子以推廣產(chǎn)品,或者識(shí)別特定聲音及其來源。
此外,Yasa-1還可以理解視頻中正在發(fā)生的事情,包括討論的主題,并預(yù)測(cè)視頻中可能發(fā)生的下一步動(dòng)作。
除了多模態(tài)能力,Yasa-1還支持編程任務(wù),并能夠執(zhí)行代碼來執(zhí)行算術(shù)操作,分析表格或?yàn)樘囟〝?shù)據(jù)點(diǎn)創(chuàng)建可視化。然而,正如所有大型語言模型一樣,Yasa-1也可能會(huì)生成無意義的內(nèi)容,因此不應(yīng)完全依賴它提供關(guān)鍵建議。
Reka計(jì)劃在未來幾周內(nèi)擴(kuò)大Yasa-1的使用范圍,以提高其功能并解決一些限制。這家初次公開亮相于2023年6月的創(chuàng)企已獲得5800萬美元的資金支持,其重點(diǎn)領(lǐng)域包括通用智能、通用多模態(tài)和多語言代理、自我改進(jìn)的AI以及模型效率。
Yasa-1的發(fā)布標(biāo)志著多模態(tài)AI助手領(lǐng)域的競(jìng)爭(zhēng)愈發(fā)激烈,預(yù)示著未來AI助手將在不同媒體類型之間進(jìn)行更多復(fù)雜的交互,為用戶提供更多有趣和實(shí)用的功能。
(舉報(bào))