近日,AI界掀起了一股新風(fēng)潮,一款名為Llama3-V的全新開源視覺大語言模型橫空出世!據(jù)悉,這款模型基于Llama38B和siglip-so400m,被稱為最先進(jìn)的視覺大語言模型之一。與此同時(shí),該模型還具備快速本地推理的特點(diǎn),讓用戶能夠更加便捷地進(jìn)行推理操作。
有關(guān)Llama3-V的一些關(guān)鍵特點(diǎn)包括:優(yōu)于LLaVA約10-20%的性能表現(xiàn)、訓(xùn)練成本低于500美元以及可與GPT4-V、Gemini Ultra和Claude3相媲美的性能。同時(shí),該模型的權(quán)重、訓(xùn)練和推理代碼也將會開源發(fā)布,讓更多的開發(fā)者能夠參與其中。
現(xiàn)在,Llama3-V已經(jīng)在Hugging Face平臺和Github上發(fā)布,吸引了大量關(guān)注和好評。據(jù)悉,這款模型不僅能夠優(yōu)于以往的同類產(chǎn)品,還能夠以更小的模型體積達(dá)到與其他大型模型相媲美的性能水平。
總的來說,Llama3-V的推出無疑將為AI領(lǐng)域帶來一股新的風(fēng)向,讓我們拭目以待,看這款模型能為人工智能領(lǐng)域帶來怎樣的突破與創(chuàng)新!
HF Model:https://huggingface.co/mustafaaljadery/llama3v…
Github Repo:https://github.com/mustafaaljadery/llama3v
(舉報(bào))