歡迎來(lái)到【AI日?qǐng)?bào)】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點(diǎn)內(nèi)容,聚焦開(kāi)發(fā)者,助你洞悉技術(shù)趨勢(shì)、了解創(chuàng)新AI產(chǎn)品應(yīng)用。
新鮮AI產(chǎn)品點(diǎn)擊了解:https://top.aibase.com/
1、百度宣布文心大模型ERNIE Speed、ERNIE Lite全面免費(fèi)
百度智能云宣布免費(fèi)開(kāi)放ERNIE Speed和ERNIE Lite兩大主力模型,ERNIE Speed為高性能大語(yǔ)言模型,適合精調(diào)處理特定場(chǎng)景問(wèn)題;ERNIE Lite為輕量級(jí)大語(yǔ)言模型,適合低算力AI加速卡推理使用。
【AiBase提要:】
?? ERNIE Speed是百度 2024 年最新發(fā)布的自研高性能大語(yǔ)言模型,通用能力優(yōu)異。
?? ERNIE Lite是百度自研的輕量級(jí)大語(yǔ)言模型,兼顧優(yōu)異的模型效果與推理性能。
?? ERNIE Speed和ERNIE Lite全面免費(fèi),立即生效。
2、阿里云宣布GPT-4級(jí)主力模型Qwen-Long API輸入費(fèi)用暴跌97%
阿里云宣布將其GPT-4級(jí)主力模型Qwen-Long的API輸入價(jià)格大幅降低,為用戶帶來(lái)極大的優(yōu)惠和競(jìng)爭(zhēng)力,使得購(gòu)買(mǎi)文本處理能力變得更加經(jīng)濟(jì)實(shí)惠。
【AiBase提要:】
?? API輸入價(jià)格降至每千tokens0.0005元,降幅達(dá)97%,用戶只需花費(fèi)1塊錢(qián)即可購(gòu)買(mǎi)200萬(wàn)tokens。
?? 模型支持長(zhǎng)達(dá)1千萬(wàn)tokens的文本輸入,價(jià)格約為GPT-4的1/400,成為全球最具競(jìng)爭(zhēng)力之一。
?? 通義大模型通過(guò)阿里云服務(wù)企業(yè)超過(guò)9萬(wàn)家,通過(guò)釘釘服務(wù)企業(yè)超過(guò)220萬(wàn)家,受到海內(nèi)外中小企業(yè)和開(kāi)發(fā)者的廣泛使用。
3、字節(jié)跳動(dòng)豆包大模型價(jià)格清單公布:25元起
本文介紹了字節(jié)跳動(dòng)旗下火山引擎官網(wǎng)更新豆包大模型定價(jià)的信息。豆包大模型在性價(jià)比上具有優(yōu)勢(shì),主力模型價(jià)格降低了99%,性能價(jià)值比突出。豆包大模型家族包括多種成員,滿足不同用戶需求。計(jì)費(fèi)模式靈活,后付費(fèi)和預(yù)付費(fèi)兩種方式滿足企業(yè)需求。
【AiBase提要:】
?? 豆包大模型價(jià)格更新,起價(jià)僅25元,性價(jià)比優(yōu)勢(shì)明顯。
?? 豆包大模型家族多樣化,包括Pro、Lite等多種模型,處理能力強(qiáng)大。
?? 計(jì)費(fèi)模式靈活,后付費(fèi)和預(yù)付費(fèi)兩種方式滿足企業(yè)需求。
4、智譜開(kāi)源新一代多模態(tài)大模型CogVLM2
智譜·AI最近推出了新一代多模態(tài)大模型CogVLM2,性能顯著提升,支持8K文本長(zhǎng)度和1344*1344分辨率的圖像。CogVLM2在多個(gè)基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,展現(xiàn)出強(qiáng)大的文檔圖像理解能力。技術(shù)架構(gòu)優(yōu)化,模型大小為19B,性能接近或超過(guò)GPT-4V水平。推理時(shí)實(shí)際激活參數(shù)量約120億,推理效率顯著提高。
【AiBase提要:】
?? CogVLM2在OCRbench基準(zhǔn)上性能提升32%,在TextVQA基準(zhǔn)上提升21.9%。
?? CogVLM2采用深度融合策略,視覺(jué)模態(tài)與語(yǔ)言模態(tài)緊密結(jié)合,保持語(yǔ)言處理優(yōu)勢(shì)。
?? CogVLM2在多個(gè)多模態(tài)基準(zhǔn)測(cè)試中取得優(yōu)異成績(jī),包括TextVQA、DocVQA、ChartQA等。
詳情鏈接:https://github.com/THUDM/CogVLM2
5、面壁智能推出最新一代端側(cè)多模態(tài)模型 MiniCPM-Llama3-V2.5
面壁智能推出的最新一代端側(cè)多模態(tài)模型 MiniCPM-Llama3-V2.5 具有超強(qiáng)的綜合性能,能夠在 OCR 方面取得 SOTA 成績(jī),支持多種語(yǔ)言,實(shí)現(xiàn)了端側(cè)系統(tǒng)級(jí)多模態(tài)加速,展現(xiàn)出強(qiáng)大的多模態(tài)綜合能力,為端側(cè) AI 模型的發(fā)展帶來(lái)新的突破。
【AiBase提要:】
?? MiniCPM-Llama3-V2.5具有超強(qiáng)綜合性能,超越Gemini Pro和GPT-4V。
?? 在 OCR 方面取得 SOTA 成績(jī),精準(zhǔn)識(shí)別難圖、長(zhǎng)圖和長(zhǎng)文本。
?? 首次實(shí)現(xiàn)端側(cè)系統(tǒng)級(jí)多模態(tài)加速,使圖像編碼速度提升150倍。
詳情鏈接:https://github.com/OpenBMB/MiniCPM-VMiniCPM
6、騰訊計(jì)劃投資月之暗面 估值或?qū)⑦_(dá)30億美元
騰訊計(jì)劃投資月之暗面,可能將其估值提升至30億美元。這一舉動(dòng)顯示了騰訊在人工智能領(lǐng)域的戰(zhàn)略布局和競(jìng)爭(zhēng)意圖。中國(guó)人工智能產(chǎn)業(yè)的快速發(fā)展使得投資、競(jìng)爭(zhēng)日益激烈,騰訊與月之暗面的合作將在業(yè)界引起關(guān)注。
【AiBase提要:】
?? 月之暗面在人工智能大語(yǔ)言模型領(lǐng)域處于領(lǐng)先地位,吸引了騰訊等巨頭的關(guān)注。
?? 月之暗面創(chuàng)立僅一年多時(shí)間,已完成超過(guò)10億美元的融資,估值達(dá)25億美元。
?? 騰訊將加入人工智能領(lǐng)域的競(jìng)爭(zhēng),計(jì)劃投資其他大模型創(chuàng)業(yè)公司,強(qiáng)化競(jìng)爭(zhēng)實(shí)力。
7、線條預(yù)處理器 Anyline新增Web UI適配
這篇文章介紹了 Anyline 最新的更新,為 Web UI Controlnet 新增了適配,提升了用戶操作體驗(yàn)。Chenlei Hu 計(jì)劃進(jìn)一步簡(jiǎn)化 Anyline 的使用方式,并考慮將其更深入地集成到 ComfyUI 中。用戶可以根據(jù)需求選擇合適的基礎(chǔ)模型,以獲得最佳效果。更新將 Anyline 的強(qiáng)大功能帶到了 Web UI 上,為專業(yè)設(shè)計(jì)工作和日常圖像處理帶來(lái)便利。
【AiBase提要:】
?? 高精度線條提取: Anyline 能準(zhǔn)確提取圖像中的對(duì)象邊緣、細(xì)節(jié)和文本內(nèi)容,輸出清晰邊緣和高保真度文本的線條圖。
?? 廣泛的適用性: 用戶可以輸入任何類(lèi)型的圖像,Anyline 都能快速處理,提供高質(zhì)量的線條圖。
?? 紋理字體識(shí)別優(yōu)勢(shì): Anyline 在輪廓準(zhǔn)確度、物體細(xì)節(jié)、材質(zhì)紋理和字體識(shí)別方面有明顯優(yōu)勢(shì),同時(shí)提供更好的降噪效果。
詳情鏈接:https://top.aibase.com/tool/anyline
8、Meta發(fā)布類(lèi)GPT-4o多模態(tài)模型Chameleon
本文介紹了Meta最近發(fā)布的多模態(tài)模型Chameleon,該模型在多模態(tài)模型領(lǐng)域設(shè)立了新的標(biāo)桿,具有早期融合、統(tǒng)一Transformer架構(gòu)等創(chuàng)新特點(diǎn)。Chameleon在各種任務(wù)上展現(xiàn)出廣泛的能力,包括視覺(jué)問(wèn)答、圖像標(biāo)注、文本生成等。文章還提到Chameleon面臨的技術(shù)挑戰(zhàn)以及Meta團(tuán)隊(duì)引入的架構(gòu)創(chuàng)新和訓(xùn)練技術(shù)。
【AiBase提要:】
?? Chameleon是一個(gè)早期融合的基于token的混合模態(tài)模型家族,能夠理解并生成任意順序的圖像和文本。
?? Chameleon模型在技術(shù)上面臨了重大挑戰(zhàn),Meta的研究團(tuán)隊(duì)引入了一系列架構(gòu)創(chuàng)新和訓(xùn)練技術(shù)。
?? Chameleon模型在基準(zhǔn)評(píng)估中全面超越了Llama2,在常識(shí)推理、閱讀理解、數(shù)學(xué)問(wèn)題和世界知識(shí)領(lǐng)域都取得了顯著的效果。
詳情鏈接:https://arxiv.org/pdf/2405.09818Chameleon
9、微軟發(fā)布AI工具 Recall,幫助你找到那些找不到的文件
微軟推出了Recall AI,為C o p i l o t+ PC系列提供了“照片記憶”功能,讓用戶通過(guò)語(yǔ)音查詢文件、網(wǎng)站或電子郵件,并通過(guò)AI進(jìn)行索引和搜索。這項(xiàng)功能可以幫助用戶更輕松地找到所需信息,而且數(shù)據(jù)保留在設(shè)備本地,不用擔(dān)心信息傳輸?shù)皆品?wù)器。
【AiBase提要:】
?? Recall AI為C o p i l o t+ PC系列提供“照片記憶”功能,允許用戶通過(guò)語(yǔ)音查詢文件、網(wǎng)站或電子郵件,并通過(guò)AI進(jìn)行索引和搜索。
?? Recall AI記錄用戶的屏幕操作,使用自然語(yǔ)言描述文件記憶,快速找到文檔最新版本,讓用戶更輕松獲取信息。
?? Recall AI僅適用于具有特定硬件要求的設(shè)備,如ARM64處理器、Snapdragon X Elite和X Plus等。
10、從零復(fù)現(xiàn)Llama3代碼庫(kù)爆火 Karpathy大神稱贊作者是個(gè)有品的人
這篇文章介紹了一個(gè)教你從頭開(kāi)始實(shí)現(xiàn)Llama3的代碼庫(kù)在網(wǎng)絡(luò)上引起轟動(dòng)的情況。知名AI專家Andrej Karpathy對(duì)該項(xiàng)目給予高度評(píng)價(jià),稱贊作者Nishant Aklecha的詳細(xì)解釋和展示。文章詳細(xì)解釋了Llama3模型的實(shí)現(xiàn)過(guò)程,包括注意力機(jī)制、位置編碼等關(guān)鍵內(nèi)容。
【AiBase提要:】
?? 代碼庫(kù)爆火,吸引無(wú)數(shù)開(kāi)發(fā)者關(guān)注,Karpathy點(diǎn)贊轉(zhuǎn)發(fā)評(píng)論
????? 作者Nishant Aklecha詳細(xì)解釋Llama3模型實(shí)現(xiàn)過(guò)程,包括注意力機(jī)制和位置編碼
?? 納哥從頭實(shí)現(xiàn)Llama3,展示每行代碼功能,Karpathy稱贊詳細(xì)展開(kāi)易理解
詳情鏈接:https://top.aibase.com/tool/llama3-from-scratch
11、AI 框架Ambient Diffusion:從圖像中獲取靈感,而非復(fù)制
德克薩斯大學(xué)奧斯汀分校的研究團(tuán)隊(duì)開(kāi)發(fā)了名為Ambient Diffusion的框架,通過(guò)對(duì)無(wú)法辨認(rèn)的圖像進(jìn)行訓(xùn)練,繞過(guò)AI模型復(fù)制他人作品的問(wèn)題。這一框架不僅在藝術(shù)領(lǐng)域有用,還有潛力應(yīng)用于科學(xué)和醫(yī)學(xué)領(lǐng)域,如黑洞成像和MRI掃描。研究團(tuán)隊(duì)的創(chuàng)新為人工智能發(fā)展提供了新思路。
【AiBase提要:】
?? Ambient Diffusion框架通過(guò)訓(xùn)練擾亂后的圖像數(shù)據(jù),解決AI模型復(fù)制作品的問(wèn)題。
?? 該框架潛力巨大,可應(yīng)用于藝術(shù)、科學(xué)和醫(yī)學(xué)領(lǐng)域,如黑洞成像和MRI掃描。
?? 初步實(shí)驗(yàn)表明,Ambient Diffusion框架仍能生成高質(zhì)量樣本,而不需要識(shí)別原始源圖像內(nèi)容。
詳情鏈接:https://arxiv.org/abs/2305.19256
12、好萊塢女星斯嘉麗抨擊OpenAI抄襲她的聲音用于ChatGPT
斯嘉麗?約翰遜聲稱OpenAI在她拒絕為ChatGPT提供聲音后,仍擅自模仿了她獨(dú)特的音調(diào)。OpenAI展示了與斯嘉麗?約翰遜在《Her》中扮演的人工智能助手極為相似的合成語(yǔ)音,但突然禁用了這一新聲音。評(píng)論家批評(píng)OpenAI的行為,贊揚(yáng)斯嘉麗?約翰遜的立場(chǎng)。
【AiBase提要:】
? 斯嘉麗?約翰遜聲稱OpenAI擅自模仿她的音調(diào)。
? OpenAI展示了與斯嘉麗?約翰遜在《Her》中扮演的人工智能助手相似的合成語(yǔ)音。
? 評(píng)論家批評(píng)OpenAI的行為,贊揚(yáng)斯嘉麗?約翰遜的立場(chǎng)。
13、英特爾推出新一代 Lunar Lake 芯片
英特爾計(jì)劃在今年第三季度推出 Lunar Lake 筆記本處理器,旨在為 C opilot Plus PC 帶來(lái)全新的 AI 體驗(yàn)。該芯片將提供比其前身 Meteor Lake 更高的三倍 AI 性能,預(yù)計(jì)在今年底前將搭載40多萬(wàn)顆 Lunar Lake 芯片。這一舉措是英特爾在 AI PC 市場(chǎng)中的重要一步,旨在應(yīng)對(duì)競(jìng)爭(zhēng)對(duì)手的挑戰(zhàn)。
【AiBase提要:】
? Lunar Lake 芯片將采用 CPU、集成的 Xe2GPU 和神經(jīng)處理單元(NPU),提供比其前身 Meteor Lake 更高的三倍 AI 性能。
? 英特爾計(jì)劃在今年底前向全球80多款新筆記本型號(hào)中搭載40多萬(wàn)顆 Lunar Lake 芯片,以應(yīng)對(duì) AMD 的 Zen5和高通的 Oryon。
? Lunar Lake 處理器的 NPU 將能夠執(zhí)行超過(guò)40萬(wàn)億次操作每秒(TOPS),遠(yuǎn)高于 Meteor Lake 芯片的10TOPS。這將為 AI PC 帶來(lái)更強(qiáng)大的性能和更豐富的應(yīng)用體驗(yàn)。
(舉報(bào))