无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

阿里推生成模型開源框架SCEPTER 支持和簡化圖像生成

2024-01-25 11:07 · 稿源：站長之家

站長之家（ChinaZ.com）1月25日消息:SCEPTER是由阿里巴巴開發(fā)的一個專為生成模型設(shè)計的開源框架。它用于訓(xùn)練、微調(diào)和推理生成模型，涵蓋諸如圖像生成、轉(zhuǎn)換和編輯等下游任務(wù)。這個框架專門用于支持和簡化圖像生成、合成和編輯任務(wù)的開發(fā)，包括從文本到圖像的生成和高級圖像編輯技術(shù)。

項目地址:https://top.aibase.com/tool/scepter

SCEPTER支持多種任務(wù)，其中包括文本到圖像生成，能夠根據(jù)描述自動生成圖像內(nèi)容。它還能進行可控圖像合成，在圖像生成過程中控制特定的屬性或特征。此外，SCEPTER還支持圖像編輯，可以對生成的圖像進行編輯和修改。

在訓(xùn)練和推理方面，SCEPTER支持多種分布式訓(xùn)練方法，包括DDP（Distributed Data Parallel）、FSDP(Fully Sharded Data Parallel)、FairScale和Xformers，用于有效處理大量數(shù)據(jù)和模型。這些方法可以提高訓(xùn)練效率，并對特定類型的模型進行優(yōu)化。

另外，SCEPTER還提供了完整的解決方案，包括數(shù)據(jù)管理、訓(xùn)練和推理，使得整個過程從準(zhǔn)備數(shù)據(jù)到訓(xùn)練和使用模型更加方便。當(dāng)前支持的方法包括穩(wěn)定擴散系列（Stable Diffusion v1.5/v2.1/XL）和SCEdit，分別是用于圖像生成和圖像合成編輯的高效方法。這些方法特別適用于生成高質(zhì)量、細(xì)節(jié)豐富的圖像。

（舉報）

相關(guān)推薦

關(guān)鍵詞：

框架

字節(jié)發(fā)布豆包1.5深度思考模型：“實拍級”圖像生成

快科技4月17日消息，據(jù)報道，今日，在火山引擎AI創(chuàng)新巡展杭州站的現(xiàn)場，字節(jié)跳動旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。譚待指出，豆包1.5深度思考模型在多個關(guān)鍵領(lǐng)域展現(xiàn)出卓越性能。在數(shù)學(xué)、編程、科學(xué)推理這類專業(yè)領(lǐng)域中，它能夠精準(zhǔn)高效地處理復(fù)雜問題；在創(chuàng)意寫作等通用任務(wù)方面，同樣表現(xiàn)出色。該模型采用MoE架構(gòu)，總參數(shù)為200B，激?

?豆包1.5深度思考模型 ?火山引擎AI創(chuàng)新 ?字節(jié)跳動技術(shù)發(fā)布
AI日報：阿里騰訊全面支持MCP協(xié)議；階躍星辰多模態(tài)推理模型Step-R1-V-Mini；美圖WHEE圖像生成模型Miracle F1

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸F(xiàn)AI領(lǐng)域的熱點內(nèi)容，聚焦開發(fā)者，助你洞悉技術(shù)趨勢、了解創(chuàng)新AI產(chǎn)品應(yīng)用。新鮮AI產(chǎn)品點擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協(xié)議騰訊緊隨其后近日，中國人工智能領(lǐng)域迎來技術(shù)標(biāo)準(zhǔn)的變革，ModelContextProtocol成為國內(nèi)AI生態(tài)的事實標(biāo)準(zhǔn)。12.英偉達發(fā)布Llama3.1NemotronUltra253B，性能?

?人工智能 ?MCP協(xié)議 ?阿里巴巴
阿里開源通義新模型：指定首尾圖片生成視頻

快科技4月18日消息，據(jù)報道，阿里巴巴旗下通義萬相宣布開源其創(chuàng)新視頻生成技術(shù)首尾幀生視頻14B模型。這項突破性AI技術(shù)能夠根據(jù)用戶提供的起始和結(jié)束畫面，智能生成720p高清過渡視頻，為視頻創(chuàng)作帶來全新可能。該模型通過先進的深度學(xué)習(xí)算法，能夠精準(zhǔn)理解輸入畫面的內(nèi)容、風(fēng)格及主題特征。當(dāng)用戶提供首尾兩幀圖像后，模型會智能分析畫面中的視覺元素，包括物體形?

?阿里巴巴 ?通義萬相 ?視頻生成技術(shù)
薦UniToken：多模態(tài)AI的“全能選手”，一次編碼搞定圖文理解與圖像生成

復(fù)旦大學(xué)與美團研究者提出UniToken框架，首次在統(tǒng)一模型中實現(xiàn)圖文理解與生成任務(wù)的"雙優(yōu)表現(xiàn)"。該方案融合連續(xù)和離散視覺編碼，有效解決了傳統(tǒng)多模態(tài)建模中的"任務(wù)干擾"和"表示割裂"問題。通過三階段訓(xùn)練策略（視覺語義對齊、多任務(wù)聯(lián)合訓(xùn)練、指令強化微調(diào)），UniToken在多個基準(zhǔn)測試中性能超越專用模型。其創(chuàng)新性體現(xiàn)在：1）統(tǒng)一的雙邊視覺編碼

?UniToken ?多模態(tài)建模 ?視覺編碼
AI日報： OpenAI推出gpt-image-1圖像生成API;納米AI發(fā)布MCP萬能工具箱;中國占全球AI專利60%

【AI日報】欄目聚焦人工智能領(lǐng)域最新動態(tài)：1) OpenAI推出ChatGPT圖像生成API，開發(fā)者可輕松集成AI繪圖功能，已生成超7億張圖片；2) 谷歌Gemini月活用戶突破3.5億，但仍落后于ChatGPT的6億用戶；3) OpenAI預(yù)測2029年收入將達1250億美元，AI代理業(yè)務(wù)成主要增長點；4) Ostris發(fā)布8B參數(shù)擴散模型Flex.2-preview，優(yōu)化ComfyUI工作流；5) 英偉達推出多模態(tài)LLM模型Describe Anything，支持指定區(qū)域生成詳細(xì)描?

?OpenAI ?ChatGPT ?圖像生成
視頻生成模型Vidu Q1怎么用？Vidu Q1官網(wǎng)是什么？

國產(chǎn)視頻生成大模型Vidu Q1在性能、價格和功能上實現(xiàn)重大突破。該模型由生數(shù)科技推出，在VBench評測中超越Sora等國內(nèi)外頂尖模型，支持1080p高清視頻生成，每秒價格低至3毛錢。其首尾幀功能僅需兩張圖即可實現(xiàn)電影級運鏡效果，支持多元風(fēng)格生成和48kHz高采樣率混音功能。Vidu Q1已深度賦能影視、廣告、動漫等行業(yè)，大幅降低創(chuàng)作門檻。

?國產(chǎn)視頻生成 ?Vidu ?Q1
薦AI日報：騰訊混元3D生成模型2.5版本發(fā)布；海螺推出圖像人物參考功能；百度上線移動端超級智能體心響App

本文介紹了多款A(yù)I領(lǐng)域的新產(chǎn)品和技術(shù)進展：1)Kortix-AI推出開源通用AI智能體平臺Suna；2)騰訊混元3D生成模型升級至2.5版本；3)海螺AI推出基于單張圖像生成多角度角色圖像功能；4)百度發(fā)布"心響"App整合多智能體協(xié)作；5)Nari Labs開源媲美真人的對話語音模型Dia；6)Grok新增視覺處理和多語言支持；7)Genspark推出AI幻燈片工具；8)Character.AI發(fā)布讓靜態(tài)圖片"說話"的AvatarFX模型；9)pad.ws結(jié)合白板和代碼編輯器；10)OpenBMB開源社區(qū)推出長文本生成模型"卷姬"；11)騰訊推出AI閱讀助手"企鵝讀伴"；12)OpenAI有意收購Chrome瀏覽器；13)字節(jié)跳動調(diào)整AI產(chǎn)品線布局。這些創(chuàng)新展現(xiàn)了AI技術(shù)在自動化、3D生成、語音交互、內(nèi)容創(chuàng)作等領(lǐng)域的快速發(fā)展。

?人工智能 ?AI產(chǎn)品 ?開源平臺
谷歌Gemini整合Veo 2視頻生成模型，8秒720P視頻輕松搞定

谷歌宣布又有一款 AI 模型將加入 Gemini，但這次它不僅僅是一個聊天機器人。

?谷歌 ?谷歌gemini ?veo2
ChatGPT上線圖庫功能：可管理AI生成圖片

快科技4月16日消息，據(jù)報道，OpenAI近日宣布將為ChatGPT推出全新的Image Library圖庫功能，該功能將幫助用戶更高效地管理和查看AI生成的圖像。這項創(chuàng)新功能將逐步向所有用戶開放，包括移動端和網(wǎng)頁端的免費版、Plus版及Pro版用戶。新功能的設(shè)計充分考慮了用戶體驗的便捷性。用戶只需點擊ChatGPT側(cè)邊欄的Library入口，就能進入一個直觀的圖像網(wǎng)格界面。在這個界面中，用戶可以輕?

?OpenAI ?ChatGPT ?Image
1至5元不等！有人開始售賣ChatGPT生成的“吉卜力風(fēng)格”圖片了

SNS上出現(xiàn)了售賣吉卜力風(fēng)格圖片的“交易”，一些二手交易平臺上聲稱收到錢后就會幫忙制作吉卜力風(fēng)格圖片的帖子也層出不窮。吉卜力風(fēng)格的圖片轉(zhuǎn)化功能在全球備受歡迎，近一周時間，通過ChatGPT制作的相關(guān)圖片數(shù)量就超過了7億張。想想他們?yōu)榱舜蛟炷撤N獨特風(fēng)格所付出的努力，如今卻遭遇這種無法受到著作權(quán)法保護的情況，無疑會極大地打擊創(chuàng)作者們的積極性。

?動畫風(fēng)格圖片 ?ChatGPT ?吉卜力風(fēng)格

熱文

3 天
7天

站長商機

廣告

商務(wù)合作侵權(quán)投訴廣告服務(wù) 版權(quán)聲明招聘

?CopyRight 2002-2020 CHINAZ.COM