无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁(yè) > 業(yè)界 > 關(guān)鍵詞  > DALL-E最新資訊  > 正文

    OpenAI 發(fā)布 DALL-E 3 文生圖模型:與 ChatGPT 完全集成 在細(xì)節(jié)和提示保真度方面挑戰(zhàn)極限

    2023-09-21 08:55 · 稿源:站長(zhǎng)之家

    站長(zhǎng)之家(ChinaZ.com) 9月21日消息:本周三,OpenAI 宣布了 DALL-E 3,這是其最新版本的 AI 圖像合成模型,它與 ChatGPT 完全集成。

    OpenAI,ChatGPT,人工智能,AI

    DALL-E 3 通過(guò)緊密遵循復(fù)雜的描述并處理圖像內(nèi)文本生成(如標(biāo)簽和標(biāo)志)來(lái)渲染圖像,這是早期模型所面臨的挑戰(zhàn)。目前處于研究預(yù)覽階段,將于十月初提供給 ChatGPT Plus 和企業(yè)客戶。

    與其前身一樣,DALL-E 3 是一種文本到圖像生成器,根據(jù)稱為提示的書(shū)面描述創(chuàng)建新穎的圖像。盡管 OpenAI 沒(méi)有透露關(guān)于 DALL-E 3 的技術(shù)細(xì)節(jié),但以前版本的 DALL-E 的核心 AI 模型是基于由人類藝術(shù)家和攝影師創(chuàng)作的數(shù)百萬(wàn)張圖像進(jìn)行訓(xùn)練的,其中一些是從像 Shutterstock 這樣的庫(kù)網(wǎng)站獲得許可的。DALL-E 3 很可能也遵循了這一相同的方法,但使用了新的訓(xùn)練技術(shù)和更多的計(jì)算訓(xùn)練時(shí)間。

    從 OpenAI 在其宣傳博客上提供的示例來(lái)看,DALL-E 3 似乎是迄今為止可用于按提示操作的圖像合成模型中的一個(gè)巨大突破。盡管 OpenAI 的示例是精選的,以展示其效果,但它們似乎忠實(shí)地遵循了提示的指令,并以無(wú)需任何「黑科技」或提示工程即可令對(duì)象逼真地呈現(xiàn)出來(lái)。

    與 DALL-E 2 相比,OpenAI 表示 DALL-E 3 能夠更有效地細(xì)化手部等小細(xì)節(jié),從而默認(rèn)情況下創(chuàng)建引人入勝的圖像。

    相比之下,來(lái)自另一競(jìng)爭(zhēng)對(duì)手供應(yīng)商 Midjourney 渲染了逼真的細(xì)節(jié),但仍然需要對(duì)提示進(jìn)行大量反直覺(jué)的調(diào)整才能控制圖像輸出。

    DALL-E 3 似乎還可以處理圖像中的文本,而其前身無(wú)法做到這一點(diǎn)(一些競(jìng)爭(zhēng)模型,如 Stable Diffusion XL 和 DeepFloyd,在這方面表現(xiàn)得越來(lái)越好)。例如,包含「一幅畫(huà)中,一個(gè)鱷梨坐在治療師椅子上,說(shuō)著我感到內(nèi)心空虛』,中間有一個(gè)坑孔大小的洞」的提示,創(chuàng)建了一個(gè)卡通鱷梨,角色的臺(tái)詞完美地被包含在一個(gè)對(duì)話氣泡中。

    avocado-square.jpg

    圖片來(lái)自OpenAI

    值得注意的是,OpenAI 表示 DALL-E 3 是「在 ChatGPT 上本地構(gòu)建」的,并將作為 ChatGPT Plus 的一個(gè)集成功能推出,使 AI 助手能夠作為頭腦風(fēng)暴的合作伙伴以一種與當(dāng)前對(duì)話的背景相一致的上下文環(huán)境方式生成圖像。這可能會(huì)帶來(lái)新的能力。微軟的 Bing Chat AI 助手,也是基于 OpenAI 的技術(shù)構(gòu)建的,自去年三月以來(lái)就能夠在對(duì)話中生成圖像。

    DALL-E 的原始版本于 2021 年 1 月出現(xiàn),OpenAI 在 2022 年 4 月推出了更強(qiáng)大的續(xù)作,以令人震驚的方式引發(fā)了 AI 生成圖像的新時(shí)代,深深吸引了最初的封閉測(cè)試者。DALL-E 模型使用一種稱為「潛在擴(kuò)散」的技術(shù),將噪音轉(zhuǎn)化為它從訓(xùn)練數(shù)據(jù)集中獲得的知識(shí)和提示的圖像。同樣的技術(shù)在去年 8 月也使開(kāi)放權(quán)重模型 Stable Diffusion 誕生。

    由于 DALL-E 是通過(guò)從人類創(chuàng)作的藝術(shù)作品的大規(guī)模數(shù)據(jù)集中獲取概念來(lái)學(xué)習(xí)圖像的,自從去年引入主流以來(lái),AI 圖像生成技術(shù)一直備受爭(zhēng)議。這項(xiàng)技術(shù)引發(fā)了藝術(shù)家的抗議,他們擔(dān)心它會(huì)取代他們或不道德地復(fù)制他們的風(fēng)格,引發(fā)了關(guān)于未經(jīng)版權(quán)持有人同意使用作為訓(xùn)練數(shù)據(jù)的被抓取圖像的版權(quán)侵權(quán)的訴訟,以及關(guān)于美國(guó)版權(quán)辦公室和美國(guó)地方法院對(duì)版權(quán)的新裁決。

    作為對(duì)這些爭(zhēng)議的回應(yīng),OpenAI 表示,DALL-E 3 將拒絕要求以在世藝術(shù)家風(fēng)格制作圖像的請(qǐng)求。OpenAI 還提供了一個(gè)表單,供創(chuàng)作者選擇不讓他們的圖像用于訓(xùn)練未來(lái)的模型。這些措施似乎不太可能滿足那些通常認(rèn)為 AI 訓(xùn)練應(yīng)該僅限于選擇加入而不包含在默認(rèn)圖像數(shù)據(jù)集中的藝術(shù)家。

    目前,美國(guó)的版權(quán)政策規(guī)定,純粹由 AI 生成的藝術(shù)作品無(wú)法獲得版權(quán)保護(hù),因此使用 DALL-E 3 創(chuàng)建的任何圖像都將屬于公有領(lǐng)域。盡管 OpenAI 沒(méi)有明確承認(rèn)這一點(diǎn),但它表示「您使用 DALL-E 3 創(chuàng)建的圖像屬于您,您無(wú)需我們的許可即可重新印刷、銷售或制作商品。」這與去年 OpenAI 根據(jù)擁有所有生成物權(quán)的許可限制 DALL-E 2 圖像使用的情況有了顯著變化。

    關(guān)于安全性,OpenAI 表示,與 DALL-E 2 一樣,DALL-E 3 已經(jīng)實(shí)施了關(guān)鍵字和圖像檢測(cè)過(guò)濾器,以限制其生成暴力、性或令人討厭的內(nèi)容。該系統(tǒng)還被編程拒絕生成涉及具名公眾人物的請(qǐng)求,這一點(diǎn)在競(jìng)爭(zhēng)的 AI 圖像生成器 Midjourney 生成唐納德·特朗普的虛假逮捕圖像時(shí)曾引發(fā)問(wèn)題。

    OpenAI 表示,已經(jīng)與被稱為「紅隊(duì)成員」的專家合作,以識(shí)別和減輕潛在風(fēng)險(xiǎn),如有害的偏見(jiàn)或制造宣傳和虛假信息。OpenAI 沒(méi)有提及其工具潛在用于以具有說(shuō)服力的虛構(gòu)來(lái)扭曲歷史記錄,盡管它表示正在嘗試使用「來(lái)源分類器」工具,該工具可以幫助確定圖像是否由 DALL-E 3 生成。

    OpenAI 表示,這款 AI 圖像生成器正在進(jìn)行封閉測(cè)試。計(jì)劃通過(guò) API 在十月提供給 ChatGPT Plus 和企業(yè)客戶,并在今年晚些時(shí)候在實(shí)驗(yàn)室中提供。

    舉報(bào)

    • 相關(guān)推薦