无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

<menu id="yw4o4"></menu>

<menu id="yw4o4"><em id="yw4o4"></em></menu>

<option id="momvq"></option>

AI日報：王炸！ElevenLabs推聲音設計功能；全能型圖像生成模型OmniGen問世；快50倍！OpenAI推全新模型sCM

2024-10-24 15:51 · 稿源：站長之家

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸FAI領域的熱點內容，聚焦開發(fā)者，助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。

新鮮AI產品點擊了解:https://top.aibase.com/

1、ElevenLabs推出AI語音生成工具Voice Design

ElevenLabs最新推出的AI語音生成工具Voice Design開創(chuàng)了AI配音領域的新紀元，通過簡單的文本描述即可創(chuàng)建個性化語音，為用戶提供了直觀的文本提示功能，支持調節(jié)多個語音參數，包括年齡、性別、口音、語調和音高，同時突破性地支持創(chuàng)作角色化語音，為內容創(chuàng)作者提供了前所未有的聲音定制自由。

【AiBase提要:】
?? 用戶只需描述所需聲音特征，系統快速生成符合要求的語音。
?? Voice Design支持創(chuàng)作角色化語音，捕捉并還原虛擬角色的聲音特征。
?? AI語音定制化進入全新階段，為游戲開發(fā)、有聲內容制作等領域提供強大的創(chuàng)意工具。
詳情鏈接:https://elevenlabs.io/voice-design

2、吊打ControlNe?全能型圖像生成模型OmniGen問世，簡單提示實現圖像生成與精細編輯

OmniGen是一款全新的圖像生成模型，與以往工具不同的是，它具備多種能力，包括文本到圖像生成、圖像編輯等，用戶只需提供簡單提示詞即可控制圖像生成與精細編輯，無需使用ControlNe等插件。該模型架構簡化，結合了變分自編碼器和預訓練的Transformer模型，訓練數據集龐大多樣，表現優(yōu)秀。

【AiBase提要:】
?? OmniGen具備多種能力，包括文本到圖像生成、圖像編輯，用戶體驗極佳。
?? OmniGen采用簡化架構，結合變分自編碼器和Transformer模型，訓練數據集龐大多樣，效果出色。
?? OmniGen在多項測試中表現驚艷，文本到圖像生成能力與市面先進模型相當，圖像編輯能力優(yōu)秀。
體驗入口:https://huggingface.co/spaces/Shitao/OmniGen

3、科大訊飛星火4.0Turbo大模型發(fā)布

科大訊飛在全球 1024 開發(fā)者節(jié)上展示了訊飛星火4.0Turbo大模型，超越了之前版本和GPT-4Turbo，在數學和編程能力上表現出色，效率提升50%。同時推出了星火代碼7B版本和超擬人數字人，實現了語義貫穿的自然交互體驗。

【AiBase提要:】
? 訊飛星火4.0Turbo在數學和編程能力上超越了GPT-4Turbo，整體效率提升50%。
?? 在 14 項主流測試中取得 9 項第一名成績，展現出卓越的性能表現。
?? 推出星火代碼7B版本和超擬人數字人，實現了多模態(tài)交互和更真實的交互體驗。

4、OpenAI推全新模型sCM，內容生成速度提升 50 倍，生圖只需0. 1 秒

OpenAI的研究團隊發(fā)布了一項令人振奮的研究成果，介紹了全新的連續(xù)時間一致性模型（sCM），其生成多媒體內容的速度實現了飛躍，相較傳統擴散模型提高了 50 倍。sCM在不到0. 1 秒內生成一幅圖像，僅需兩步采樣即可生成高質量樣本，未來應用廣泛，潛力巨大。

【AiBase提要:】
?? 速度提升 50 倍，圖像生成時間縮短至0. 1 秒
??? 僅需兩步采樣，sCM能生成高質量樣本，效率顯著提高
?? 未來應用廣泛，包括實時圖像、音頻和視頻生成，潛力巨大
詳情鏈接:https://openai.com/index/simplifying-stabilizing-and-scaling-continuous-time-consistency-models/

5、谷歌開源AI文本水印工具SynthID

谷歌最近開源了文本水印工具SynthID，旨在幫助開發(fā)者更好地識別AI生成的文本。這一舉措對應對虛假信息和不當內容具有重要意義，同時推動了AI技術的發(fā)展和應用。

【AiBase提要:】
?? SynthID開源，助力開發(fā)者識別AI生成文本。
??? 水印技術在應對虛假信息和不當內容中愈發(fā)重要。
?? 谷歌的SynthID能微調文本生成的概率分數，形成水印。
詳情鏈接:https://ai.google.dev/responsible/docs/safeguards/synthid?hl=zh-cn

6、iOS18.2beta1 已經向開發(fā)者發(fā)布包含集成的 ChatGPT

蘋果最近發(fā)布了 iOS18. 2 的第一個開發(fā)者測試版，增加了一些新的 Apple Intelligence 功能，包括 Genmoji 表情符號、Image Playground 圖像生成、AI 驅動的寫作功能、ChatGPT 集成和 Visual Intelligence 等。蘋果的 Apple Intelligence 功能旨在提供更智能、個性化的體驗，但某些功能如讓 Siri 了解屏幕內容尚未實現。

【AiBase提要:】
?? iOS18.2Beta1 中 Siri 正式接入 ChatGPT，增強自然語言理解能力。
?? 新增的 Genmoji 和 Image Playground 功能允許用戶生成個性化的表情符號和圖像。
?? Visual Intelligence 功能支持通過 iPhone16 相機進行智能搜索，提升信息獲取效率。

7、 14 歲少年沉迷聊天機器人后不幸離世，Character.AI 和谷歌面臨訴訟

這篇文章報道了一名 14 歲少年因沉迷于與Character.AI的聊天機器人互動而選擇結束生命，引發(fā)了一場訴訟。文章揭露了Character.AI被指控存在失職和誤導行為，涉及提供未經許可的心理治療以及過度擬人化的聊天機器人設計。同時，Character.AI宣布了一系列新的安全措施以保護未成年用戶，減少心理健康風險。

【AiBase提要:】
?? 訴訟揭露Character.AI和谷歌被指存在失職和誤導行為，引發(fā)關注和討論。
?? 被指控提供未經許可的心理治療，聊天機器人設計過度擬人化，引發(fā)道德和法律爭議。
?? Character.AI宣布新安全措施，包括修改未成年人模型、加入免責聲明等，提升用戶保護措施。

8、OpenAI 科學家: 20 秒思考能比 10 萬倍數據更有效!

在最近的 TED AI 大會上，OpenAI 的研究科學家諾亞姆?布朗介紹了 OpenAI 新發(fā)布的 o1 模型，強調了系統二思維對于改變各行業(yè)決策方式的重要性。布朗指出， 20 秒的思考時間能帶來比 10 萬倍數據更好的效果，而 o1 模型在多個領域展現出卓越性能。他強調 AI 需要超越數據處理，進入更深思熟慮的系統二思維。

【AiBase提要:】
?? 系統二思維是未來 AI 發(fā)展的關鍵，能提升決策質量。
? 20 秒的思考時間能帶來比 10 萬倍數據更好的效果。
?? OpenAI 新發(fā)布的 o1 模型在多個領域展現出卓越的性能。

9、研究人員開發(fā)了新 LLM 越獄方法，成功率高達65%

近日，網絡安全公司 Palo Alto Networks 的 Unit42 研究團隊發(fā)布了一項令人矚目的研究，揭露了一種名為 “Deceptive Delight”的新型越獄方法。該方法能夠在僅僅兩到三次交互中，成功誘導大型語言模型（LLM）生成有害內容，其成功率高達65%，為保護 LLM 的安全性敲響了警鐘。

【AiBase提要:】
?? 新型越獄方法兩到三次交互中誘導 LLM 生成有害內容，成功率高達65%。
?? 不同模型的成功率差異明顯，單一模型成功率最高可達80.6%。
??? 為應對越獄攻擊，建議增加內容過濾器和清晰的系統提示，提升安全性。

10、蘋果發(fā)布三款適用于Apple Intelligence的API

蘋果公司最新發(fā)布的開發(fā)者測試版帶來了多項新的 Apple Intelligence 功能，包括 Genmoji、Image Playground、Visual Intelligence、Image Wand 和 ChatGPT 集成合，極大地增強了用戶體驗。此次更新還推出了三個關鍵功能的 API，幫助開發(fā)者將蘋果的小型模型生成 AI 集成到應用程序中。雖然擴展了英語本地化支持多個國家，但未來將支持更多語言，對中國和歐盟用戶可能存在不確定性。

【AiBase提要:】
?? 蘋果發(fā)布 iOS18. 2 等新測試版，推出多項 Apple Intelligence 功能。
?? 新增的 API 將幫助開發(fā)者集成生成式 AI 到應用中。
?? 擴展的英語本地化支持多個國家，未來將支持更多語言。

11、Zoom發(fā)布AI助手2. 0 版本:輕松整理會議要點

Zoom最新推出的AI助手2. 0 版本為用戶提供了更高效的工作管理和團隊協作體驗。AI Companion2. 0 不僅能在會議中提供即時幫助，還可以管理郵件和聊天記錄，撰寫感謝信等，全面提升工作效率。Zoom向AI優(yōu)先工作平臺邁出重要一步，免費提供給擁有付費賬戶的用戶。

【AiBase提要:】
? AI Companion2. 0 是Zoom新推出的AI助手，旨在提升工作效率。
?? 用戶可以在會議中提問獲取即時幫助，并輕松回顧重要信息。
?? AI助手支持郵件和聊天記錄的管理，還能撰寫感謝信和生成項目草稿。

（舉報）

相關推薦

關鍵詞：

AI日報：阿里騰訊全面支持MCP協議；階躍星辰多模態(tài)推理模型Step-R1-V-Mini；美圖WHEE圖像生成模型Miracle F1

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸FAI領域的熱點內容，聚焦開發(fā)者，助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。新鮮AI產品點擊了解:https://top.aibase.com/1、阿里巴巴已宣布全面支持MCP協議騰訊緊隨其后近日，中國人工智能領域迎來技術標準的變革，ModelContextProtocol成為國內AI生態(tài)的事實標準。12.英偉達發(fā)布Llama3.1NemotronUltra253B，性能?

?人工智能 ?MCP協議 ?阿里巴巴
AI日報： OpenAI推出gpt-image-1圖像生成API;納米AI發(fā)布MCP萬能工具箱;中國占全球AI專利60%

【AI日報】欄目聚焦人工智能領域最新動態(tài)：1) OpenAI推出ChatGPT圖像生成API，開發(fā)者可輕松集成AI繪圖功能，已生成超7億張圖片；2) 谷歌Gemini月活用戶突破3.5億，但仍落后于ChatGPT的6億用戶；3) OpenAI預測2029年收入將達1250億美元，AI代理業(yè)務成主要增長點；4) Ostris發(fā)布8B參數擴散模型Flex.2-preview，優(yōu)化ComfyUI工作流；5) 英偉達推出多模態(tài)LLM模型Describe Anything，支持指定區(qū)域生成詳細描?

?OpenAI ?ChatGPT ?圖像生成
字節(jié)發(fā)布豆包1.5深度思考模型：“實拍級”圖像生成

快科技4月17日消息，據報道，今日，在火山引擎AI創(chuàng)新巡展杭州站的現場，字節(jié)跳動旗下火山引擎總裁譚待正式發(fā)布了備受矚目的豆包1.5深度思考模型。譚待指出，豆包1.5深度思考模型在多個關鍵領域展現出卓越性能。在數學、編程、科學推理這類專業(yè)領域中，它能夠精準高效地處理復雜問題；在創(chuàng)意寫作等通用任務方面，同樣表現出色。該模型采用MoE架構，總參數為200B，激?

?豆包1.5深度思考模型 ?火山引擎AI創(chuàng)新 ?字節(jié)跳動技術發(fā)布
薦AI日報：智譜開源32B/9B系列GLM模型并啟用Z.ai域名；OpenAI發(fā)布GPT-4.1系列模型；阿里魔搭上線MCP廣場

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸FAI領域的熱點內容，聚焦開發(fā)者，助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。新鮮AI產品點擊了解:https://top.aibase.com/1、智譜AI啟用全新域名Z.ai 并開源32B/9B 系列 GLM 模型智譜技術團隊近期宣布開源32B和9B系列的GLM模型，并推出全新交互體驗平臺Z.ai。這些模型遵循MIT許可協議，支持商業(yè)用途，提升了

?人工智能 ?開源模型 ?GLM模型
薦AI日報：阿里新模型Qwen3即將來襲；GitHub開源MCP服務器；Runway發(fā)布Gen-4 Turbo

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸FAI領域的熱點內容，聚焦開發(fā)者，助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。新鮮AI產品點擊了解:https://top.aibase.com/1、Qwen3即將來襲:阿里云新模型相關支持已正式合并至vLLM代碼庫阿里云的Qwen3模型即將發(fā)布，標志著其在AI領域的又一重要進展。新推出的AI聽歌報告能夠精準識別用戶音樂偏好，場景

?人工智能 ?阿里云 ?Qwen3
薦AI日報：騰訊混元3D生成模型2.5版本發(fā)布；海螺推出圖像人物參考功能；百度上線移動端超級智能體心響App

本文介紹了多款AI領域的新產品和技術進展：1)Kortix-AI推出開源通用AI智能體平臺Suna；2)騰訊混元3D生成模型升級至2.5版本；3)海螺AI推出基于單張圖像生成多角度角色圖像功能；4)百度發(fā)布"心響"App整合多智能體協作；5)Nari Labs開源媲美真人的對話語音模型Dia；6)Grok新增視覺處理和多語言支持；7)Genspark推出AI幻燈片工具；8)Character.AI發(fā)布讓靜態(tài)圖片"說話"的AvatarFX模型；9)pad.ws結合白板和代碼編輯器；10)OpenBMB開源社區(qū)推出長文本生成模型"卷姬"；11)騰訊推出AI閱讀助手"企鵝讀伴"；12)OpenAI有意收購Chrome瀏覽器；13)字節(jié)跳動調整AI產品線布局。這些創(chuàng)新展現了AI技術在自動化、3D生成、語音交互、內容創(chuàng)作等領域的快速發(fā)展。

?人工智能 ?AI產品 ?開源平臺
薦UniToken：多模態(tài)AI的“全能選手”，一次編碼搞定圖文理解與圖像生成

復旦大學與美團研究者提出UniToken框架，首次在統一模型中實現圖文理解與生成任務的"雙優(yōu)表現"。該方案融合連續(xù)和離散視覺編碼，有效解決了傳統多模態(tài)建模中的"任務干擾"和"表示割裂"問題。通過三階段訓練策略（視覺語義對齊、多任務聯合訓練、指令強化微調），UniToken在多個基準測試中性能超越專用模型。其創(chuàng)新性體現在：1）統一的雙邊視覺編碼

?UniToken ?多模態(tài)建模 ?視覺編碼
ChatGPT圖像生成爆火！OpenAI CEO在線求助：急需10萬塊GPU

OpenAI近期推出的全新圖像生成工具引發(fā)了熱潮，用戶使用ChatGPT即可創(chuàng)作出吉卜力等風格的AI藝術作品。這一功能不僅推動了ChatGPT用戶數的創(chuàng)新高導致服務器負擔過重，甚至一度限制了該功能的使用。SensorTower的數據顯示，ChatGPT應用的全球下載量和每周活躍用戶數分別較上周增長了11%和5%應用內購買收入則增加了6%。

?OpenAI ?ChatGPT ?圖像生成
薦AI日報：字節(jié)發(fā)布豆包1.5深度思考模型；微信首個AI助手 “元寶” 上線；OpenAI發(fā)布o4-mini、滿血版o3

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸FAI領域的熱點內容，聚焦開發(fā)者，助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。新鮮AI產品點擊了解:https://top.aibase.com/1、OpenAI發(fā)布兩款多模態(tài)推理模型o4-mini、滿血版o3OpenAI在技術直播中推出了其最新的多模態(tài)模型o4-mini和滿血版o3，這兩款模型具備同時處理文本、圖像和音頻的能力，并能調用外部工?

?人工智能 ?多模態(tài)模型 ?OpenAI
薦AI日報：OpenAI下周或發(fā)布GPT-4.1系列；Pika全新AI視頻功能Twists；商湯科技日日新V6震撼發(fā)布

歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南，每天我們?yōu)槟愠尸FAI領域的熱點內容，聚焦開發(fā)者，助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。新鮮AI產品點擊了解:https://top.aibase.com/1、報道稱OpenAI下周重磅發(fā)布GPT-4.1系列，包含Mini版和Nano版OpenAI即將發(fā)布GPT-4.1系列及o3系列，標志著其在多模態(tài)和推理能力上的重大進展。新加坡在AI技能學習上投入的時間顯著高于其他亞太國家，顯示出其在AI人才培養(yǎng)方面的競爭力。

?OpenAI ?GPT-4.1 ?多模態(tài)AI

熱文

3 天
7天

站長商機

廣告

商務合作侵權投訴廣告服務版權聲明招聘

?CopyRight 2002-2020 CHINAZ.COM