歡迎來到【AI日報】欄目!這里是你每天探索人工智能世界的指南,每天我們?yōu)槟愠尸FAI領域的熱點內容,聚焦開發(fā)者,助你洞悉技術趨勢、了解創(chuàng)新AI產品應用。
新鮮AI產品點擊了解:https://top.aibase.com/
1、ElevenLabs推出AI語音生成工具Voice Design
ElevenLabs最新推出的AI語音生成工具Voice Design開創(chuàng)了AI配音領域的新紀元,通過簡單的文本描述即可創(chuàng)建個性化語音,為用戶提供了直觀的文本提示功能,支持調節(jié)多個語音參數,包括年齡、性別、口音、語調和音高,同時突破性地支持創(chuàng)作角色化語音,為內容創(chuàng)作者提供了前所未有的聲音定制自由。
【AiBase提要:】
?? 用戶只需描述所需聲音特征,系統快速生成符合要求的語音。
?? Voice Design支持創(chuàng)作角色化語音,捕捉并還原虛擬角色的聲音特征。
?? AI語音定制化進入全新階段,為游戲開發(fā)、有聲內容制作等領域提供強大的創(chuàng)意工具。
詳情鏈接:https://elevenlabs.io/voice-design
2、吊打ControlNe?全能型圖像生成模型OmniGen問世,簡單提示實現圖像生成與精細編輯
OmniGen是一款全新的圖像生成模型,與以往工具不同的是,它具備多種能力,包括文本到圖像生成、圖像編輯等,用戶只需提供簡單提示詞即可控制圖像生成與精細編輯,無需使用ControlNe等插件。該模型架構簡化,結合了變分自編碼器和預訓練的Transformer模型,訓練數據集龐大多樣,表現優(yōu)秀。
【AiBase提要:】
?? OmniGen具備多種能力,包括文本到圖像生成、圖像編輯,用戶體驗極佳。
?? OmniGen采用簡化架構,結合變分自編碼器和Transformer模型,訓練數據集龐大多樣,效果出色。
?? OmniGen在多項測試中表現驚艷,文本到圖像生成能力與市面先進模型相當,圖像編輯能力優(yōu)秀。
體驗入口:https://huggingface.co/spaces/Shitao/OmniGen
3、科大訊飛星火4.0Turbo大模型發(fā)布
科大訊飛在全球 1024 開發(fā)者節(jié)上展示了訊飛星火4.0Turbo大模型,超越了之前版本和GPT-4Turbo,在數學和編程能力上表現出色,效率提升50%。同時推出了星火代碼7B版本和超擬人數字人,實現了語義貫穿的自然交互體驗。
【AiBase提要:】
? 訊飛星火4.0Turbo在數學和編程能力上超越了GPT-4Turbo,整體效率提升50%。
?? 在 14 項主流測試中取得 9 項第一名成績,展現出卓越的性能表現。
?? 推出星火代碼7B版本和超擬人數字人,實現了多模態(tài)交互和更真實的交互體驗。
4、OpenAI推全新模型sCM,內容生成速度提升 50 倍,生圖只需0. 1 秒
OpenAI的研究團隊發(fā)布了一項令人振奮的研究成果,介紹了全新的連續(xù)時間一致性模型(sCM),其生成多媒體內容的速度實現了飛躍,相較傳統擴散模型提高了 50 倍。sCM在不到0. 1 秒內生成一幅圖像,僅需兩步采樣即可生成高質量樣本,未來應用廣泛,潛力巨大。
【AiBase提要:】
?? 速度提升 50 倍,圖像生成時間縮短至0. 1 秒
??? 僅需兩步采樣,sCM能生成高質量樣本,效率顯著提高
?? 未來應用廣泛,包括實時圖像、音頻和視頻生成,潛力巨大
詳情鏈接:https://openai.com/index/simplifying-stabilizing-and-scaling-continuous-time-consistency-models/
5、谷歌開源AI文本水印工具SynthID
谷歌最近開源了文本水印工具SynthID,旨在幫助開發(fā)者更好地識別AI生成的文本。這一舉措對應對虛假信息和不當內容具有重要意義,同時推動了AI技術的發(fā)展和應用。
【AiBase提要:】
?? SynthID開源,助力開發(fā)者識別AI生成文本。
??? 水印技術在應對虛假信息和不當內容中愈發(fā)重要。
?? 谷歌的SynthID能微調文本生成的概率分數,形成水印。
詳情鏈接:https://ai.google.dev/responsible/docs/safeguards/synthid?hl=zh-cn
6、iOS18.2beta1 已經向開發(fā)者發(fā)布 包含集成的 ChatGPT
蘋果最近發(fā)布了 iOS18. 2 的第一個開發(fā)者測試版,增加了一些新的 Apple Intelligence 功能,包括 Genmoji 表情符號、Image Playground 圖像生成、AI 驅動的寫作功能、ChatGPT 集成和 Visual Intelligence 等。蘋果的 Apple Intelligence 功能旨在提供更智能、個性化的體驗,但某些功能如讓 Siri 了解屏幕內容尚未實現。
【AiBase提要:】
?? iOS18.2Beta1 中 Siri 正式接入 ChatGPT,增強自然語言理解能力。
?? 新增的 Genmoji 和 Image Playground 功能允許用戶生成個性化的表情符號和圖像。
?? Visual Intelligence 功能支持通過 iPhone16 相機進行智能搜索,提升信息獲取效率。
7、 14 歲少年沉迷聊天機器人后不幸離世,Character.AI 和谷歌面臨訴訟
這篇文章報道了一名 14 歲少年因沉迷于與Character.AI的聊天機器人互動而選擇結束生命,引發(fā)了一場訴訟。文章揭露了Character.AI被指控存在失職和誤導行為,涉及提供未經許可的心理治療以及過度擬人化的聊天機器人設計。同時,Character.AI宣布了一系列新的安全措施以保護未成年用戶,減少心理健康風險。
【AiBase提要:】
?? 訴訟揭露Character.AI和谷歌被指存在失職和誤導行為,引發(fā)關注和討論。
?? 被指控提供未經許可的心理治療,聊天機器人設計過度擬人化,引發(fā)道德和法律爭議。
?? Character.AI宣布新安全措施,包括修改未成年人模型、加入免責聲明等,提升用戶保護措施。
8、OpenAI 科學家: 20 秒思考能比 10 萬倍數據更有效!
在最近的 TED AI 大會上,OpenAI 的研究科學家諾亞姆?布朗介紹了 OpenAI 新發(fā)布的 o1 模型,強調了系統二思維對于改變各行業(yè)決策方式的重要性。布朗指出, 20 秒的思考時間能帶來比 10 萬倍數據更好的效果,而 o1 模型在多個領域展現出卓越性能。他強調 AI 需要超越數據處理,進入更深思熟慮的系統二思維。
【AiBase提要:】
?? 系統二思維是未來 AI 發(fā)展的關鍵,能提升決策質量。
? 20 秒的思考時間能帶來比 10 萬倍數據更好的效果。
?? OpenAI 新發(fā)布的 o1 模型在多個領域展現出卓越的性能。
9、研究人員開發(fā)了新 LLM 越獄方法,成功率高達65%
近日,網絡安全公司 Palo Alto Networks 的 Unit42 研究團隊發(fā)布了一項令人矚目的研究,揭露了一種名為 “Deceptive Delight”的新型越獄方法。該方法能夠在僅僅兩到三次交互中,成功誘導大型語言模型(LLM)生成有害內容,其成功率高達65%,為保護 LLM 的安全性敲響了警鐘。
【AiBase提要:】
?? 新型越獄方法兩到三次交互中誘導 LLM 生成有害內容,成功率高達65%。
?? 不同模型的成功率差異明顯,單一模型成功率最高可達80.6%。
??? 為應對越獄攻擊,建議增加內容過濾器和清晰的系統提示,提升安全性。
10、蘋果發(fā)布三款適用于Apple Intelligence的API
蘋果公司最新發(fā)布的開發(fā)者測試版帶來了多項新的 Apple Intelligence 功能,包括 Genmoji、Image Playground、Visual Intelligence、Image Wand 和 ChatGPT 集成合,極大地增強了用戶體驗。此次更新還推出了三個關鍵功能的 API,幫助開發(fā)者將蘋果的小型模型生成 AI 集成到應用程序中。雖然擴展了英語本地化支持多個國家,但未來將支持更多語言,對中國和歐盟用戶可能存在不確定性。
【AiBase提要:】
?? 蘋果發(fā)布 iOS18. 2 等新測試版,推出多項 Apple Intelligence 功能。
?? 新增的 API 將幫助開發(fā)者集成生成式 AI 到應用中。
?? 擴展的英語本地化支持多個國家,未來將支持更多語言。
11、Zoom發(fā)布AI助手2. 0 版本:輕松整理會議要點
Zoom最新推出的AI助手2. 0 版本為用戶提供了更高效的工作管理和團隊協作體驗。AI Companion2. 0 不僅能在會議中提供即時幫助,還可以管理郵件和聊天記錄,撰寫感謝信等,全面提升工作效率。Zoom向AI優(yōu)先工作平臺邁出重要一步,免費提供給擁有付費賬戶的用戶。
【AiBase提要:】
? AI Companion2. 0 是Zoom新推出的AI助手,旨在提升工作效率。
?? 用戶可以在會議中提問獲取即時幫助,并輕松回顧重要信息。
?? AI助手支持郵件和聊天記錄的管理,還能撰寫感謝信和生成項目草稿。
(舉報)