站長之家(ChinaZ.com) 12 月 22 日消息:2023 年,人工智能(AI)領(lǐng)域見證了重大進展,不僅公眾對 AI 有了更深的理解,政府也開始認(rèn)真對待 AI 風(fēng)險。本年度的發(fā)展不僅是新技術(shù)和理念的出現(xiàn),更是長期孕育后的集中爆發(fā)。
以下是過去一年中人工智能領(lǐng)域最重要的三項創(chuàng)新:
多模態(tài) AI(Multimodality)多模態(tài) AI 指的是 AI 系統(tǒng)處理各種不同類型數(shù)據(jù)的能力,不僅包括文本,還包括圖像、視頻、音頻等。今年,公眾首次獲得了強大的多模態(tài) AI 模型的訪問權(quán)限。OpenAI 的 GPT-4 是其中的先鋒,允許用戶上傳圖像以及文本輸入。例如,用戶可以基于冰箱內(nèi)容的照片詢問 GPT-4 晚餐應(yīng)該做什么。9 月,OpenAI 推出了用戶通過語音以及文本與 ChatGPT 互動的功能。
憲法 AI(Constitutional AI)憲法 AI 嘗試解決如何使 AI 符合人類價值觀的難題。2022 年 12 月,頂尖 AI 實驗室 Anthropic 的研究人員首次描述了憲法 AI,并在其 2023 年推出的聊天機器人 Claude 中使用了這一技術(shù)。該技術(shù)的核心是先撰寫一份表達期望 AI 遵循的價值觀的「憲法」,然后訓(xùn)練 AI 根據(jù)憲法評分響應(yīng),并激勵模型輸出得分更高的響應(yīng)。這是一種 AI 反饋的強化學(xué)習(xí)方法,與人類反饋的強化學(xué)習(xí)相比,更精確控制 AI 行為,且需更少的人類標(biāo)簽。
文本轉(zhuǎn)視頻技術(shù)文本轉(zhuǎn)視頻工具的迅速崛起是今年投入 AI 領(lǐng)域的數(shù)十億美元資金的顯著成果。布魯克林的 AI 視頻初創(chuàng)公司 Runway 的最新模型 Gen-2 允許用戶不僅根據(jù)文本生成視頻,還能根據(jù)文本提示改變現(xiàn)有視頻的風(fēng)格。此外,另一家初創(chuàng)公司 Pika AI 正在使用其技術(shù)每周創(chuàng)建數(shù)百萬新視頻。這些免費工具試圖改變用戶生成內(nèi)容的格局,可能在 2024 年發(fā)生,但由于文本轉(zhuǎn)視頻工具計算成本高,一旦風(fēng)險資本用盡,它們可能開始收費。
(舉報)