站長(zhǎng)之家(ChinaZ.com) 4月30日 消息:自上周以來(lái),幾乎所有用戶都對(duì) ChatGPT 的一種奇怪行為提出了抱怨。在這樣的情況下,OpenAI 部署并撤回了對(duì) ChatGPT 的一次更新。
OpenAI 在最近發(fā)布的一篇博客文章中解釋了這一切。
ChatGPT 用戶希望這個(gè)聊天機(jī)器人能更有人情味,并少一些刻板、少一點(diǎn)生硬。與 ChatGPT“公式化”的回復(fù)風(fēng)格相比,不少用戶們認(rèn)為 Anthropic 公司的 Claude 聊天機(jī)器人的回復(fù)更有人情味。
這就是為什么 OpenAI 上周針對(duì) GPT-4o 模型進(jìn)行了一次更新,山姆?奧爾特曼(Sam Altman)稱,這次更新 “提升了智能和個(gè)性”。
兩天后,奧爾特曼承認(rèn)了每個(gè)用戶都注意到的一個(gè)問(wèn)題 —— 最近幾次的 GPT-4o 更新讓這款聊天機(jī)器人變成得太過(guò)諂媚和煩人了。他們表示,正在努力進(jìn)行修復(fù),今天及本周內(nèi)都會(huì)陸續(xù)有一些改進(jìn)。
基本上,對(duì)于任何需要反饋的問(wèn)題,ChatGPT 都會(huì)以極其不真誠(chéng)的贊美來(lái)回應(yīng)。這種情況很可笑,也讓人很尷尬。
目前,OpenAI 采取的修復(fù)措施是完全回滾到上周發(fā)布的版本。
至于發(fā)生了什么,OpenAI 將其歸咎于“過(guò)于關(guān)注短期反饋而忽視了長(zhǎng)期使用情況”。
他們表示:
在上周的 GPT-4o 更新中,我們進(jìn)行了一些調(diào)整,這是為了改善模型的默認(rèn)個(gè)性,讓它在各種任務(wù)中感覺(jué)更直觀、更有效。
在塑造模型行為時(shí),我們從我們《模型規(guī)格》的基本原則和指令出發(fā)。同時(shí)還通過(guò)納入用戶信號(hào) —— 比如對(duì) ChatGPT 回復(fù)的點(diǎn)贊 / 點(diǎn)踩反饋 —— 來(lái)訓(xùn)練我們的模型如何應(yīng)用這些原則。
然而,在這次更新中,我們過(guò)于關(guān)注短期反饋,沒(méi)有充分考慮到用戶與 ChatGPT 的互動(dòng)應(yīng)該隨著時(shí)間而演變。結(jié)果,GPT-4o 傾向于給出過(guò)于肯定、但不真誠(chéng)的回復(fù)。
這并不是對(duì)所發(fā)生事情最直接的解釋,但 OpenAI 的四點(diǎn)行動(dòng)計(jì)劃讓情況更加明晰:
完善核心訓(xùn)練技術(shù)和系統(tǒng)提示,明確引導(dǎo)模型避免諂媚行為。
建立更多的保障措施,以提高誠(chéng)實(shí)性和透明度 —— 這是我們《模型規(guī)格》中的原則。
拓展更多用戶在部署前進(jìn)行測(cè)試并給出直接反饋的途徑。
繼續(xù)擴(kuò)展我們的評(píng)估,以《模型規(guī)格》和我們正在進(jìn)行的研究為基礎(chǔ),幫助發(fā)現(xiàn)除諂媚之外的其他問(wèn)題。
換句話說(shuō),OpenAI 想要為 ChatGPT 塑造一個(gè)更友好、更具支持性的個(gè)性。其最新發(fā)布的更新確實(shí)符合這一描述,但有點(diǎn)過(guò)界了。事實(shí)證明,讓聊天機(jī)器人更加個(gè)性化所需的工作量比預(yù)期的要多。
OpenAI 表示,未來(lái)它希望提供默認(rèn)的個(gè)性選項(xiàng),同時(shí)也能根據(jù)用戶的直接反饋來(lái)塑造個(gè)性。
(舉報(bào))