站長(zhǎng)之家(ChinaZ.com)12月13日 消息:近日,研究人員通過日本傳統(tǒng)喜劇游戲“大喜利”(Oogiri)對(duì)AI進(jìn)行了一項(xiàng)新的挑戰(zhàn),以培養(yǎng)AI成為吐槽高手。在這個(gè)游戲中,AI需要理解給定的圖文信息,并以幽默搞笑的方式做出回答。
Oogiri是一種需要參與者對(duì)給定的圖像或文本做出意想不到且幽默的回應(yīng)的創(chuàng)意游戲,包括圖像到文本(I2T)、文本到文本(T2T)和圖像&文本到文本(IT2T)的測(cè)試方式。
項(xiàng)目地址:https://github.com/sail-sg/CLoT
為了訓(xùn)練AI參與Oogiri游戲,研究人員構(gòu)建了一個(gè)多模態(tài)、多語言的Oogiri-GO數(shù)據(jù)集,其中包含超過130,000個(gè)樣本。通過特殊的訓(xùn)練方法,他們讓AI學(xué)會(huì)如何在游戲中給出創(chuàng)意和幽默的回答。
其中,CLoT首先將Oogiri-GO數(shù)據(jù)集轉(zhuǎn)化為L(zhǎng)oT導(dǎo)向的指令調(diào)整數(shù)據(jù),以訓(xùn)練預(yù)訓(xùn)練的LLM達(dá)到一定的LoT幽默生成和辨別能力。然后,CLoT設(shè)計(jì)了一個(gè)探索性自我完善過程,鼓勵(lì)LLM通過探索看似無關(guān)概念之間的平行關(guān)系來生成更多創(chuàng)造性的LoT數(shù)據(jù),并選擇高質(zhì)量數(shù)據(jù)進(jìn)行自我完善。
實(shí)驗(yàn)結(jié)果顯示,CLoT能夠顯著提高LLM(如Qwen和CogVLM)在多種Oogiri游戲類型中的表現(xiàn)。具體來說,CLoT幫助LLM生成了更好的幽默內(nèi)容,并在Oogiri游戲的多項(xiàng)選擇和排名問題中取得了更高的性能。
此外,CLoT還在其他任務(wù)中提高了創(chuàng)造性能力,顯示出其卓越的泛化能力,為AI的幽默表現(xiàn)和創(chuàng)意生成能力帶來了新的突破。
(舉報(bào))