11.11云上盛惠!海量產(chǎn)品 · 輕松上云!云服務器首年1.8折起,買1年送3個月!超值優(yōu)惠,性能穩(wěn)定,讓您的云端之旅更加暢享。快來騰訊云選購吧!
OpenAI最近宣布了DataPartnerships計劃,旨在與第三方機構(gòu)合作,創(chuàng)建用于AI模型訓練的公共和私有數(shù)據(jù)集。這一舉措旨在解決現(xiàn)有AI模型訓練數(shù)據(jù)集中存在的問題,其中包含有毒語言和偏見。在克服數(shù)據(jù)集偏見等挑戰(zhàn)方面,OpenAI是否能做得更好,仍有待驗證。
反盜版組織成功要求在線盜版書籍資源庫TheEye下線AI訓練數(shù)據(jù)集"Books3"的事件。"Books3"數(shù)據(jù)集是一個大規(guī)模的盜版書籍資源,包含了37GB的文本,用于訓練人工智能模型。Books1和Books2都占GPT-3訓練數(shù)據(jù)的近15%。