**劃重點(diǎn):**
- ?? OpenAI啟動(dòng)Data Partnerships計(jì)劃,與第三方機(jī)構(gòu)合作,創(chuàng)建用于AI模型訓(xùn)練的公共和私有數(shù)據(jù)集。
- ?? OpenAI尋求多領(lǐng)域、多語言、多格式的數(shù)據(jù),以提高AI模型的廣泛理解。
- ?? 盡管有商業(yè)動(dòng)機(jī),OpenAI的Data Partnerships計(jì)劃也引發(fā)了關(guān)于數(shù)據(jù)擁有者權(quán)益和透明度的討論。
站長之家(ChinaZ.com) 11月10日 消息:OpenAI最近宣布了Data Partnerships計(jì)劃,旨在與第三方機(jī)構(gòu)合作,創(chuàng)建用于AI模型訓(xùn)練的公共和私有數(shù)據(jù)集。這一舉措旨在解決現(xiàn)有AI模型訓(xùn)練數(shù)據(jù)集中存在的問題,其中包含有毒語言和偏見。
OpenAI的目標(biāo)是培養(yǎng)更安全、更有益于全人類的AI。為了實(shí)現(xiàn)這一目標(biāo),他們計(jì)劃采集“大規(guī)?!睌?shù)據(jù)集,以反映人類社會(huì),尤其是那些目前在網(wǎng)上難以獲得的數(shù)據(jù)。這些數(shù)據(jù)將涵蓋各種形式,包括圖像、音頻和視頻,但重點(diǎn)是尋找能夠表達(dá)人類意圖的數(shù)據(jù),例如長篇寫作或?qū)υ?,跨越不同語言、主題和格式。
OpenAI還承諾將與合作機(jī)構(gòu)合作,必要時(shí)使用光學(xué)字符識(shí)別和自動(dòng)語音識(shí)別工具將培訓(xùn)數(shù)據(jù)數(shù)字化,并在必要時(shí)刪除敏感或個(gè)人信息。初期,他們計(jì)劃創(chuàng)建兩種類型的數(shù)據(jù)集:一個(gè)是公開的數(shù)據(jù)集,任何人都可以用于AI模型訓(xùn)練,另一個(gè)是用于訓(xùn)練專有AI模型的私有數(shù)據(jù)集,供希望保護(hù)數(shù)據(jù)隱私的機(jī)構(gòu)使用。
盡管OpenAI提出了宏偉的目標(biāo),但也有人對其商業(yè)動(dòng)機(jī)提出質(zhì)疑。一些人認(rèn)為,OpenAI的舉措旨在改善其模型的性能,但可能會(huì)損害其他機(jī)構(gòu)的利益,并未對數(shù)據(jù)擁有者作出合理的賠償。這引發(fā)了關(guān)于透明度和數(shù)據(jù)使用權(quán)益的討論。
OpenAI的Data Partnerships計(jì)劃旨在推動(dòng)AI模型的發(fā)展,但其實(shí)施和影響還有待觀察。在克服數(shù)據(jù)集偏見等挑戰(zhàn)方面,OpenAI是否能做得更好,仍有待驗(yàn)證。
(舉報(bào))