无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 業(yè)界 > 關(guān)鍵詞  > AI訓(xùn)練數(shù)據(jù)集最新資訊  > 正文

    OpenAI與第三方機(jī)構(gòu)合作,構(gòu)建新的AI訓(xùn)練數(shù)據(jù)集

    2023-11-10 11:22 · 稿源:站長之家

    **劃重點(diǎn):**

    - ?? OpenAI啟動(dòng)Data Partnerships計(jì)劃,與第三方機(jī)構(gòu)合作,創(chuàng)建用于AI模型訓(xùn)練的公共和私有數(shù)據(jù)集。

    - ?? OpenAI尋求多領(lǐng)域、多語言、多格式的數(shù)據(jù),以提高AI模型的廣泛理解。

    - ?? 盡管有商業(yè)動(dòng)機(jī),OpenAI的Data Partnerships計(jì)劃也引發(fā)了關(guān)于數(shù)據(jù)擁有者權(quán)益和透明度的討論。

    站長之家(ChinaZ.com) 11月10日 消息:OpenAI最近宣布了Data Partnerships計(jì)劃,旨在與第三方機(jī)構(gòu)合作,創(chuàng)建用于AI模型訓(xùn)練的公共和私有數(shù)據(jù)集。這一舉措旨在解決現(xiàn)有AI模型訓(xùn)練數(shù)據(jù)集中存在的問題,其中包含有毒語言和偏見。

    OpenAI的目標(biāo)是培養(yǎng)更安全、更有益于全人類的AI。為了實(shí)現(xiàn)這一目標(biāo),他們計(jì)劃采集“大規(guī)?!睌?shù)據(jù)集,以反映人類社會(huì),尤其是那些目前在網(wǎng)上難以獲得的數(shù)據(jù)。這些數(shù)據(jù)將涵蓋各種形式,包括圖像、音頻和視頻,但重點(diǎn)是尋找能夠表達(dá)人類意圖的數(shù)據(jù),例如長篇寫作或?qū)υ?,跨越不同語言、主題和格式。

    OpenAI ChatGPT,人工智能,AI

    OpenAI還承諾將與合作機(jī)構(gòu)合作,必要時(shí)使用光學(xué)字符識(shí)別和自動(dòng)語音識(shí)別工具將培訓(xùn)數(shù)據(jù)數(shù)字化,并在必要時(shí)刪除敏感或個(gè)人信息。初期,他們計(jì)劃創(chuàng)建兩種類型的數(shù)據(jù)集:一個(gè)是公開的數(shù)據(jù)集,任何人都可以用于AI模型訓(xùn)練,另一個(gè)是用于訓(xùn)練專有AI模型的私有數(shù)據(jù)集,供希望保護(hù)數(shù)據(jù)隱私的機(jī)構(gòu)使用。

    盡管OpenAI提出了宏偉的目標(biāo),但也有人對其商業(yè)動(dòng)機(jī)提出質(zhì)疑。一些人認(rèn)為,OpenAI的舉措旨在改善其模型的性能,但可能會(huì)損害其他機(jī)構(gòu)的利益,并未對數(shù)據(jù)擁有者作出合理的賠償。這引發(fā)了關(guān)于透明度和數(shù)據(jù)使用權(quán)益的討論。

    OpenAI的Data Partnerships計(jì)劃旨在推動(dòng)AI模型的發(fā)展,但其實(shí)施和影響還有待觀察。在克服數(shù)據(jù)集偏見等挑戰(zhàn)方面,OpenAI是否能做得更好,仍有待驗(yàn)證。

    舉報(bào)

    • 相關(guān)推薦
    • 媲美OpenAI-o3,剛剛開源模型DeepCoder,訓(xùn)練方法、數(shù)據(jù)集大公開

      今天凌晨4點(diǎn),著名大模型訓(xùn)練平臺(tái)TogetherAI和智能體平臺(tái)Agentica,聯(lián)合開源了新模型DeepCoder-14B-Preview。該模型只有140億參數(shù),但在知名代碼測試平臺(tái)LiveCodeBench的測試分為60.6%,高于OpenAI的o1模型,略低于o3-mini。TogetherAI剛獲得3.05億美元的B輪融資,其估值也從去年的12.5億美元翻倍至33億美元。

    • 兩大CEO多項(xiàng)分歧曝光,OpenAI與微軟的“最佳合作”要破裂?

      OpenAI與微軟的"科技界最佳合作關(guān)系"出現(xiàn)裂痕。微軟6年來投資數(shù)十億美元推動(dòng)OpenAI發(fā)展,助其ChatGPT用戶突破5億;同時(shí)OpenAI為微軟提供尖端AI工具,使其股價(jià)翻倍。但雙方在算力供給、模型使用權(quán)和AGI研發(fā)進(jìn)度上分歧加劇。微軟秘密啟動(dòng)自研AI項(xiàng)目,挖角OpenAI對手蘇萊曼,耗資6.5億美元組建團(tuán)隊(duì)。OpenAI則可能觸發(fā)合同條款限制微軟接觸其最新技術(shù)。若OpenAI年底前未能完成?

    • 微信警告不要使用第三方工具管理聊天記錄 有大風(fēng)險(xiǎn)

      快科技5月1日消息,微信安全中心發(fā)布針對違規(guī)獲取及利用微信終端用戶數(shù)據(jù)行為的打擊公告”。近期,微信發(fā)現(xiàn)有部分第三方工具以AI管理用戶微信聊天記錄”等名義,繞過微信安全技術(shù)措施,違法違規(guī)獲取或利用微信終端用戶數(shù)據(jù)。為保護(hù)用戶的合法權(quán)益,微信將依據(jù)國家相關(guān)法律法規(guī)及平臺(tái)規(guī)則對相關(guān)行為進(jìn)行打擊?!段⑿艂€(gè)人賬號(hào)使用規(guī)范》規(guī)定,用戶在使用微信軟件的過程中不得實(shí)施影響用戶體驗(yàn)、侵犯騰訊知識(shí)產(chǎn)權(quán)、危及平臺(tái)安全、損害他人權(quán)益等行為。微信安全中心提醒廣大用戶,使用第三方工具管理微信聊天記錄,可能帶來如下風(fēng)險(xiǎn):1、未經(jīng)?

    • 隱私沙盒成棄兒:谷歌放棄Chrome淘汰第三方Cookie計(jì)劃!

      快科技4月23日消息,谷歌隱私沙盒副總裁安東尼查韋斯(Anthony Chavez)表示,公司決定維持目前在Chrome中為用戶提供第三方Cookie選擇的現(xiàn)有方式”。谷歌的隱私沙盒項(xiàng)目自2019年提出以來,一直備受爭議,該項(xiàng)目旨在淘汰第三方Cookie,通過分組興趣偏好繼續(xù)向廣告網(wǎng)絡(luò)提供數(shù)據(jù),以在減少用戶隱私泄露的同時(shí),讓廣告網(wǎng)絡(luò)能夠繼續(xù)推送定向廣告。不過這一計(jì)劃遭到了廣告商和隱私倡導(dǎo)者的雙重批評,廣告商擔(dān)心該計(jì)劃會(huì)影響其廣告投放效果,而隱私倡導(dǎo)者則認(rèn)為谷歌的替代方案仍然存在隱私風(fēng)險(xiǎn)。2024年4月,谷歌宣布推遲淘汰第三方Cookie的計(jì)劃,

    • 英偉達(dá)開源15T數(shù)據(jù)集:32萬個(gè)機(jī)器人訓(xùn)練軌跡

      全球AI領(lǐng)導(dǎo)者英偉達(dá)開源了,用于實(shí)體機(jī)器人和自動(dòng)化駕駛的超大訓(xùn)練數(shù)據(jù)合集——NVIDIAPhysicalAIDataset。這個(gè)數(shù)據(jù)集一共15T,涵蓋了超過320,000個(gè)機(jī)器人訓(xùn)練軌跡,以及多達(dá)1,000個(gè)通用場景描述包括一個(gè)SimReady集合。英偉達(dá)表示,未來將繼續(xù)擴(kuò)展PhysicalAIDataset,將其建設(shè)成世界最大、統(tǒng)一的開源數(shù)據(jù)集,可用于AI模型、醫(yī)療、自動(dòng)化駕駛等不同領(lǐng)域,加速AI、實(shí)體機(jī)器人的訓(xùn)練效?

    • “吉卜力風(fēng)格”熱潮下,超 7 億人的“臉”正被用于AI訓(xùn)練

      站長之家4月8日消息:隨著ChatGPT的圖像生成功能持續(xù)獲得爆發(fā)式人氣,人們開始擔(dān)心自己上傳的照片等數(shù)據(jù)會(huì)被OpenAI收集、并被用于AI學(xué)習(xí)。據(jù)韓國移動(dòng)數(shù)據(jù)平臺(tái)IGAWorks在8日發(fā)布的數(shù)據(jù)顯示,在吉卜力風(fēng)格圖片生成功能大行其道的一周時(shí)間里,ChatGPT在韓的每日活躍用戶數(shù)從125萬增長到了308萬,漲幅高達(dá)2.5倍。業(yè)內(nèi)律師表示,“從OpenAI的角度來看,完全可以借此積累各種年齡、種族、性別的臉部圖像數(shù)據(jù)”,他還補(bǔ)充道,“如果不想在因?yàn)楹猛嫔蟼髡掌?,泄露了個(gè)人信息的話,就應(yīng)該將其設(shè)置為不允許AI利用其個(gè)人隱私進(jìn)行訓(xùn)練學(xué)習(xí)”。

    • 大模型時(shí)代的燃料|標(biāo)貝科技推出大規(guī)模擬真多風(fēng)格語音合成數(shù)據(jù)集

      本文探討了人工智能語音交互領(lǐng)域的發(fā)展現(xiàn)狀與挑戰(zhàn)。文章指出,大模型技術(shù)驅(qū)動(dòng)下語音交互應(yīng)用場景持續(xù)拓展,但面臨數(shù)據(jù)質(zhì)量、隱私合規(guī)等挑戰(zhàn)。當(dāng)前語音大模型訓(xùn)練需要TB至PB級數(shù)據(jù),而傳統(tǒng)數(shù)據(jù)供給模式難以滿足需求。合成數(shù)據(jù)作為真實(shí)數(shù)據(jù)的重要補(bǔ)充,能通過參數(shù)化生成機(jī)制規(guī)避隱私風(fēng)險(xiǎn),突破傳統(tǒng)數(shù)據(jù)在多樣性和場景覆蓋上的局限性。國內(nèi)外科技企業(yè)已開始廣泛應(yīng)用合成數(shù)據(jù)訓(xùn)練AI模型,如Meta的LLaMA3和微軟的Phi-4模型。標(biāo)貝科技推出超大規(guī)模擬真多風(fēng)格語音合成數(shù)據(jù)集,包含上萬小時(shí)數(shù)據(jù),覆蓋中英混合場景,支持情感合成、風(fēng)格遷移等前沿任務(wù),為虛擬偶像、數(shù)字人等元宇宙場景提供實(shí)時(shí)語音生成方案。該數(shù)據(jù)集基于32kHz高保真采樣率技術(shù),在自然度、流暢度等方面達(dá)到行業(yè)領(lǐng)先水平。

    • Antropic加入“AI語音助手”賽道,能追上OpenAI、谷歌們嗎?

      隨著 AI 語音產(chǎn)品的出現(xiàn),人們對其模仿他人說話風(fēng)格的擔(dān)憂也在加劇……

    • OpenAI 要砸 30 億美金收購 AI 編碼工具 Windsurf

      若收購成功,OpenAI 將直接與在快速發(fā)展的 AI 編碼領(lǐng)域提供服務(wù)的 Anthropic、微軟旗下的 GitHub、Anyscale 等公司展開競爭……