无码在线播放二区|久久亚洲精品国产精品|无码视频在线观看一区二区|在线观看国产日韩亚洲中

  • <menu id="yw4o4"></menu>
  • 
    <menu id="yw4o4"><em id="yw4o4"></em></menu>
  • 首頁 > 傳媒 > 關鍵詞  > 生成式AI最新資訊  > 正文

    戴爾Precision工作站:助力客戶更有效地使用GenAI大語言模型

    2024-04-02 15:41 · 稿源: 站長之家用戶

    本實用指南將幫助用戶了解,如何配置個人電腦才能更有效地使用生成式AI大語言模型

    生成式人工智能(GenAI)徹底改變了計算世界,戴爾科技的用戶都開始考慮借助大語言模型(LLM)去開發(fā)能夠提升其公司生產(chǎn)力、效率和創(chuàng)新力的新功能。戴爾科技擁有全球最豐富的AI基礎設施產(chǎn)品組合,從云到客戶端設備一應俱全[1],因此能夠為用戶提供滿足其一切AI需求的端到端AI解決方案和服務。戴爾科技還提供專為助力AI工作負載而設計的硬件解決方案,包括工作站、高性能計算服務器、數(shù)據(jù)存儲、云原生軟件定義基礎設施、網(wǎng)絡交換機、數(shù)據(jù)保護、HCI和各種服務。但用戶所面臨的比較大問題之一是:如何確定一臺PC能夠與特定的LLM有效配合。戴爾科技將嘗試解答這個問題。

    首先應該掌握一些關于如何幫助PC處理LLM的基礎知識。雖然AI例程可以在CPU或被稱為NPU的新型專用AI回路中進行處理,但目前的主流仍然是在PC中使用NVIDIA RTX GPU進行AI處理,該GPU帶有被稱為“張量核心”(Tensor Core)的專用回路。RTX張量核心專門用于實現(xiàn)混合精度數(shù)學計算,而這是AI處理的核心。但進行數(shù)學運算只是需要考慮的因素之一,鑒于LLM潛在的內(nèi)存占用量,還需要額外考慮可用的內(nèi)存空間。要在GPU中較大程度地發(fā)揮AI性能,就必須將LLM處理加入到GPU VRAM。NVIDIA的GPU產(chǎn)品線在各種移動和固定工作站產(chǎn)品中都可以擴展,用戶可以通過所提供的張量核心數(shù)量和GPU VRAM選項來輕松調(diào)整系統(tǒng)規(guī)模。請注意,某些固定工作站可以搭載多顆GPU來進一步擴大容量。

    市場上出現(xiàn)的LLM數(shù)量和種類越來越多,但在確定硬件需求時,最需要考慮的因素之一是所選LLM的參數(shù)規(guī)模。以Meta AI的Llama-2LLM為例,該模型有70億、130億和700億這三種不同的參數(shù)規(guī)模。一般來說,參數(shù)規(guī)模越大,LLM的準確性就越高,在一般知識應用中的適用性也就越強。

    無論用戶的目標是將基礎模型原封不動地用于推理,還是根據(jù)具體的用例和數(shù)據(jù)進行調(diào)整,他們都需要了解LLM對機器的要求以及如何較好地管理模型。如果能夠利用用戶專有的數(shù)據(jù)開發(fā)和訓練出針對特定用例的模型,那么用戶的AI項目就能為其帶來比較大的創(chuàng)新和回報。在使用LLM開發(fā)新功能和應用時,參數(shù)規(guī)模比較大的模型可能會對機器性能提出很高的要求,因此數(shù)據(jù)科學家們開發(fā)出了一些辦法來幫助降低處理開銷和管理LLM輸出準確性。

    量化就是其中的一種辦法。該技術通過修改LLM內(nèi)部參數(shù)(即權重)的數(shù)學精度來縮小LLM的規(guī)模。降低位精度會對LLM產(chǎn)生兩方面的影響: 一是減少處理所占用的空間和對內(nèi)存的需求, 二是影響LLM的輸出準確性。量化可以看作是JPEG圖像壓縮,雖然壓縮得越多,創(chuàng)建出的圖像效率就越高,但在某些用例中可能會使圖像變得模糊不清。

    在實際應用中,如果用戶想要運行量化為4位精度的Llama-2模型,可以考慮戴爾Precision3000和5000系列的多款移動工作站。

    戴爾科技全新的3000和5000系列移動工作站集成了CPU,NPU,GPU多處理器組合,能夠優(yōu)化100多款應用中的AI性能,使其運行更快、能效更高。例如,它們可支持全新的協(xié)作體驗,如AI驅(qū)動的視頻會議,提供背景模糊、面部取景和視線糾正等功能。NPU能有效地卸載CPU或GPU上的任務,使功耗降低高達40% 。這意味著電池續(xù)航時間更長,用戶無需頻繁充電即可持續(xù)工作。此外,新款CPU還配備了速度更快的集成顯卡,為更多媒體密集型AI工作負載提供卓越性能。CPU、NPU和GPU協(xié)同工作,共同打造靈活、高性能且節(jié)能的AI引擎,為用戶帶來較好體驗。

    此外,全新戴爾Precision3490和3590移動工作站比較高可搭載NVIDIA RTX500Ada圖形處理器,提升專業(yè)用戶的工作效率。Precision3591則專注于設計與創(chuàng)作領域,輕松應對入門級2D和3D CAD應用。而Precision5000系列移動工作站將創(chuàng)意應用的性能提升到了新的高度,Precision5690憑借其小巧的16英寸機身,為用戶帶來出色的創(chuàng)意應用體驗。它具備廣闊的視野、出色的便攜性和強大的應用性能,比較高可配備NVIDIA RTX5000圖形處理器。同時,機身小巧但強大功能的Precision5490作為一款14英寸超便攜設備,在性能和體驗方面也毫不遜色。

    在更高精度(BF16)運行會增加對內(nèi)存的需求,但戴爾科技的解決方案可以在任何精度上滿足任何規(guī)模的LLM需求。戴爾Precision7960塔式工作站可支持多達四個NVIDIA 高性能GPU,其AI處理能力比上代產(chǎn)品高出80% 且每個GPU的VRAM高達48GB,而VRAM是處理GenAI大語言模型最關鍵的配置之一。

    那么如何解決輸出準確性所受到的影響?另一種被稱為微調(diào)的技術可以通過在特定數(shù)據(jù)上重新訓練LLM的參數(shù)子集來提高準確性,進而提高特定用例中的輸出準確性。微調(diào)會調(diào)整某些已訓練參數(shù)的權重,能夠加快訓練過程并提高輸出準確性。通過將微調(diào)與量化相結(jié)合,就可以產(chǎn)生針對特定應用的小語言模型,這些模型非常適合部署到對AI處理能力要求較低的各種設備上。同樣,如果開發(fā)人員想要對LLM進行微調(diào),也可以放心地將Precision工作站作為構(gòu)建GenAI解決方案過程中的沙盒。

    在使用LLM時這些不同技術不會相互排斥。把它們結(jié)合在一起使用往往會帶來更高的運行效率和準確性。

    總之,LLM的規(guī)模以及哪些技術能夠為有效使用LLM所需的計算系統(tǒng)配置提供理想?yún)⒖级际顷P鍵的決定因素。戴爾科技堅信無論用戶在其AI旅程中想要朝哪個方向發(fā)展,戴爾科技的臺式機、數(shù)據(jù)中心等解決方案都將為其提供助力。

    戴爾科技集團

    戴爾科技集團致力于幫助企業(yè)和個人構(gòu)建數(shù)字化未來,改進他們的工作、生活和娛樂方式,為客戶提供面向數(shù)據(jù)時代全面和創(chuàng)新的產(chǎn)品、技術、解決方案及服務組合。

    [1] ?基于戴爾科技集團的內(nèi)部分析,2023年8月。

    推廣

    特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))均為站長傳媒平臺用戶上傳并發(fā)布,本平臺僅提供信息存儲服務,對本頁面內(nèi)容所引致的錯誤、不確或遺漏,概不負任何法律責任,相關信息僅供參考。站長之家將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。任何單位或個人認為本頁面內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,可及時向站長之家提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明(點擊查看反饋聯(lián)系地址)。本網(wǎng)站在收到上述法律文件后,將會依法依規(guī)核實信息,溝通刪除相關內(nèi)容或斷開相關鏈接。

    • 相關推薦
    • 時空壺接入大語言模型,跨語言溝通已成翻譯的藝術

      在當今全球化浪潮中,跨語言溝通的需求如潮水般洶涌。從商務領域的跨國談判,到文化交流中的思想碰撞,高效、精準的語言翻譯成為關鍵橋梁。隨著技術的不斷發(fā)展與迭代,時空壺有望持續(xù)引領行業(yè)變革,推動全球交流合作邁向新的高度,真正實現(xiàn)跨越語言障礙,讓世界溝通無阻。

    • Neousys宸曜科技亮相2025 Vision China(上海)

      2025年3月26日-28日,由機器視覺產(chǎn)業(yè)聯(lián)盟主辦、慕尼黑展覽有限公司承辦的2025上海機器視覺展暨機器視覺技術及工業(yè)應用研討會VisionChinaShanghai在上海新國際博覽中心順利舉辦并圓滿落幕。

    • 剛剛,OpenAI開源PaperBench,重塑頂級AI Agent評測

      今天凌晨1點,OpenAI開源了一個全新的AIAgent評測基準——PaperBench。這個基準主要考核智能體的搜索、整合、執(zhí)行等能力,需要對2024年國際機器學習大會上頂尖論文的復現(xiàn),包括對論文內(nèi)容的理解、代碼編寫以及實驗執(zhí)行等方面的能力。目前智能體的能力還無法超越人類。

    • 剛剛,OpenAI開源BrowseComp,重塑Agent瀏覽器評測

      今天凌晨2點,OpenAI開源了專門用于智能體瀏覽器功能的測試基準——BrowseComp。這個測試基準非常有難度,連OpenAI自己的GPT-4o、GPT-4.5準確率只有0.6%和0.9%幾乎為0,即便使用帶瀏覽器功能的GPT-4o也只有1.9%。通過使用更多的計算資源,模型可以嘗試更多的搜索路徑,從提高找到正確答案的概率。

    • 對標OpenAI,谷歌開源Agent SDK,支持MCP、A2A、5000星

      谷歌在GoogleCloudNext25大會上,開源了首個Agent開發(fā)套件—ADK。這也是OpenAI之后第二家大廠發(fā)布的標準化智能體SDK。谷歌剛開源ADK幾天在Github已經(jīng)超過5000顆星,非常受開發(fā)者的歡迎。

    • 「扣子空間」內(nèi)測上線,和 Agent 一起開始你的工作

      “摘星空間”平臺正式推出,集生產(chǎn)、專業(yè)領域支持及雙模系統(tǒng)協(xié)作能力,通過多類型AI智能體實現(xiàn)高效辦公,具備生產(chǎn)提升、專家深度支持、雙模協(xié)同等四大核心功能,未來將持續(xù)擴展Agent能力邊界。

    • 剛剛,OpenAI發(fā)布GPT-image-1模型,更強吉卜力版本來啦

      OpenAI發(fā)布全新圖像生成模型GPT-image-1,通過API向全球開發(fā)者開放。該模型支持精細控制圖像敏感度、生成效率、背景、輸出格式等參數(shù),并集成吉卜力模式。Adobe、Figma等企業(yè)已將其應用于產(chǎn)品中。API支持批量生成、蒙版編輯、透明度調(diào)整等高級功能,圖像生成成本從0.02-0.19美元/張不等。CEO Sam Altman表示該模型與ChatGPT版本差異顯著,開發(fā)者可通過API實現(xiàn)更多創(chuàng)意場景。新模型在?

    • MCP協(xié)議和Function Calling 、 AI Agents的區(qū)別是什么?MCP優(yōu)勢有哪些

      MCP、FunctionCalling和AIAgents是三種重要的技術手段,它們在實現(xiàn)AI模型與外部系統(tǒng)交互方面各有特點。本文將詳細對比這三種技術,并深入探討MCP的多項顯著優(yōu)勢。隨著MCP技術的不斷發(fā)展,我們有理由相信,它將在未來的AI領域發(fā)揮越來越重要的作用。

    • 國產(chǎn)六大推理模型激戰(zhàn)OpenAI?

      2025年春節(jié)前夕,DeepSeek-R1模型發(fā)布,標志著中國AI進入推理模型新時代。文章梳理了國產(chǎn)大模型發(fā)展歷程:從2022年ChatGPT引發(fā)國內(nèi)追趕OpenAI熱潮,到2023年"百模大戰(zhàn)",再到2024年"AI六小虎"格局形成。重點分析了六大國產(chǎn)推理模型(DeepSeek、百度、阿里、科大訊飛、字節(jié)、騰訊)的技術特點與市場表現(xiàn),指出國產(chǎn)模型在性能上已接近GPT-4水平。特別強調(diào)科大訊飛星火X1憑借全國產(chǎn)化技術路線獲得政企青睞,以及DeepSeek-R1以560萬美元超低成本實現(xiàn)高性能的突破。文章還探討了英偉達芯片斷供危機下,國產(chǎn)全棧技術路徑的重要性,認為自主可控將成為對抗國際不確定性的關鍵。最后指出,隨著推理模型成為競爭焦點,國產(chǎn)大模型正從技術追隨轉(zhuǎn)向自主創(chuàng)新階段。

    • 智啟新程,“視”界無疆——VisionChina2025(上海)機器視覺展完美收官

      來自13個國家和地區(qū)的近300家展商以及72,417名觀眾齊聚一堂熱門詞:AI視覺賦能產(chǎn)業(yè)升級2025年3月26-28日,為期三天的中國機器視覺展暨機器視覺技術及工業(yè)應用研討會【VisionChina2025】,在上海新國際博覽中心圓滿閉幕。這場由機器視覺產(chǎn)業(yè)聯(lián)盟精心策劃,慕尼黑展覽有限公司傾力承辦的盛會,匯聚了全球機器視覺領域的優(yōu)質(zhì)企業(yè)和專業(yè)人士,共同探討了機器視覺技術的嶄新邊界及其在工業(yè)應用中的廣闊前景。讓我們共同期待下一場智造盛宴,繼續(xù)書寫機器視覺賦能千行百業(yè)的嶄新篇章!