123,123,123

隨著AI技術(shù)與產(chǎn)業(yè)加速迭代，異構(gòu)加速設(shè)備與大模型層出不窮，為企業(yè)智能化轉(zhuǎn)型注入動能的同時，也給AI基礎(chǔ)設(shè)施帶來兩大核心挑戰(zhàn)：

* 算力適配滯后：全球產(chǎn)業(yè)鏈重構(gòu)背景下，GPU廠商、架構(gòu)、型號持續(xù)迭代，數(shù)據(jù)中心多元異構(gòu)成為常態(tài)，AI基礎(chǔ)設(shè)施難以快速跟進(jìn)最新算力迭代，適配周期長；

* 生態(tài)兼容不足：新型GPU上市后，芯片廠商會定制適配推理引擎以支持主流大模型快速部署，而傳統(tǒng)AI基礎(chǔ)設(shè)施難以同步匹配最新生態(tài)，導(dǎo)致算力無法快速轉(zhuǎn)化為生產(chǎn)力。

針對上述問題，浪潮云海InCloud AIOS秉承“分層解耦、開放兼容”核心理念，創(chuàng)新推出異構(gòu)加速設(shè)備動態(tài)擴展方法，設(shè)計了面向異構(gòu)算力的推理引擎快速適配框架，實現(xiàn)新架構(gòu)、新型號加速設(shè)備的小時級兼容，通過智能調(diào)度讓已兼容模型高效運行，打通從算力到智能生產(chǎn)力的“最后一公里”，成為AI時代企業(yè)異構(gòu)算力管理的最佳伙伴。

異構(gòu)加速設(shè)備動態(tài)擴展：小時級兼容新算力，打破異構(gòu)壁壘

浪潮云海InCloud AIOS基于device-plugin機制構(gòu)建異構(gòu)設(shè)備擴展框架，向下適配各廠商設(shè)備管理模塊，向上銜接產(chǎn)品GPU管理功能。

深度遵循PCI設(shè)備規(guī)范，在宿主機內(nèi)核態(tài)與用戶態(tài)協(xié)同層面構(gòu)建精細(xì)化設(shè)備探測引擎：通過通用唯一PCI設(shè)備標(biāo)識符（Device ID/Vendor ID）實現(xiàn)跨廠商GPU的自動化發(fā)現(xiàn)與精準(zhǔn)識別，解決傳統(tǒng)方案中識別效率低、識別不準(zhǔn)確的問題；以設(shè)備號為索引主鍵，關(guān)聯(lián)提取GPU 的硬件拓?fù)?、算力?guī)格、顯存容量與帶寬、虛擬化能力等通用屬性，將其抽象為標(biāo)準(zhǔn)化的節(jié)點標(biāo)簽（Node Label）并上報至Kubernetes控制平面，為算力資源調(diào)度提供依據(jù)。

針對多廠商GPU數(shù)據(jù)格式異構(gòu)、能力描述碎片化的問題，首創(chuàng)面向AI負(fù)載的GPU統(tǒng)一能力模型，通過抽象層設(shè)計，將不同生態(tài)的GPU異構(gòu)數(shù)據(jù)（如算力單元、顯存帶寬、指令集支持）與差異化能力映射為標(biāo)準(zhǔn)化數(shù)據(jù)結(jié)構(gòu)，基于該模型實現(xiàn)“統(tǒng)一節(jié)點能力畫像”的精細(xì)化資源表征。

在產(chǎn)品界面依托統(tǒng)一能力模型，實現(xiàn)GPU資源的全景統(tǒng)計、可視化呈現(xiàn)與智能化調(diào)度，打破傳統(tǒng)方案的割裂管理模式，大幅縮短異構(gòu)GPU兼容性適配周期，解決統(tǒng)一管理難題。

異構(gòu)加速設(shè)備動態(tài)擴展方法

推理引擎快速適配框架：快速適配生態(tài)，高效部署模型

不同類型模型（文本生成、多模態(tài)、嵌入式等）對推理引擎需求各異，且GPU與推理引擎版本強依賴，給模型部署帶來挑戰(zhàn)。浪潮云海InCloud AIOS以K8s為底座，設(shè)計推理引擎快速適配框架，實現(xiàn)異構(gòu)GPU與推理引擎的高效兼容。

構(gòu)建統(tǒng)一的“模型-GPU-推理引擎”映射模型，通過配置化操作完成不同類型模型在異構(gòu) GPU 上的推理引擎版本匹配，為模型加載決策提供清晰依據(jù)。

在K8s層面統(tǒng)一封裝工作負(fù)載接口，自研模型加載調(diào)度器作為推理引擎啟動的統(tǒng)一入口，提供模型文件分發(fā)狀態(tài)判斷、環(huán)境變量讀取、啟動參數(shù)配置、本地軟鏈接創(chuàng)建等功能，徹底屏蔽各類推理引擎的參數(shù)差異，降低使用門檻。

復(fù)用已有的GPU快速適配能力，擴展K8s調(diào)度框架，根據(jù)GPU型號將推理引擎調(diào)度到最佳的主機上加載模型，通過svc方式使用OpenAI格式接口對外提供推理服務(wù)。

推理引擎快速適配框架

零代碼改動，一小時完成千億模型適配

通過兩大核心技術(shù)創(chuàng)新，浪潮云海InCloud AIOS已實現(xiàn)多廠商、多架構(gòu)GPU型號適配，支持自研及vLLM、SGLang等面向不同GPU的推理引擎版本，充分驗證了“一云多算”的實戰(zhàn)能力。

在某政府行業(yè)客戶現(xiàn)場，浪潮云海 AIOS 在零代碼改動的前提下，僅用一小時就完成某架構(gòu)最新型號 GPU 的兼容與推理引擎適配，以分布式方式成功運行DeepSeek最新發(fā)布的千億參數(shù)模型，提供穩(wěn)定可靠的模型服務(wù)，獲得客戶高度認(rèn)可。

客戶現(xiàn)場新適配的GPU與產(chǎn)品能力無縫銜接

開放兼容，讓 AI 算力游刃有余

AI正從工具加速進(jìn)化為“數(shù)字勞動力”，異構(gòu)算力的高效管理成為企業(yè)智能化轉(zhuǎn)型的關(guān)鍵。浪潮云海InCloud AIOS通過“異構(gòu)加速設(shè)備動態(tài)擴展+推理引擎快速適配”的雙重創(chuàng)新，打破了算力與生態(tài)的兼容壁壘，實現(xiàn)新算力小時級接入、模型高效部署，讓企業(yè)無需為異構(gòu)兼容發(fā)愁，專注于AI應(yīng)用創(chuàng)新。

未來，浪潮云海InCloud AIOS將持續(xù)聚焦推理性能優(yōu)化與算力資源使用率提升，不斷深化軟硬協(xié)同能力，為行業(yè)客戶提供高效穩(wěn)定的AI基礎(chǔ)設(shè)施，助力企業(yè)在異構(gòu)算力時代從容駕馭AI浪潮，實現(xiàn)智能化轉(zhuǎn)型游刃有余。

申請創(chuàng)業(yè)報道，分享創(chuàng)業(yè)好點子。點擊此處，共同探討創(chuàng)業(yè)新機遇！

相關(guān)文章

AI游刃有余告別模型選型迷茫！浪潮云海InCloud AIOS科學(xué)評估體系，讓決策心中有數(shù)

當(dāng)前AI領(lǐng)域大模型技術(shù)飛速迭代，全球已發(fā)布數(shù)千個大模型，其中我國大模型數(shù)量突破1500個；與此同時，AI算力芯片、服務(wù)器型號也層出不窮、快速迭代?！昂Ａ磕Ｐ?多樣硬件”的雙重疊加，讓企業(yè)陷入選型困境：該選哪款模型適配業(yè)務(wù)？配置何種硬件才夠用？選型是否匹配實際需求？試錯成本高、匹配度難把控，成為企業(yè)落

標(biāo)簽：

浪潮云海
AI 游刃有余 | 浪潮云海InCloud AIOS：告別“找錯書”與“看不全頁”，RAG檢索不跑偏

在AI深度落地的當(dāng)下，構(gòu)建高效精準(zhǔn)的智能問答系統(tǒng)，已成為企業(yè)提升客戶體驗、優(yōu)化內(nèi)部效率的關(guān)鍵。但基于大語言模型的RAG（檢索增強生成）系統(tǒng)落地時，兩大核心痛點常讓企業(yè)陷入困境：*一是知識庫按產(chǎn)品型號、版本分區(qū)管理，語義高度相似導(dǎo)致系統(tǒng)“找錯書”，比如詢問A型號故障卻返回B型號方案；*二是文檔切分粒度

標(biāo)簽：

浪潮云海
AI游刃有余 | 告別運維焦慮，浪潮云海OS解鎖智能運維快車道

近來，企業(yè)云平臺納管的資源規(guī)模持續(xù)激增，架構(gòu)復(fù)雜度呈指數(shù)級上升，傳統(tǒng)運維模式早已不堪重負(fù)，各類運維焦慮層出不窮：*資源檢索大海撈針：查找資源，需在十幾個菜單間反復(fù)跳轉(zhuǎn)；*數(shù)據(jù)報表僵化受限：只能按預(yù)設(shè)條件檢索和固定表頭展示；*日常巡檢低效易錯：面對大量非健康指標(biāo)，只能依靠人工關(guān)聯(lián)分析。面對傳統(tǒng)交互模式

標(biāo)簽：

浪潮云海

當(dāng)前位置：首頁 > 科技 > IT業(yè)界 > 正文

AI游刃有余 | 浪潮云海InCloud AIOS：異構(gòu)算力“小時級”適配打通智能生產(chǎn)力最后一公里

相關(guān)文章

AI游刃有余告別模型選型迷茫！浪潮云海InCloud AIOS科學(xué)評估體系，讓決策心中有數(shù)

AI 游刃有余 | 浪潮云海InCloud AIOS：告別“找錯書”與“看不全頁”，RAG檢索不跑偏

AI游刃有余 | 告別運維焦慮，浪潮云海OS解鎖智能運維快車道

熱門排行

信息推薦

編輯推薦

阿里一元店是新解“囊”雜貨鋪？

億企聯(lián)解答互聯(lián)網(wǎng)廣告的存在意義何在？

熱門標(biāo)簽

當(dāng)前位置：首頁 > 科技 > IT業(yè)界 > 正文

AI游刃有余 | 浪潮云海InCloud AIOS：異構(gòu)算力“小時級”適配 打通智能生產(chǎn)力最后一公里

相關(guān)文章

AI游刃有余 告別模型選型迷茫！浪潮云海InCloud AIOS科學(xué)評估體系，讓決策心中有數(shù)

AI 游刃有余 | 浪潮云海InCloud AIOS：告別“找錯書”與“看不全頁”，RAG檢索不跑偏

AI游刃有余 | 告別運維焦慮，浪潮云海OS解鎖智能運維快車道

熱門排行

信息推薦

編輯推薦

阿里一元店是新解“囊”雜貨鋪？

億企聯(lián)解答互聯(lián)網(wǎng)廣告的存在意義何在？

熱門標(biāo)簽

AI游刃有余 | 浪潮云海InCloud AIOS：異構(gòu)算力“小時級”適配打通智能生產(chǎn)力最后一公里

AI游刃有余告別模型選型迷茫！浪潮云海InCloud AIOS科學(xué)評估體系，讓決策心中有數(shù)

AI 游刃有余 | 浪潮云海InCloud AIOS：告別“找錯書”與“看不全頁”，RAG檢索不跑偏

AI游刃有余 | 告別運維焦慮，浪潮云海OS解鎖智能運維快車道

億企聯(lián)解答互聯(lián)網(wǎng)廣告的存在意義何在？