當(dāng)前位置:首頁 >  科技 >  IT業(yè)界 >  正文

AI 游刃有余 | 浪潮云海InCloud AIOS:告別“找錯(cuò)書”與“看不全頁”,RAG檢索不跑偏

 2026-01-26 09:33  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

在 AI 深度落地的當(dāng)下,構(gòu)建高效精準(zhǔn)的智能問答系統(tǒng),已成為企業(yè)提升客戶體驗(yàn)、優(yōu)化內(nèi)部效率的關(guān)鍵。但基于大語言模型的RAG(檢索增強(qiáng)生成)系統(tǒng)落地時(shí),兩大核心痛點(diǎn)常讓企業(yè)陷入困境:

* 一是知識(shí)庫按產(chǎn)品型號(hào)、版本分區(qū)管理,語義高度相似導(dǎo)致系統(tǒng)“找錯(cuò)書”,比如詢問A型號(hào)故障卻返回B型號(hào)方案;

* 二是文檔切分粒度失衡引發(fā)“看不全頁”,切太細(xì)丟失上下文、模型易幻覺,切太粗噪聲冗余、關(guān)鍵信息被稀釋,最終導(dǎo)致回答失真、決策失準(zhǔn)。

針對(duì)這兩大難題,浪潮云海InCloud AIOS創(chuàng)新推出“多知識(shí)庫聚合路由+層級(jí)分段”雙技術(shù)方案,從“找對(duì)庫”到“找全信息”全鏈路優(yōu)化檢索精度,為企業(yè)級(jí)RAG系統(tǒng)注入精準(zhǔn)基因,讓智能問答從“模糊匹配”邁向“精準(zhǔn)命中”。

一、破解“找錯(cuò)書”:多知識(shí)庫聚合路由,精準(zhǔn)鎖定目標(biāo)知識(shí)

在構(gòu)建RAG系統(tǒng)過程中,用戶往往基于產(chǎn)品型號(hào)或版本號(hào)管理知識(shí),一個(gè)智能體應(yīng)用背后可能關(guān)聯(lián)了多個(gè)相近的知識(shí)庫(例如相似型號(hào)、相鄰版本等)。這種貼合人工使用習(xí)慣的管理方式,卻易讓RAG系統(tǒng)陷入檢索混亂。

浪潮云海InCloud AIOS設(shè)計(jì)的多知識(shí)庫聚合路由技術(shù),核心思路是“先篩除90%無關(guān)數(shù)據(jù),再精準(zhǔn)定位目標(biāo)”:

* 構(gòu)建知識(shí)庫畫像:為每個(gè)知識(shí)庫配置精準(zhǔn)的元數(shù)據(jù)描述。以浪潮云海超融合為例,IR5280H2產(chǎn)品知識(shí)庫的元數(shù)據(jù)可定義為 {"type": "IR5280H2", "desc": "IR5280H2產(chǎn)品知識(shí)庫"},而IR5280H3則對(duì)應(yīng) {"type": "IR5280H3", "desc": "IR5280H3產(chǎn)品知識(shí)庫"}。這些元數(shù)據(jù)如同知識(shí)庫的“身份證”,清晰標(biāo)識(shí)其內(nèi)容邊界。

* 智能意圖識(shí)別與路由:當(dāng)用戶提問(如“浪潮IR5280H2的BMC芯片是不是都是AST2500?”)到達(dá)時(shí),系統(tǒng)首先結(jié)合用戶輸入與知識(shí)庫畫像,通過語義分析識(shí)別用戶意圖,并動(dòng)態(tài)匹配最相關(guān)的一個(gè)或多個(gè)知識(shí)庫(如IR5280H2)。只有這些被路由的知識(shí)庫才會(huì)進(jìn)入后續(xù)的檢索流程。

通過這一機(jī)制,系統(tǒng)不再盲目掃描所有綁定的知識(shí)庫,而是像經(jīng)驗(yàn)豐富的圖書管理員一樣,快速鎖定目標(biāo)書架,從根本上杜絕了“張冠李戴”的錯(cuò)誤。最終提交給LLM的檢索內(nèi)容,幾乎全部來自正確的產(chǎn)品型號(hào)知識(shí)庫,回答準(zhǔn)確率因此可以實(shí)現(xiàn)質(zhì)的飛躍。

二、攻克 “看不全頁”:層級(jí)分段技術(shù),兼顧上下文完整與檢索精準(zhǔn)

解決了“找錯(cuò)書”的問題后,如何進(jìn)一步提升檢索精度?文檔切分粒度成為影響檢索精度的關(guān)鍵。傳統(tǒng) RAG 分段要么過細(xì)丟失上下文,要么過粗冗余干擾,而浪潮云海 InCloud AIOS 的層級(jí)分段技術(shù),借鑒人類 “快速翻閱找到關(guān)鍵詞,然后停下來細(xì)讀整段內(nèi)容” 的查閱邏輯,實(shí)現(xiàn) “用于搜索的內(nèi)容” 與 “用于生成的內(nèi)容” 的解耦,兼顧精準(zhǔn)性與上下文完整性:

* 一級(jí)段落構(gòu)建:將文檔按語義切分為相對(duì)較大的一級(jí)段落(如1000 tokens),確保每個(gè)段落保留完整的語義邏輯和上下文。

* 二級(jí)片段切分:對(duì)一級(jí)段落通過滑動(dòng)窗口或遞歸切分等手段,進(jìn)一步分解為更小的二級(jí)片段(如256 tokens),用于細(xì)粒度的語義匹配。系統(tǒng)僅對(duì)二級(jí)片段進(jìn)行向量化索引,并在元數(shù)據(jù)中記錄其所屬的一級(jí)分段標(biāo)識(shí)。

* 精準(zhǔn)檢索與生成:當(dāng)用戶提問時(shí),系統(tǒng)先匹配最相似的二級(jí)片段,然后根據(jù)元數(shù)據(jù)定位其所屬的一級(jí)分段,并將整個(gè)一級(jí)段落作為上下文反饋給LLM。

以法律合同檢索場(chǎng)景為例,兩種方案的差異直觀可見:

結(jié)語:以精準(zhǔn)檢索為基,讓企業(yè)級(jí)RAG游刃有余

精準(zhǔn)檢索是企業(yè)級(jí) AI 應(yīng)用的核心根基,浪潮云海 InCloud AIOS 通過 “多知識(shí)庫聚合路由” 破解知識(shí)混淆難題,用 “層級(jí)分段” 攻克文檔切分精度瓶頸,雙技術(shù)協(xié)同讓 RAG 系統(tǒng)的每一次檢索都直擊要害,從源頭提升智能問答的準(zhǔn)確性與可靠性。

企業(yè)級(jí)知識(shí)庫構(gòu)建需兼顧人工使用習(xí)慣與機(jī)器檢索邏輯,優(yōu)化之路永無止境。未來,浪潮云海將持續(xù)深耕檢索增強(qiáng)技術(shù),不斷探索更貼合企業(yè)業(yè)務(wù)場(chǎng)景的優(yōu)化方案,助力客戶構(gòu)建真正 “懂業(yè)務(wù)、知分寸、答得準(zhǔn)” 的智能推理應(yīng)用,讓企業(yè)在 AI 落地過程中,因精準(zhǔn)而高效,因?qū)I(yè)而游刃有余。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
浪潮云海

相關(guān)文章

  • AI游刃有余 | 告別運(yùn)維焦慮,浪潮云海OS解鎖智能運(yùn)維快車道

    近來,企業(yè)云平臺(tái)納管的資源規(guī)模持續(xù)激增,架構(gòu)復(fù)雜度呈指數(shù)級(jí)上升,傳統(tǒng)運(yùn)維模式早已不堪重負(fù),各類運(yùn)維焦慮層出不窮:*資源檢索大海撈針:查找資源,需在十幾個(gè)菜單間反復(fù)跳轉(zhuǎn);*數(shù)據(jù)報(bào)表僵化受限:只能按預(yù)設(shè)條件檢索和固定表頭展示;*日常巡檢低效易錯(cuò):面對(duì)大量非健康指標(biāo),只能依靠人工關(guān)聯(lián)分析。面對(duì)傳統(tǒng)交互模式

    標(biāo)簽:
    浪潮云海

熱門排行

信息推薦