當(dāng)前位置:首頁(yè) >  科技 >  IT業(yè)界 >  正文

騰訊云上線DeepSeek-V3.1模型API,智能體開(kāi)發(fā)平臺(tái)和 TI 平臺(tái)同步上線

 2025-08-22 16:40  來(lái)源: 互聯(lián)網(wǎng)   我來(lái)投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

8月22日,騰訊云上線DeepSeek-V3.1版本,企業(yè)和開(kāi)發(fā)者可以通過(guò)騰訊云直接調(diào)用新版模型的API接口,獲得穩(wěn)定優(yōu)質(zhì)的服務(wù)。同時(shí),騰訊云智能體開(kāi)發(fā)平臺(tái)(ADP)也接入了新版模型,通過(guò)平臺(tái)內(nèi)置的RAG、工作流和智能體開(kāi)發(fā)的能力,用戶可以快速搭建專屬智能體應(yīng)用。新模型在騰訊云TI平臺(tái)上也第一時(shí)間上架,用戶可以基于TI平臺(tái),快速部署專屬DeepSeek-V3.1服務(wù)。

用戶可以登陸騰訊云官網(wǎng)調(diào)用新模型的接口

也可以基于騰訊云智能體開(kāi)發(fā)平臺(tái)內(nèi)置的DeepSeek-V3.1新模型快速搭建智能體。

騰訊云智能體開(kāi)發(fā)平臺(tái)內(nèi)置行業(yè)實(shí)踐流程、領(lǐng)先的 RAG 算法,只需導(dǎo)入文檔/問(wèn)答對(duì),即可讓智能體對(duì)接企業(yè)多模態(tài)知識(shí),達(dá)到穩(wěn)定精確的知識(shí)問(wèn)答效果。支持畫布式靈活編排工作流,可快速將企業(yè)系統(tǒng) API 接入智能體,智能體輸出更穩(wěn)定可控。同時(shí),提供 LLM+RAG 、Multi-agent、Workflow 等多種智能體開(kāi)發(fā)框架,支持應(yīng)用配置-應(yīng)用調(diào)試-應(yīng)用評(píng)測(cè)-應(yīng)用發(fā)布一站式工具鏈,助力企業(yè)降低智能體構(gòu)建門檻。

騰訊云智能體開(kāi)發(fā)平臺(tái)ADP

此外,DeepSeek新版模型在騰訊云TI平臺(tái)上也第一時(shí)間上架,用戶可一鍵部署DeepSeek-V3.1專屬服務(wù),滿足企業(yè)的個(gè)性化需求。TI平臺(tái)在業(yè)內(nèi)率先支持DeepSeek全系模型的企業(yè)級(jí)精調(diào)與推理全鏈路功能,為金融、醫(yī)療、制造、零售等多個(gè)行業(yè)提供了更高效、便捷的AI模型構(gòu)建及應(yīng)用方案,進(jìn)一步降低企業(yè)在大模型應(yīng)用中的技術(shù)門檻和研發(fā)成本。

騰訊云TI平臺(tái)

DeepSeek-V3.1在工具調(diào)用和智能體支持上進(jìn)一步增強(qiáng),思考效率也進(jìn)一步提升,具體體現(xiàn)在:

混合推理架構(gòu):一個(gè)模型同時(shí)支持思考模式與非思考模式;

更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短時(shí)間內(nèi)給出答案。其測(cè)試結(jié)果顯示,經(jīng)過(guò)思維鏈壓縮訓(xùn)練后,V3.1-Think 在輸出 token數(shù)減少20%-50%的情況下,各項(xiàng)任務(wù)的平均表現(xiàn)與R1-0528持平;同時(shí),V3.1 在非思考模式下的輸出長(zhǎng)度也得到了有效控制,相比于 DeepSeek-V3-0324 ,能夠在輸出長(zhǎng)度明顯減少的情況下保持相同的模型性能。

更強(qiáng)的 Agent 能力:通過(guò) Post-Training 優(yōu)化,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。比如,在編程智能體上,在代碼修復(fù)測(cè)評(píng) SWE 與命令行終端環(huán)境下的復(fù)雜任務(wù)(Terminal-Bench)測(cè)試中,DeepSeek-V3.1 相比之前的 DeepSeek 系列模型有明顯提高。

騰訊云是國(guó)內(nèi)率先支持DeepSeek API+聯(lián)網(wǎng)搜索的云廠商。為了提供更優(yōu)質(zhì)的DeepSeek模型服務(wù),騰訊云在推理加速層面不斷優(yōu)化,通過(guò)深挖內(nèi)核和架構(gòu)延展,以及PD分離、NIXL傳輸技術(shù),在精度幾乎無(wú)損的前提下,實(shí)現(xiàn)服務(wù)時(shí)延的大幅降低,以及吞吐能力的大幅提升。比如用戶使用DeepSeek R1,在3.5K輸入、1K輸出的典型場(chǎng)景下, 保障首Token延時(shí)不高于2秒,吐字速率不低于每秒15Tokens的同時(shí),2機(jī)16卡的QPM超過(guò)200;使用DeepSeek V3-0324,在3.5K輸入、0.67K輸出的典型場(chǎng)景下,2機(jī)16卡的QPM達(dá)到260。

通過(guò)持續(xù)的技術(shù)優(yōu)化和產(chǎn)品打磨,騰訊云DeepSeek API以及智能體開(kāi)發(fā)平臺(tái)、TI平臺(tái)已經(jīng)服務(wù)了眾多客戶,覆蓋互聯(lián)網(wǎng)、金融、零售、政務(wù)、出行等眾多領(lǐng)域。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
騰訊云

相關(guān)文章

  • AICon北京2025:騰訊云聯(lián)合Gartner發(fā)布 Data+AI 報(bào)告

    2025年6月27-28日,由極客邦科技旗下InfoQ極客傳媒主辦的AICon全球人工智能開(kāi)發(fā)與應(yīng)用大會(huì)在北京盛大召開(kāi)。

    標(biāo)簽:
    騰訊云
  • 騰訊云短暫崩潰2小時(shí)

    關(guān)注盧松松,會(huì)經(jīng)常給你分享一些我的經(jīng)驗(yàn)和觀點(diǎn)。2024年4月8日下午,松松看到騰訊云產(chǎn)品群里突然一大堆消息冒,仔細(xì)一看原來(lái)是騰訊云崩潰了。控制臺(tái)和部分API應(yīng)該的宕機(jī)了。影響產(chǎn)品包括:云服務(wù)器、消息隊(duì)列CKafka版、微服務(wù)平臺(tái)TSF、云函數(shù)、云硬盤、文件存儲(chǔ)、日志服務(wù)、云數(shù)據(jù)庫(kù)MySQL等等。按我

    標(biāo)簽:
    騰訊云
  • 業(yè)績(jī)回暖背后,2024阿里云、華為云、騰訊云AI戰(zhàn)拉開(kāi)帷幕

    過(guò)去幾年,降本增效、高質(zhì)量增長(zhǎng),已經(jīng)成為多數(shù)云廠商們心照不宣的主題了。

    標(biāo)簽:
    阿里云
    華為云
    騰訊云
  • 昨天,騰訊云重新定義了向量數(shù)據(jù)庫(kù)

    摘要:未來(lái)企業(yè)之間的競(jìng)爭(zhēng)將更加集中在數(shù)據(jù)上,誰(shuí)能夠更好地利用數(shù)據(jù),誰(shuí)就有可能在未來(lái)的競(jìng)爭(zhēng)中取勝。而看好AI,就應(yīng)該看好向量數(shù)據(jù)庫(kù),這是騰訊云的邏輯。------騰訊云數(shù)據(jù)庫(kù)副總經(jīng)理羅云昨天,騰訊云在北京召開(kāi)發(fā)布會(huì),宣布重新定義向量數(shù)據(jù)庫(kù),并發(fā)布了國(guó)內(nèi)首個(gè)AI原生的向量數(shù)據(jù)庫(kù)TencentCloudV

    標(biāo)簽:
    騰訊云
  • 行業(yè)大模型精選商店開(kāi)張,騰訊云進(jìn)擊大模型第一步

    扎根產(chǎn)業(yè),騰訊云為大模型找到了最好的練兵場(chǎng)。對(duì)騰訊云來(lái)說(shuō),這是一種務(wù)實(shí)的選擇。作者|黃槍槍編輯|CindyChatGPT推動(dòng)的AI大模型浪潮,已深入行業(yè)領(lǐng)域。最近兩個(gè)月,從國(guó)外微軟、OpenAI到國(guó)內(nèi)百度、科大訊飛、阿里、360、中國(guó)移動(dòng)等,紛紛針對(duì)政企、教育等行業(yè)客戶,推出相關(guān)產(chǎn)品和解決方案。現(xiàn)在

    標(biāo)簽:
    騰訊云

熱門排行

信息推薦