1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

視頻AR玩法進(jìn)入全身時代,相芯人體AI技術(shù)全面升級

 2020-07-13 15:20  來源:互聯(lián)網(wǎng)  我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領(lǐng)券再下單

還在玩只限于人臉的AR玩法嗎?一鍵美體塑形、視頻體感游戲、用手機就能玩虛擬形象全身驅(qū)動……隨著5G即將全面普及以及智能圖形技術(shù)的不斷創(chuàng)新,原本受限于高端硬件的全身AR技術(shù),現(xiàn)在用智能手機就能玩,視頻AR玩法也將全面進(jìn)入了全身時代。

相芯科技此次對人體AI技術(shù)進(jìn)行全面升級,在視頻AR特效的功能基礎(chǔ)上進(jìn)行玩法升級,同時新增開放7大功能的算法接口,分別是2D人體關(guān)鍵點、3D人體骨骼、人像分割、頭部分割、頭發(fā)分割、動作識別、手勢識別。每項技術(shù)革新背后都能帶來新的應(yīng)用層的火花,相芯更新的技術(shù)效果到底如何,一起來看下吧。

打開APP 閱讀最新報道一、2D人體關(guān)鍵點

通過2D人體關(guān)鍵點算法接口,實現(xiàn)人體全身2D關(guān)鍵點的跟蹤效果,點位準(zhǔn)確性高,即使做大幅度動作、遮擋以及轉(zhuǎn)身的情況下,也能準(zhǔn)確穩(wěn)定跟蹤。同時針對用戶在短視頻、直播拍攝時的自拍場景,2D人體關(guān)鍵點還提供半身模式的點位跟蹤,這樣用戶在單手持手機自拍的情況下,也能準(zhǔn)確定位人體數(shù)據(jù)。

在高精度的人體關(guān)鍵點模型的基礎(chǔ)上,對視頻中的人物實現(xiàn)全身美體功能,是這項技術(shù)比較熱門的應(yīng)用場景。相芯的技術(shù),可以從瘦身、長腿、細(xì)腰、美肩、美臀、小頭、瘦腿等七個美化維度,對人物的身體進(jìn)行精細(xì)化調(diào)整,從而達(dá)到一件瘦身塑形的作用。

二、3D人體骨骼

相芯科技開放的3D人體骨骼的算法接口,主要應(yīng)用于基于3D關(guān)鍵點和3D骨骼,實現(xiàn)3D虛擬形象的全身驅(qū)動。這項技術(shù)不依賴于深度攝像頭,只需要手機的普通攝像頭就能獲得視頻中的人體3D骨骼數(shù)據(jù),即使人物做大幅度的動作、有動作遮擋、轉(zhuǎn)身等情況都能穩(wěn)定跟蹤。除了身體軀干動作,在手指細(xì)節(jié)上,也能識別和跟蹤常見的14種手勢。讓3D虛擬形象能夠更細(xì)膩地復(fù)原人物的動作。同樣針對他人拍攝和自拍兩種拍攝場景,相芯提供全身和半身兩種模式,支持3D人體骨骼數(shù)據(jù)的輸出。

三、人像分割

通過人像分割的算法接口,可對輸入的視頻進(jìn)行內(nèi)容理解,將人物進(jìn)行高精分割解析,將人像區(qū)域分離出來,并實時追蹤。例如視頻直播過程中,識別用戶的人體輪廓,為人物實時替換各種背景特效。也可以與各具創(chuàng)意的人體AR貼紙相結(jié)合,讓貼紙實時跟隨人體移動,貼紙素材與人體的前后位置關(guān)系可靈活定義,可以充分發(fā)揮運營者的互動創(chuàng)意,為用戶帶來更加豐富的娛樂體驗。

四、頭部分割

通過頭部分割接口,企業(yè)和開發(fā)者可以對人物頭部區(qū)域做更多的特效創(chuàng)意。例如搞笑大頭玩法特效,可以實現(xiàn)視頻中的人物頭部放大的萌態(tài)效果。這項技術(shù)還能和其他技術(shù)進(jìn)行組合實現(xiàn)更加新穎的玩法效果。比如將頭部分割和表情系數(shù)結(jié)合,即可用特點的表情,觸發(fā)大頭效果,并用表情的夸張程度來實時控制頭部的放大程度。用頭部分割+哈哈鏡+AR貼紙這樣的技術(shù)組合,就可以實效惡搞版的效果,充分發(fā)揮腦洞創(chuàng)意。

五、頭發(fā)分割

通過頭發(fā)分割接口,可以在視頻和照片中人物的頭發(fā)區(qū)域高精度地分離出來,可以給頭發(fā)切換各種各樣的顏色,可以是純色,也可以是漸變色,實現(xiàn)一鍵換發(fā)色的特效。同時頭發(fā)的色值支持自定義,并可以進(jìn)行上色程度的調(diào)整,實現(xiàn)想要的發(fā)色,想換就換。

六、動作識別

相芯科技的動作識別接口,能夠支持15種全身動作的識別。將動作識別和匹配算法相結(jié)合,可以開發(fā)出各種體感小游戲,比如“尬舞機”游戲,跟著屏幕的動作提示即可開始跳舞了。同時動作識別也可以與AR貼紙相結(jié)合,用特定動作來觸發(fā)貼紙?zhí)匦?充分發(fā)揮體感互動的娛樂性。

七、手勢識別

通過手勢識別接口,可精準(zhǔn)識別常見的14種手勢動作。在短視頻直播領(lǐng)域,用戶在拍視頻和拍照過程中,可以通過手勢動作來觸發(fā)各種貼紙?zhí)匦?從而衍生出創(chuàng)意視頻的各種玩法。同時,在智能設(shè)備領(lǐng)域,比如智能家電、智能機器人、可穿戴設(shè)備、智能互動大屏等智能硬件,可以實現(xiàn)用手勢控制對應(yīng)的功能。用戶在不接觸設(shè)備的情況下,通過簡單的手勢,就能實現(xiàn)對設(shè)備的交互和控制,讓人機交互方式更加智能化、自然化。

相芯科技專注于人工智能和計算機圖形學(xué)的融合與創(chuàng)新,致力于為消費級應(yīng)用提供內(nèi)容創(chuàng)作工具、平臺和解決方案。相芯科技的人臉人體AI解決方案目前已累計服務(wù)700多家B端客戶,產(chǎn)品被廣泛應(yīng)用于短視頻、直播、社交、游戲、智能家居、在線教育、廣告營銷、新零售等領(lǐng)域,月均調(diào)用量達(dá)40億。

此次的人體AI SDK大更新,相芯針對不同體驗需求推出了兩個版本的體驗demo,分別是特效版和算法版demo。

【特效版demo】模擬真實的用戶應(yīng)用場景,提供技術(shù)的功能演示和體驗,可以在這個demo里面直觀體驗美顏、美妝、道具貼紙、Animoji、美發(fā)、輕美妝、AR面具、搞笑大頭、海報換臉、表情識別、音樂濾鏡、哈哈鏡、美體、全身Avatar、動作識別、人像分割、手勢識別等功能。

同時針對開發(fā)者用戶,為了能更好地體驗各個功能接口在算法層的效果,相芯全新推出【算法版demo】,使用這個demo就能直觀地看到各種人體關(guān)鍵點、人體骨骼、mask類功能的算法效果,便于進(jìn)一步開發(fā)使用。目前開放的接口為2D人體關(guān)鍵點、3D人體骨骼、人像分割、頭部分割、頭發(fā)分割、動作識別、手勢識別。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標(biāo)簽
ar技術(shù)
ai技術(shù)

相關(guān)文章

  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • 王通:未來個人創(chuàng)業(yè)的十個機會

    個人創(chuàng)業(yè)需要啟動成本低、無需龐大團(tuán)隊、可快速驗證、能利用個人技能或資源。這里分享適合個人創(chuàng)業(yè)的十個機會一.AI內(nèi)容優(yōu)化與本地化服務(wù)·做什么:幫助企業(yè)或個人利用AI工具(如GPT-4,Midjourney)優(yōu)化內(nèi)容生產(chǎn)流程。例如,為跨境電商撰寫多語言產(chǎn)品描述,為小紅書博主生成爆款文案,為小公司制作營銷

  • 百度智能云PaddleOCR 3.1正式發(fā)布:關(guān)鍵能力支持MCP

    百度AI團(tuán)隊今日正式推出PaddleOCR3.1版本,以突破性的多語言組合識別(MultilingualCompositionPerception,MCP)技術(shù)為核心,徹底重構(gòu)復(fù)雜文檔處理邊界。此次升級標(biāo)志著OCR領(lǐng)域首次實現(xiàn)對同一文檔內(nèi)任意混合語言文本的精準(zhǔn)識別,為全球化企業(yè)、跨境業(yè)務(wù)及多元文化場

    標(biāo)簽:
    ai智能
    ai技術(shù)
  • AI工具導(dǎo)航網(wǎng)站,未來的發(fā)展前景怎么樣?

    導(dǎo)航網(wǎng)站的崛起:從信息過載到精準(zhǔn)觸達(dá)隨著全球AI工具數(shù)量爆發(fā)式增長(2025年已超數(shù)萬款),用戶面臨前所未有的選擇困境。傳統(tǒng)搜索引擎的“關(guān)鍵詞-鏈接”模式難以應(yīng)對工具篩選的場景需求,垂直化、場景化的AI導(dǎo)航網(wǎng)站應(yīng)運而生。這類平臺通過聚合、評測、分類與推薦四重機制,將分散的工具資源整合為結(jié)構(gòu)化入口。例

  • 微信AI搜索被指“強行開盒”:名字成了數(shù)據(jù)入口,騰訊回應(yīng)“僅用公開信息”

    當(dāng)微信公眾號文章中出現(xiàn)一個人的名字,它會自動變成藍(lán)色鏈接,點擊即可查看AI生成的“個人簡歷”——這一微信新功能讓不少用戶感到被“扒光”在互聯(lián)網(wǎng)上。近日,微信新上線的“AI搜索”功能陷入隱私泄露爭議漩渦。多位網(wǎng)友在社交平臺反映,當(dāng)微信公眾號推文中出現(xiàn)本人姓名時,名字會自動變?yōu)樗{(lán)色超鏈接,點擊即可瀏覽由

    標(biāo)簽:
    ai技術(shù)
    ai搜索
  • GDPS2025賽場直擊!開普勒大黃蜂助力華理斬獲搬運賽項桂冠

    12月12日-14日,2025全球開發(fā)者先鋒大會暨國際具身智能技能大賽(GDPS2025)于上海張江科學(xué)會堂舉行,大會以具身智能競技為核心,融合了技術(shù)比拼、產(chǎn)業(yè)展示與科普體驗,為全球觀眾呈現(xiàn)出具身智能的現(xiàn)在與未來。上海開普勒機器人有限公司(以下簡稱"開普勒機器人")攜明星產(chǎn)品K2"大黃蜂"亮相,并參

    標(biāo)簽:
    GDPS
    2025
  • 弈動 Dynamic·數(shù)智躍遷 博弈無界|2025TechWorld智慧安全大會在京召開

    在數(shù)字化與智能化深度交織的時代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動Dynamic·數(shù)智躍遷博弈無界”為主題的2025TechWorld智慧安全大會在北京盛大召開。來自國家部委、院士學(xué)者、高??蒲袡C構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)

    標(biāo)簽:
    弈動
  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國際院士科創(chuàng)中心主辦,中國投資協(xié)會能源投資專業(yè)委員會、溫港院士科創(chuàng)中心承辦,中國電工技術(shù)學(xué)會、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    標(biāo)簽:
    阿里巴巴
  • 未來5年,中國AI的“大洗牌”和“內(nèi)循環(huán)”

    我覺得我們AI的目標(biāo)是:從芯片設(shè)計到軟件生態(tài),全鏈路自主開發(fā),建立可控的世界級AI體系。所以這是俺對未來5年中國AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國產(chǎn)開車26年國產(chǎn)芯片會在推理和垂直場景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會以軟件彌補硬件不足,所以訓(xùn)練和推理分開,訓(xùn)練就

  • H20芯片開賣即叫停,英偉達(dá)如何解圍?

    文/道哥在深陷“后門”風(fēng)波、接受網(wǎng)信辦問詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標(biāo)簽:
    英偉達(dá)