1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. 人工智能
  4. 正文

遠(yuǎn)傳科技“數(shù)字主持人”誕生記:不是復(fù)制,而是創(chuàng)造一個(gè)新模態(tài)

 2021-05-31 14:27  來(lái)源:互聯(lián)網(wǎng)  我來(lái)投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

遠(yuǎn)傳科技從未停止“造人”的腳步。

除了有“AI虛擬主播”之外,現(xiàn)在連“數(shù)字主持人”也來(lái)了,“數(shù)字主持人”到底是什么呢?

遠(yuǎn)傳科技的“數(shù)字主持人”是通過(guò)語(yǔ)音合成、唇形合成、表情合成以及深度學(xué)習(xí)等技術(shù),克隆出具備和真人主播一樣播報(bào)能力的數(shù)字人。通過(guò)語(yǔ)音合成技術(shù)和視頻驅(qū)動(dòng)技術(shù),只需要輸入一段文本,它就能在屏幕展現(xiàn)虛擬數(shù)字人形象并進(jìn)行新聞播報(bào),且唇形動(dòng)作能與播報(bào)聲音實(shí)時(shí)同步。

或許在不久的未來(lái),你再也分不清視頻中的主持人,究竟是真人還是虛擬人,而這一天正在到來(lái)。

一、根源探究:「高逼真」的背后

遠(yuǎn)傳科技“數(shù)字主持人”以真人為原型,通過(guò)將真人形象數(shù)字化掃描技術(shù),建立超寫(xiě)實(shí) 3D 數(shù)字人建模,多模態(tài)識(shí)別及生成、實(shí)時(shí)面部動(dòng)作生成及驅(qū)動(dòng)、遷移學(xué)習(xí)等技術(shù)「熔爐」,煉就而成。

從效果上來(lái)說(shuō),3D AI 合成主播給人的最大印象便是高逼真,它較好的還原了真人的發(fā)膚、表情;同時(shí),靈活性、可塑性更強(qiáng),擁有的豐富的面部表情動(dòng)作,嘴部唇動(dòng),以及身體的輕微擺動(dòng),具備在更廣闊空間使用的潛力。

透過(guò) 3D AI 合成主播技術(shù)實(shí)現(xiàn)過(guò)程,我們探究它為何擁有如此逼真的效果。

1.數(shù)字化掃描技術(shù)還原真人形象

建立人物模型必須要有海量數(shù)據(jù),遠(yuǎn)傳科技數(shù)字化掃描技術(shù)通過(guò)攝像頭對(duì)真人原型的身體各個(gè)部位進(jìn)行全方位「打點(diǎn)」掃描,采集每一處細(xì)節(jié),并對(duì)其多種形態(tài)的面部表情動(dòng)作,嘴部唇動(dòng),以及身體的輕微擺動(dòng)進(jìn)行細(xì)致入微地捕捉記錄,還原真人形象。

2.深度學(xué)習(xí)算法生成3D數(shù)字人模型

遠(yuǎn)傳科技算法工程師熟練應(yīng)用深度學(xué)習(xí)算法,對(duì)算法里的大量參數(shù)進(jìn)行調(diào)優(yōu),確保生成的3D數(shù)字人模型能夠精確的還原真人在正常說(shuō)話時(shí)候的唇部動(dòng)作,臉部表情及微動(dòng)作,對(duì)3D數(shù)字人模型進(jìn)行實(shí)時(shí)驅(qū)動(dòng)、渲染,使其面部肌肉驅(qū)動(dòng)、表情肢體和語(yǔ)言表達(dá)能力達(dá)到一個(gè)較高的度契合。確保非專(zhuān)業(yè)人士無(wú)法分辨出是真人拍攝的視頻還是通過(guò)數(shù)字技術(shù)合成出來(lái)的視頻。

二、核心亮點(diǎn): AI 驅(qū)動(dòng)、多模態(tài)交互

1.AI 驅(qū)動(dòng)的 3D 數(shù)字人

遠(yuǎn)傳科技“數(shù)字主持人”是一種由AI所驅(qū)動(dòng)的虛擬存在,擁有和真人一致的音容、笑貌和言談舉止,擁有表達(dá)情感和智慧的能力。仔細(xì)觀察你會(huì)發(fā)現(xiàn), 3D AI 合成主播是基于 AI 算法實(shí)現(xiàn)驅(qū)動(dòng)。

具體來(lái)說(shuō),3D “數(shù)字主持人”靠 AI 算法實(shí)時(shí)驅(qū)動(dòng),輸入一個(gè)文本就能輸出一個(gè)視頻,往往生成一個(gè) 1 分鐘的視頻,僅只需要 1 分鐘,幾乎可以看作實(shí)時(shí)生成。

2.關(guān)鍵技術(shù)賦能多模態(tài)交互創(chuàng)新

唇動(dòng)算法、3D建模技術(shù)、深度學(xué)習(xí)算法、5G通信等關(guān)鍵技術(shù)探索文本、語(yǔ)音和視覺(jué)多模態(tài)交互創(chuàng)新的無(wú)限可能。

遠(yuǎn)傳科技利用唇動(dòng)算法分析出數(shù)字人應(yīng)顯示的口型標(biāo)記,突破語(yǔ)言交流過(guò)程的表情和唇動(dòng)的無(wú)縫鏈接;根據(jù)給定人物形象要求,建立數(shù)字人3D模型,綁定骨骼,創(chuàng)立動(dòng)作動(dòng)畫(huà)和口型動(dòng)畫(huà);基于深度學(xué)習(xí)算法、肢體捕捉技術(shù),將文本、音頻和圖片實(shí)時(shí)生成數(shù)字人視頻;5G通信技術(shù)則讓用戶(hù)跟數(shù)字人進(jìn)行語(yǔ)音視頻互動(dòng)成為可能,麥克風(fēng)和攝像頭捕捉用戶(hù)的語(yǔ)音和動(dòng)作,數(shù)字人的后端人工智能算法根據(jù)場(chǎng)景生成對(duì)應(yīng)的數(shù)字人交互動(dòng)作、表情和語(yǔ)音。

三、未來(lái)已來(lái),你準(zhǔn)備好了嗎?

遠(yuǎn)傳科技“數(shù)字主持人”雖然基于真實(shí)的人進(jìn)行建模,但呈現(xiàn)在人們面前的行為都是完全逼真的,能像真實(shí)主播一樣,去笑,去哭,去表達(dá),是被創(chuàng)造出來(lái)的一個(gè)“數(shù)字人”。

數(shù)字人的未來(lái)將會(huì)作為主體人的一個(gè)副本形式存在于數(shù)字世界中,在未來(lái)的數(shù)字世界中我們將無(wú)法分辨出真人和數(shù)字人,大量在數(shù)字世界的服務(wù)將都會(huì)由數(shù)字人來(lái)代替,在電話客戶(hù)服務(wù)、線上產(chǎn)品講解、電商直播甚至線上演唱會(huì)等眾多場(chǎng)景都將會(huì)有數(shù)字人的角色參與,數(shù)字化終極未來(lái)也許就是數(shù)字人的世界。

你準(zhǔn)備好接受一個(gè)數(shù)字世界了嗎?

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • 全球AI巨頭正在賭:誰(shuí)搞定MCP,誰(shuí)就是未來(lái)老大

    我不是危言聳聽(tīng),現(xiàn)在全球的AI巨頭都在做MCP,毫不夸張的說(shuō):誰(shuí)能把MCP做起來(lái),誰(shuí)就擁有AI生態(tài)控制權(quán),誰(shuí)就是AI圈的老大。你們有沒(méi)有發(fā)現(xiàn),MCP在2025年初開(kāi)始特別火爆,互聯(lián)網(wǎng)技術(shù)大廠都在強(qiáng)推MCP。(1)阿里云百煉搞了個(gè)MCP平臺(tái),提供50+預(yù)置MCP服務(wù)。不過(guò)大都只面向阿里系產(chǎn)品。(2)騰

    標(biāo)簽:
    ai智能
  • 對(duì)話李軍:人工智能是“第五范式革命”

    2025國(guó)際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為主辦方之一,歐美同學(xué)基金會(huì)理事長(zhǎng)李軍接受了大賽主持人艾誠(chéng)采訪。在采訪中,李軍認(rèn)為IAEPC不僅是一場(chǎng)“冠軍中的冠軍”對(duì)決,更是一次全球AI人才的線下交流盛會(huì)。大賽“史無(wú)前例”的吸引了全球青年科技精英匯聚香港,更加推動(dòng)和普

  • 對(duì)話施韓原與杜瑜皓:與參賽選手一起改變世界

    2025國(guó)際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。作為大賽發(fā)起人方之一及裁判委員會(huì)負(fù)責(zé)人,施韓原與杜瑜皓接受了大賽主持人艾誠(chéng)采訪。裁判委員會(huì)主席施韓原分享了此次大賽的亮點(diǎn),IAEPC首次引入創(chuàng)新賽道,探索選手如何與AI合作進(jìn)行答題。裁判委員會(huì)副主席杜瑜皓認(rèn)為,選手最終目標(biāo)并

  • 吳林林專(zhuān)訪IAEPC冠軍:與全球參賽者交流是最重要的一課

    2025國(guó)際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來(lái)自深圳的學(xué)生吳林林作為主辦方記者團(tuán)成員,采訪了大賽冠軍選手之一。在吳林林的采訪中,選手認(rèn)為與來(lái)自全球的參賽者交流是自己學(xué)到的最重要的一課。在科技與AI之前,選手們可以平等、開(kāi)放、友好的交流。以下是采訪實(shí)錄(有刪節(jié)):吳林林

  • 吳林林專(zhuān)訪黃錦輝:年輕人要像懂中文一樣懂A

    2025國(guó)際人工智能程序設(shè)計(jì)精英挑戰(zhàn)賽(IAEPC)在香港中文大學(xué)成功舉辦。來(lái)自深圳的學(xué)生吳林林作為主辦方記者團(tuán)成員,采訪了大會(huì)嘉賓:全國(guó)政協(xié)委員、香港特別行政區(qū)立法會(huì)議員、香港中文大學(xué)工程學(xué)院副院長(zhǎng)、IAEPC聯(lián)合發(fā)起人黃錦輝先生。在吳林林的采訪中,黃錦輝教授勉勵(lì)年輕人要像懂中文和英語(yǔ)一樣懂AI,

  • 本以為DeepSeek天下無(wú)敵了,沒(méi)想到Manus更猛

    昨天新出了一個(gè)AI,據(jù)說(shuō)比DeepSeek還牛,而截止到今早,已經(jīng)有10萬(wàn)人在排隊(duì)申請(qǐng)Manus邀請(qǐng)碼了,而且它邀請(qǐng)碼已經(jīng)炒到10萬(wàn)了。這是北京的一家人工智能公司蝴蝶科技,創(chuàng)始人是一名來(lái)自華中科技大學(xué)的90后畢業(yè)生肖弘,突然向全球宣布:世界上第一款真正的人工智能、通用智能體產(chǎn)品出現(xiàn)了,名叫Manus

    標(biāo)簽:
    ai智能

編輯推薦