1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

愛(ài)數(shù)智慧發(fā)布中文普通話真·萌童聲TTS開(kāi)源數(shù)據(jù)集

 2019-11-26 14:41  來(lái)源:互聯(lián)網(wǎng)  我來(lái)投稿 撤稿糾錯(cuò)

  阿里云優(yōu)惠券 先領(lǐng)券再下單

11月20日,愛(ài)數(shù)智慧發(fā)布中文普通話真·萌童聲語(yǔ)音合成(TTS)開(kāi)源數(shù)據(jù)集。該數(shù)據(jù)集由真童聲錄制,為中文童聲語(yǔ)音合成數(shù)據(jù)集子集,時(shí)長(zhǎng)為15分鐘,文本主要為日常用語(yǔ)。據(jù)了解,數(shù)據(jù)集全集包含2235句話,時(shí)長(zhǎng)超2小時(shí)。這也是該童聲第一次用于TTS錄制。

隨著智能終端市場(chǎng)的擴(kuò)張,人機(jī)交互逐漸成為與智能世界對(duì)話的入口。在人機(jī)互動(dòng)過(guò)程中,語(yǔ)音合成(TTS)的自然度和表現(xiàn)力是用戶最能直觀感受到的部分。用戶使用智能設(shè)備的頻率增加,對(duì)合成語(yǔ)音的期望值也不斷提高。

TTS數(shù)據(jù)是影響語(yǔ)音合成效果的重要因素。由于TTS數(shù)據(jù)的采集和標(biāo)注要求嚴(yán)格,因而成品數(shù)據(jù)集較少。從采集環(huán)節(jié)來(lái)看,錄音需要在專業(yè)的錄音棚中進(jìn)行,并嚴(yán)格控制噪聲水平,才能最大限度還原發(fā)音人聲音。錄音過(guò)程中還需要有專業(yè)的錄音師和監(jiān)聽(tīng)人在場(chǎng),便于及時(shí)矯正錄音過(guò)程中的錯(cuò)誤。從標(biāo)注環(huán)節(jié)來(lái)看,TTS數(shù)據(jù)標(biāo)注分為4個(gè)層級(jí),包括發(fā)音校對(duì)、韻律層級(jí)、音素邊界切分和分詞詞性。為了充分保留發(fā)音人的語(yǔ)義表達(dá)和發(fā)音習(xí)慣,標(biāo)注準(zhǔn)確率要求一般在99%左右。

智能設(shè)備使用者“低齡化”趨勢(shì)明顯,從而帶動(dòng)了童聲數(shù)據(jù)的需求。受制于兒童識(shí)字水平和配合情況,市面上童聲TTS數(shù)據(jù)庫(kù)數(shù)量較少,且多為成年人模仿。童聲TTS語(yǔ)料庫(kù)呈現(xiàn)出明顯的供需不平衡。

本次愛(ài)數(shù)智慧發(fā)布的TTS童聲開(kāi)源數(shù)據(jù)集采集環(huán)境為符合NC-20標(biāo)準(zhǔn)的錄音間并根據(jù)兒童發(fā)音習(xí)慣對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)寫(xiě)和全鏈條標(biāo)注??紤]到句內(nèi)停頓和句間停頓對(duì)聽(tīng)感的影響,在音素邊界切分環(huán)節(jié),標(biāo)注人員除了對(duì)聲韻母邊界進(jìn)行切分外,還對(duì)句中靜音段和句首尾進(jìn)行精準(zhǔn)切分。

發(fā)音人是影響TTS數(shù)據(jù)質(zhì)量的重要因素。該數(shù)據(jù)集的發(fā)音人為4歲小朋友妞妞。2019年初,發(fā)音韻律好的妞妞在上百位4-6歲小朋友中脫穎而出。因?yàn)榘l(fā)音韻律好能為用戶帶來(lái)更好的聽(tīng)感。

在與愛(ài)數(shù)智慧工作人員接觸中,我們了解到妞妞性格活潑開(kāi)朗,喜歡看冰雪奇緣和小馬寶莉。在錄制休息期間,想要看動(dòng)畫(huà)片時(shí),就會(huì)黏著工作人員撒嬌。錄制工作已經(jīng)結(jié)束很久,工作人員在提起妞妞時(shí),言語(yǔ)間還是充滿著濃濃的不舍與贊賞。這份由衷的贊賞,也讓我們對(duì)這個(gè)真·萌童聲充滿期待!

為智能世界提供充足的數(shù)據(jù)生產(chǎn)力是這家公司創(chuàng)立的初衷。我們也期待愛(ài)數(shù)智慧用更多高質(zhì)量的數(shù)據(jù)解鎖更多應(yīng)用場(chǎng)景,服務(wù)更廣域的客戶。

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
人工智能
智慧生活

相關(guān)文章

  • 弈動(dòng) Dynamic·數(shù)智躍遷 博弈無(wú)界|2025TechWorld智慧安全大會(huì)在京召開(kāi)

    在數(shù)字化與智能化深度交織的時(shí)代浪潮中,安全的邊界不斷延展,技術(shù)的演進(jìn)正引領(lǐng)產(chǎn)業(yè)邁向新一輪變革。10月24日,以“弈動(dòng)Dynamic·數(shù)智躍遷博弈無(wú)界”為主題的2025TechWorld智慧安全大會(huì)在北京盛大召開(kāi)。來(lái)自國(guó)家部委、院士學(xué)者、高??蒲袡C(jī)構(gòu)和企業(yè)的權(quán)威專家與業(yè)界精英齊聚北京,共議AI安全、數(shù)

    標(biāo)簽:
    弈動(dòng)
  • 甌江論道:AI賦能綠色發(fā)展

    2025年10月25日,2025世界青年科學(xué)家峰會(huì)之人工智能(AI)融合創(chuàng)新發(fā)展論壇在浙江溫州成功舉辦。本次論壇由國(guó)際院士科創(chuàng)中心主辦,中國(guó)投資協(xié)會(huì)能源投資專業(yè)委員會(huì)、溫港院士科創(chuàng)中心承辦,中國(guó)電工技術(shù)學(xué)會(huì)、中科先進(jìn)技術(shù)溫州研究院與溫州市電力工程學(xué)會(huì)提供支持,以“甌江論道-AI賦能綠色發(fā)展”為主題,

    標(biāo)簽:
    ai技術(shù)
  • AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    AI云“分野”:阿里云們“賣鏟”,火山引擎奇襲“MaaS”

    標(biāo)簽:
    阿里巴巴
  • 未來(lái)5年,中國(guó)AI的“大洗牌”和“內(nèi)循環(huán)”

    我覺(jué)得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開(kāi)發(fā),建立可控的世界級(jí)AI體系。所以這是俺對(duì)未來(lái)5年中國(guó)AI圈的展望和判斷。(1)2026年,英偉達(dá)造車、國(guó)產(chǎn)開(kāi)車26年國(guó)產(chǎn)芯片會(huì)在推理和垂直場(chǎng)景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會(huì)以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開(kāi),訓(xùn)練就

  • H20芯片開(kāi)賣即叫停,英偉達(dá)如何解圍?

    文/道哥在深陷“后門(mén)”風(fēng)波、接受網(wǎng)信辦問(wèn)詢之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國(guó)科技媒體《TheInformation》援引知情人士消息稱,英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI

    標(biāo)簽:
    英偉達(dá)
  • 真正的「國(guó)產(chǎn)英偉達(dá)」來(lái)了

    文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)關(guān)于“中國(guó)芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會(huì)已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請(qǐng)。作為中國(guó)半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心,以及在國(guó)產(chǎn)GPU領(lǐng)域取

    標(biāo)簽:
    英偉達(dá)