itri tts@ web logo

高音質中文文字轉語音系統

特色簡介

高品質自然語音合成

mTTS乃基於語音統計模型重建語音波形之高音質文字轉語音技術,沒有拼接式語音合成系統在語音合成單元間的不連貫現象。整句合成語音具有抑揚頓挫之韻律,極為自然流暢。由於採用參數合成的方法,mTTS可以非常方便地對各項影響合成效果的參數,如音量、音高、語速等眾多參數進行調節,使得語音合成更加容易進行韻律調整之控制。

智慧文本分析

mTTS擁有自然語言理解能力,能自動進行文本分析和韻律描述,並具專利之中文斷詞容錯能力之強健式韻律合成。高準確度的智慧文本分析與預處理,使語音合成即使在一些語言分析處理的困難點,如破音字、特殊符號、日期、時間、電話、金額、項次等等,也能得到高度準確的合成結果。

多音色風格語音的選擇與建構

本合成器可以合成自然而富含韻律節奏的語音,並提供多音色風格的選擇,例如成熟穩重的男聲,及溫柔甜美的女聲。由於語音統計模型只需1至2小時之錄音語料,即可經過自動訓練步驟得到,和以往相比可大幅度縮短構建高品質音庫的時間。因此我們可配合使用者之需要,快速產生出適合的音色,以幫助開發者更快速地回應客戶語音應用的新需求,以及縮短開發應用的過程,此實為本系統之一大特色。

韻律強化及特效合成

更提供韻律強化及特效合成之文字轉語音合成技術,可在原有的聲音下,進行說話韻律調整,可調整出更多不同的聲音。

成果應用

愛盲

完成國內首創整合出版業者並提供合成語音、預錄語音及點字書下載的視障有聲書服務系統,視障者可透過語音互動介面自行操作和下載,已將本系統移轉予愛盲基金會負責經營,目前服務會員共1,076人,各界捐贈版權之書籍1,452本、期刊293本,總下載次數15,285本,善盡關懷弱勢族群的社會責任,消弭數位落差。

金庸機

透過高音質文字轉語音技術之研發,與遠流出版社共同開發Koobe電子書和金庸機,並促成中時網科建置網路電子報之語音導覽及導讀語音合成服務,帶動電子書有聲化之發展。

嵌入式語音互動技術

研發嵌入式語音互動技術,協助義隆電子、智原科技與極鼎技科推出可應用於聲控互動玩具及產品之平台,讓廠商能發展更具便利性的行動裝置互動功能,增加國內廠商的國際競爭力。

數位大師

籌組新一代課堂教學系統研發聯盟,輔導業者立碁知識科技建立獨立品牌「數位大師」,並設立之北中南行銷通路三處,目前使用人數超過10,000人,將可協助傳統補教業者建立數位化虛擬實驗系統,提高教學之互動性與學習之效率。

中文學習通文字MP3

完成高品質中文文字轉語音技術,與蒙恬科技合作開發全方位中文學習軟體「中文學習通」,並與網際智慧合作發展學習輔助工具「文字MP3 V3.0」軟體,本技術將可加強語言學習工具之多元性,提升廠商競爭力。

A+talk

研發語音即時跟讀與評分技術,促使高互動式語言學習系統易於設計與實現,與昱泉國際共同開發A+Talk美國通語言學習軟體,並與旭聯科技合作開發「全國餐旅線上英語檢定系統」,培養國際化餐旅服務專業人員,為國際化人才培育奠定堅實基礎。

互動展示

TTS Demo main website

提供Theresa、Claudia、Bruce、Angela、Katherine、Connie六個語者,可直接在線上合成。提供自然流暢、近似真人發音之語音。

A+talk 展示影片

情境模擬華語會話學習系統展示影片