InterPhonic(科大訊飛語音合成系統(tǒng))是一款功能十分強大的語音合成電腦軟件,這款軟件提供中英文混合文本連續(xù)語音合成服務(wù),提供調(diào)用語音合成服務(wù)的開發(fā)接口,以及與語音合成相關(guān)的其他特性,采用先進的語音技術(shù),擁有強大的后臺技術(shù)人員支持,用戶在軟件上不僅僅能夠進行簡單的語音合成,還能夠進行文本、語音之間的互譯,清晰的發(fā)音、精確的翻譯。
基本簡介
InterPhonic(科大訊飛語音合成系統(tǒng))以先進的大語料庫和語音韻律描述體系為基礎(chǔ),提供面向任意文本、任意篇章的連續(xù)語音合成功能,合成音質(zhì)可媲美真人發(fā)音,夠提供普通話、廣東話、英語等上十個語種,包含業(yè)界領(lǐng)先的普通話與英語同音混讀、廣東話與英語同音混讀,并已經(jīng)受了行業(yè)用戶大規(guī)模大壓力的應(yīng)用考驗。
軟件特色
1.應(yīng)用于小型、大型以及電信級的聲訊服務(wù)平臺企業(yè)呼叫中心、UMS和Voice Portal等新興語音服務(wù)。
2.該系統(tǒng)具有高質(zhì)量的語音合成效果;
3.全面完善的功能特性;
4.細致周到的優(yōu)化方案。
5.該成果將得到廣泛應(yīng)用。
功能介紹
1. 高質(zhì)量語音——將輸入文本實時轉(zhuǎn)換為流暢、清晰、自然和具有表現(xiàn)力的語音數(shù)據(jù);
2. 多語種服務(wù)——整合了多語種語音合成引擎,可提供中文、中英文混讀、英文、廣東話的語音合成服務(wù);
3. 高精度文本分析技術(shù)——保證了對文本中未登錄詞(如地名)、多音字、特殊符號(如標(biāo)點、數(shù)字)、韻律短語等智能分析和處理;
4. 多字符集支持——支持輸入GB2312、GBK、Big5和UTF-8等多種字符集,普通文本和帶有CSSML標(biāo)注等多種格式的文本信息;
5. 多種數(shù)據(jù)輸出格式——支持輸出多種采用率的線性Wav,A/U率Wav和Vox等格式的語音數(shù)據(jù);
6. 靈活的接口——提供了標(biāo)準(zhǔn)接口、簡單接口、COM接口、SAPI接口,便于在多種環(huán)境下進行系統(tǒng)的集成;
7. 語音調(diào)整功能——開發(fā)接口提供了音量、語速、音高等多種合成參數(shù)的動態(tài)調(diào)整功能;
8. 配置和管理工具——合成引擎提供了統(tǒng)一進行配置和管理的工具,完成了全局參數(shù)配置、用戶詞典、用戶規(guī)則、定制資源包管理等功能;
9. 效果優(yōu)化——合成引擎提供了以定制資源包和CSSML為代表的多種針對實際應(yīng)用環(huán)境進行合成效果優(yōu)化的方法;
10.一致的訪問方式——能以Client/Server方式訪問遠程的語音合成服務(wù),并且提供與本地調(diào)用相同的開發(fā)接口,實現(xiàn)了完全透明的訪問;
11.動態(tài)負(fù)載均衡——提供了動態(tài)負(fù)載均衡模塊,以對用戶透明的方式動態(tài)調(diào)配多臺語音合成服務(wù)器的資源;
12.背景音和預(yù)錄音——合成系統(tǒng)還提供了背景音和預(yù)錄音的功能 ,滿足用戶不同場合的應(yīng)用和個性化需求。
特別說明
提示:該資源為網(wǎng)盤資源,請?zhí)崆鞍惭b好百度網(wǎng)盤。