中文名: 中科大讯飞Interphonic 5.0语音合成系统
英文名: Interphonic 5.0
版本: 5.0
制作发行: 中科大讯飞
语言: 简体中文
分享地址:苦瓜甘甜博客www.kuguagantian.com
系统简介
InterPhonic系列语音合成系统是科大讯飞公司推出的中英文混读语音合成系统,主要功能就是提供中英文混合文本连续语音合成服务,提供调用语音合成服务的开发接口,以及与语音合成相关的其他特性。
技术特点
·独创的智能化文本预处理技术
·独创的语料信息统计模型;
·前后端一致性的语料库设计方法、和语料库的自动构建方法;
·听感量化思想指导下,以变长韵律模板为基础的高精度韵律模型;
·高鲁棒性的智能化文本分析处理技术;
·基于听感损失最小的语料库裁减技术 ;
·特定语种知识和系统建模方法分离的多语种语音合成系统框架;
·面向特定领域应用的定制语音合成技术。
功能特性
1. 高质量语音——将输入文本实时转换为流畅、清晰、自然和具有表现力的语音数据;
2. 多语种服务——整合了多语种语音合成引擎,可提供中文、中英文混读、英文、广东话的语音合成服务;
3. 高精度文本分析技术——保证了对文本中未登录词(如地名)、多音字、特殊符号(如标点、数字)、韵律短语等智能分析和处理;
4. 多字符集支持——支持输入GB2312、GBK、Big5、Unicode和UTF-8等多种字符集,普通文本和带有CSSML标注等多种格式的文本信息;
5. 多种数据输出格式——支持输出多种采用率的线性Wav,A/U率Wav和Vox等格式的语音数据;
6. 灵活的接口——提供了标准接口、简单接口、COM接口、SAPI接口,便于在多种环境下进行系统的集成;
7. 语音调整功能——开发接口提供了音量、语速、音高等多种合成参数的动态调整功能;
8. 配置和管理工具——合成引擎提供了统一进行配置和管理的工具,完成了全局参数配置、用户词典、用户规则、定制资源包管理等功能;
9. 效果优化——合成引擎提供了以定制资源包和CSSML为代表的多种针对实际应用环境进行合成效果优化的方法;
10.一致的访问方式——能以Client/Server方式访问远程的语音合成服务,并且提供与本地调用相同的开发接口,实现了完全透明的访问;
11.动态负载均衡——提供了动态负载均衡模块,以对用户透明的方式动态调配多台语音合成服务器的资源;
12.背景音和预录音——合成系统还提供了背景音和预录音的功能 ,满足用户不同场合的应用和个性化需求。
真人语音库索引
音库编号 发音人 发音风格 支持语种 支持采样率
1 小静 中年女声,音质平和,风格轻柔沉稳 中文及中英混读 6K/8k/11k/16k
2 小燕 青年女声,音质清脆,风格轻松活泼 中文及中英混读 6K/8k/11k/16k
3 小美 青年女声,音质清脆,风格亲切宜人 粤语及粤英混读 6K/8k/11k/16k
4 小宇 中年男声,音质淳厚,风格沉稳柔和 中英混读及纯英文 6K/8k/11k/16k
5 Sherri 青年女声,音质平和,风格轻柔平稳 英文 6K/8k/11k/16k
6 小倩 青年女声,音质甜美,风格轻快活泼 中文及中英混读 6K/8k/11k/16k
7 小琳 青年女声,音质清脆,风格亲切宜人 台湾国语及中英混读 6K/8k/11k/16k
这个软件应该算是高科技了,把文本变成语音,合成音质可媲美真人朗读,基本达到了播音员的效果。语音软件有很多种,那些轻量级的、体积小的语音软件一般都是电脑合成语音或联网读取语音库,但本软件自带多种16K高音质语音库,所以体积有7G之大。本版采用程序虚拟化技术封装成绿色便携版,无须绿化安装,可在移动硬盘、U盘内直接运行。已整合破解程序,集成安装了小燕、小美、小宇、Sherri、小倩、小琳真人语音库,小静语音库网上未见到,故未集成。一般常用小燕、小宇语音库,也是音质、音效最好的两个语音库。本版完美解决了WIN7、WIN8、32位、64位系统下原程序很难正常运行的问题。但CSSML编辑器在WIN7以上系统,音频设备无法打开(XP下正常)的问题,暂无法解决。中科大讯飞语音合成系统原版安装破解步骤繁琐,网上居然还有专门的安装教程,这个软件以前有云龙绿化版,但对WIN7系统支持不太好,语音库也很少。制作本绿色便携版的目的就是想化繁为简,并延续这个软件的生命,在新系统上能正常运行。
本版特点
By @liziwen
原绿色便携版已经发布有七年了,在win10下无法正常运行,本次重新制作,完美支持win10。
评论前必须登录!
注册