主页 > 知识库 > 标贝科技语音库|模仿童声、中文女声情感数据库 --分为喜、怒、哀、惊、惧、厌六种情感的表达

标贝科技语音库|模仿童声、中文女声情感数据库 --分为喜、怒、哀、惊、惧、厌六种情感的表达

热门标签:百度竞价排名 AI电销 服务外包 地方门户网站 网站排名优化 铁路电话系统 Linux服务器 呼叫中心市场需求
  语音合成技术的推广应用,对语音合成的质量提出了更高的要求。如何进一步提高语音合成的表现力,特别是让合成语音能够模拟表达说话人的情感状态,是语音合成未来发展的趋势,也是语音合成研究领域所面临的一个难题。而情感语音库是语音合成技术的基础,也是决定语音合成效果的关键因素。
Your browser does not support the audio element.
(点击试听情感效果)
  模仿童声—情感音库
  【模仿童声DB-6-情感音库】采集对象为标准普通话女声模仿儿童,听感活泼甜美。分为喜、怒、哀、惊、惧、厌六种情感的表达。录制环境为专业录音室和录音软件,录音环境和设备自始至终保持不变,录音环境的信噪比不低于35dB;单声道录音,用48KHz16比特采样频率、PCMWAV格式。录音语料为中文,利于各情感的表达,并对音节、音子、韵律等在有限语料基础上做了尽可能全面的覆盖。根据合成语音标注标准,依据发音人实际发音对音库进行文本音字校对、韵律层级标注。
Your browser does not support the audio element.
  (点击试听情感效果)
  数据应用场景
  本语音数据库应用广泛,可用于以下方面:
  1.科研,可用于语音合成系统模型训练;
  2.有声读物;
  3.生活出行;
  3.智能科技;
  4.教育、娱乐等。
  技术参数

数据规格

数据内容

中文女声DB-6情感音库数据

录音语料

6种情感各2000句语料(喜、怒、哀、惊、惧、厌)

有效时长

14成品小时(12000句)

平均字数

15/

语言类型

标准普通话

发音人

女;20-30岁;声音温柔亲切

录音环境

声音采集环境为专业录音棚环境

1)        录音棚符合专业音库录制标准;

2)        录音环境和设备自始至终保持不变;

3)        录音环境的信噪比不低于35dB

录制工具

专业录音设备及录音软件

采样格式

无压缩PCM WAV格式,采样率为48KHz16bit

标注内容

中文音字标注、韵律标注、声韵母边界标注

标注格式

文本标注为.txt格式文档;边界标注为.interval格式文档

质量标准

1. 语音文件为48k 16bit wav格式,音色、音量、语速一致,无截幅;

2.标注文件字准率不低于99.8%

3.韵律无明显不合理标注错误;

4.音素边界错误大于10ms的比例小于1%;音节边界准确率大于98%.

存储方式

本地FTP存储

文件格式

音频文件:WAV 文本标注文件:TXT 边界标注文件:INTERVAL

数据脱敏

数据敏感项

产品应用

适用领域

科研、智能科技、生活、教育、娱乐等多领域应用

版权归属

版权所有者

标贝(北京)科技有限公司

  中文女声—情感音库
  【中文女声DB-6情感音库】采集对象为标准普通话女声,分为喜、怒、哀、惊、惧、厌六种情感的表达。录制环境为专业录音室和录音软件,录音环境和设备自始至终保持不变,录音环境的信噪比不低于35dB;单声道录音,用48KHz16比特采样频率、PCMWAV格式。录音语料为中文,利于各情感的表达,并对音节、音子、韵律等在有限语料基础上做了尽可能全面的覆盖。根据合成语音标注标准,依据发音人实际发音对音库进行文本音字校对、韵律层级标注、声韵母边界标注。
Your browser does not support the audio element.
(点击试听情感效果)
  数据应用场景
  本语音数据库应用广泛,可用于以下方面:
  1.科研,可用于语音合成系统模型训练;
  2.有声读物;
  3.生活出行;
  3.智能科技;
  4.教育、娱乐等。
  技术参数

数据规格

数据内容

模仿童声DB-6情感音库数据

录音语料

6种情感各2000句语料

有效时长

14成品小时(12000句)

平均字数

15/

语言类型

标准普通话

发音人

女声模仿儿童,活泼甜美风格

录音环境

声音采集环境为专业录音棚环境

1)        录音棚符合专业音库录制标准;

2)        录音环境和设备自始至终保持不变;

3)        录音环境的信噪比不低于35dB

录制工具

专业录音设备及录音软件

采样格式

无压缩PCM WAV格式,采样率为48KHz16bit

标注内容

中文音字标注、韵律标注

标注格式

文本标注为.txt格式文档

质量标准

1.语音文件为48k 16bit wav格式,音色、音量、语速一致,无截幅;

2.标注文件字准率不低于99.8%

3.韵律无明显不合理标注错误。

存储方式

本地FTP存储

文件格式

音频文件:WAV 文本标注文件:TXT

数据脱敏

数据敏感项

产品应用

适用领域

科研、智能科技、生活、教育、娱乐等多领域应用

版权归属

版权所有者

标贝(北京)科技有限公司

 

标签:崇左 湖南 衡水 湘潭 仙桃 铜川 黄山 兰州

巨人网络通讯声明:本文标题《标贝科技语音库|模仿童声、中文女声情感数据库 --分为喜、怒、哀、惊、惧、厌六种情感的表达》,本文关键词  ;如发现本文内容存在版权问题,烦请提供相关信息告之我们,我们将及时沟通与处理。本站内容系统采集于网络,涉及言论、版权与本站无关。
  • 相关文章
  • 上一篇:谷歌移动搜索:用户体验度低的站点要惨了?

    下一篇:推荐给程序员的6款bootstrap模板

    收缩
    • 微信客服
    • 微信二维码
    • 电话咨询

    • 400-1100-266