中文童声语音合成数据集

中文童声语音合成数据集发音人为4岁女童（北京人），包含2235句话，时长超2小时。该数据集文本为日常用语。本次开源样例数据集时长为15分钟。该发音人声音第一次用于TTS录制，音频已获得发音人与其监护人授权。中文童声语音合成数据集由北京科技有限公司开发，免费发布供非商业使用。如需更多声音，欢迎致电400-900-5251或邮件发送至 business@magicdatatech.com。

数据集推荐

MDT-AE065 广式粤语对话音频数据集

试听音频

多情感自然风格数据集

晴数智慧全新推出“多情感自然风格数据集”系列产品，包括多种旨在为语音技术领域带来全新的表现力和自然度，为智能设备带来多样化的情感表达。该数据集为语音大模型注入了强劲的情感动力。和记平台通过使用我们的数据集，可以显著提高语音大模型的表现力和情感特点，使其更加贴近人类真实的情感交流，为用户带来更加自然和舒适的交互体验。

试听音频

MDT-AE067 韩语双工自然对话数据集

基于独立音轨采集技术精准分离重叠语音与即兴打断，真实呈现韩语特有的敬语层级、情感性尾音变化和快速话轮转换。数据集包含多说话人角色标注与场景标签，和记平台助力AI掌握韩语文化语境下的复杂对话逻辑与情感分析。

MDT-AF069 英语双工自然对话数据集

当前，国内外科技界迎来了语音对话模型的繁荣时代，它不仅能够识别用户的语音，还能模拟出极为接近真人的语音回应。晴数智慧前瞻地推出了“双工自然对话语音数据集_英语”，不仅在技术层面上实现了突破，在应用层面上也为开发者提供了更大的自由度，此数据集包括5,000小时的多口音英文对话数据，涵盖了多样化的语音场景。同时，我们的双工对话数据和记平台通过对每位说话者语音的独立分析，AI模型能够更好地理解对话中的上下文变化、语调变化和情感变化，从而做出更自然、更准确的回应。

试听音频

MDT-AF010 新加坡英语朗读音频数据集—唤醒词

试听音频

MDT-AE029 菲律宾英语朗读音频数据集—日常用语

试听音频

北京市海淀区北三环中路 44 号（海淀文教产业园） G 座 501

和记平台

中文童声语音合成数据集

没有找到想要的数据？

数据集推荐

MDT-AE065 广式粤语对话音频数据集

多情感自然风格数据集

MDT-AE067 韩语双工自然对话数据集

MDT-AF069 英语双工自然对话数据集

MDT-AF010 新加坡英语朗读音频数据集—唤醒词

MDT-AE029 菲律宾英语朗读音频数据集—日常用语

数据优势有哪些？

合规性

多维度

覆盖性

高精度