搜索结果: 1-15 共查到“工学 语音合成”相关记录19条 . 查询时间(0.088 秒)
内蒙古大学计算机学院成功举办NCMMSC2022-MTTSC蒙古语语音合成竞赛(图)
内蒙古大学计算机学院 NCMMSC2022-MTTSC 蒙古语语音合成竞赛 全国人机语音通讯学术会议
<
2023/2/26
在刚刚结束的“Blizzard Challenge 2014”国际语音合成大赛上,中国科学技术大学语音及语言信息处理国家工程实验室报送的参赛系统在25项测试指标中的11项位列第一,取得了所有参赛系统中最好的综合表现。这是继2006-2013年后,科大语音实验室连续第9次在此活动中取得佳绩。这充分体现了实验室在语音合成技术上稳固的领先地位。
中文语音合成系统中的一种两层韵律结构生成体系
语音合成 字音转换 韵律结构生成 条件随机场
<
2010/12/3
韵律结构生成是改进一个语音合成系统中的合成语音的完整度和自然度的重要组成部分. 韵律词和韵律短语的自动切分是中文层级韵律结构的两个重要的基本层面, 本文调研了这个基本问题, 并提出了一种两层韵律结构生成体系. 为此, 我们建立了条件随机场模型为韵律词和韵律短语的预测选取不同的前端特征. 除此之外, 我们还引入了基于转换的错误驱动学习模块来修正后端的初始预测. 实验结果显示, 这种结合条件随机场和错...
可视语音合成中口形特征点定位研究
可视语音 唇部分割 特征点定位 支持向量机
<
2010/3/15
为了有效解决描述嘴唇轮廓的口形特征点定位问题,根据颜色空间中唇部和皮肤颜色的差异提出了一种新的从视频中定位口形特征点的方法。首先将视频文件分解为一帧帧的图片序列,定位并提取出图片中的口形区域,然后利用支持向量机(SVM)将口形区域分为唇部和非唇部区域,最后根据口形图像几何特征的先验知识实现口形特征点的定位。实验结果表明提出的方法具有较高的准确性和鲁棒性。
基于汉语视频三音素的可视语音合成
可视语音合成 视频三音素 隐马尔可夫模型
<
2009/12/29
为了合成具有真实感的视频序列,该文提出一种基于汉语视频三音素的可视语音合成方法。根据汉语的发音规律和音素与视素的对应关系,该文提出“视频三音素”的概念。在此基础上,建立隐马尔可夫(HMM)训练与合成模型,在训练过程中使用了视频音频联合特征,并加入了动态特征。在合成过程中,连接视频三音素HMM模型形成句子HMM,并从中提取特征参数,合成可视语音。从主观和客观评估结果来看,合成视频的真实感强,满意度较...
德语语音合成中的字音转换研究
德语语音合成 字音转换 有限状态转录机
<
2009/12/28
字音转换是德语语音合成系统不得不解决的难题。可以使用基于规则驱动的迭代有限状态转录机来解决这一问题。在该算法中,首先在一个词库的基础上制定一些字音转换规则,然后在此规则的基础上通过迭代有限状态转录机将德语单词中的所有字素转换成音素。经过对整个词库进行算法测试,单词的字音转换正确率可以达到94.4%。
LR3991语音合成芯片的性能研究
语音合成 芯片 开发系统
<
2009/11/11
利用语音合成芯片LR3991各种辅以外围电路设计了一套开发系统。在此系统下,对LR3991睛一些未揭示功能进行了深入研究,得到了几点有实用价值的结果。它对于有效地进行LR3991芯片应用系统的开发具有重要的意义。
汉语连续变调语音合成算法
时域基音同步叠加 文语转换 声调模型
<
2009/7/22
汉语是声调语言,同一个音节带上不同的声调可以表述不同的语义。发音时两个或两个以上的音节连在一起时,音节所属调类调值所发生变化的现象称为“连读变调”,目前的语音合成系统没有考虑连续变调,使得合成语音自然度不够。采用TD-PSOLA对具有连续变调现象的语音进行合成,实验表明合成语音的自然度较高,是适合小语料库语音合成的良好算法。
英语语音合成中基于WordNet的多音词消歧算法
多音词消歧 词义消歧 语音合成
<
2009/7/6
英语中的多音词分成两类,一是因词性不同而读音不同,一是因词义不同而读音不同。前者只需经词性标注,根据其词性标记就可判别其正确的读音。而后者则复杂得多,论文采用了一种基于WordNet语义信息的多音词消歧算法,该算法将多音词的语义信息与上下文中词的语义信息进行匹配,根据匹配结果来判别多音词的读音。
高性能中英文语音合成系统-SinoSonic
中英文语音合成系统 文语转换系统 自动识别
<
2009/2/26
SinoSonic是清华大学计算机科学与技术系和北京炎黄新星科技发展有限公司联合开发的中英文文语转换系统。它是在国家863和国家自然科学基金的长期资助下的结晶,采用了目前世界最先进的数据驱动技术,利用精心设计的语音语料库对TTS系统进行训练,得到的系统体现了自然语言的特性,从而使系统发音自然、亲切,用户乐于接受。系统的构成分为:用户编程接口以及TTS内核两大部分。其中,内核部分又可以按照系统运作的...
嵌入式设备语音合成技术产品
语音合成 嵌入式设备 因特网 微型计算机
<
2009/2/24
产品功能及应用领域:中文语音合成技术应用于嵌入式操作系统,集成TIS技术到DSP芯片中,可使掌上PC、PDA、WAP手机、信息家电发声,增加文本阅读功能;可实现因特网浏览内容的有声输出,随时聆听网络信息。技术特点:中文语音合成技术具有独特的音库压缩和音色转换特点,该技术向嵌入式操作系统移植具备先决条件,在国内外处于领先地位。与国内外同类产品比较:系统输出语音清晰度高;系统输出具有较好的自然度;音库...