工学 >>> 力学 农业工程 林业工程 工程与技术科学基础学科 测绘科学技术 材料科学 矿山工程技术 石油与天然气工程 冶金工程技术 机械工程 光学工程 仪器科学与技术 动力与电气工程 能源科学技术 核科学技术 电子科学与技术 信息与通信工程 控制科学与技术 计算机科学技术 化学工程 纺织科学技术 印刷工业 服装工业、制鞋工业 轻工技术与工程 食品科学技术 土木建筑工程 水利工程 交通运输工程 船舶与海洋工程 航空、航天科学技术 兵器科学与技术 环境科学技术 安全科学技术 工业设计
搜索结果: 1-15 共查到工学 语音合成相关记录19条 . 查询时间(0.088 秒)
近日,由内蒙古大学计算机学院主办的"2022年全国人机语音通讯学术会议-面向蒙古语的低资源语音合成竞赛"(简称NCMMSC2022-MTTSC)成功举办。本次竞赛共吸引了来自中科院声学所、中国科学技术大学、天津大学、西北工业大学、微软(中国)有限公司、OPPO、上海维音信息技术股份有限公司、中移在线服务有限公司和浙江核新同花顺网络信息股份有限公司等学术界和工业界的众多单位报名参与。
近日,我校蒙古文智能信息处理技术国家地方联合工程研究中心(蒙古文信息处理技术自治区重点实验室)与香港中文大学李海洲教授团队合作在国际信号处理领域TOP期刊《IEEE/ACM Transactions on Audio, Speech, and Language Processing》上发表了题为“Decoding Knowledge Transfer for Neural Text-to-Spee...
在刚刚结束的“Blizzard Challenge 2014”国际语音合成大赛上,中国科学技术大学语音及语言信息处理国家工程实验室报送的参赛系统在25项测试指标中的11项位列第一,取得了所有参赛系统中最好的综合表现。这是继2006-2013年后,科大语音实验室连续第9次在此活动中取得佳绩。这充分体现了实验室在语音合成技术上稳固的领先地位。
韵律结构生成是改进一个语音合成系统中的合成语音的完整度和自然度的重要组成部分. 韵律词和韵律短语的自动切分是中文层级韵律结构的两个重要的基本层面, 本文调研了这个基本问题, 并提出了一种两层韵律结构生成体系. 为此, 我们建立了条件随机场模型为韵律词和韵律短语的预测选取不同的前端特征. 除此之外, 我们还引入了基于转换的错误驱动学习模块来修正后端的初始预测. 实验结果显示, 这种结合条件随机场和错...
为了有效解决描述嘴唇轮廓的口形特征点定位问题,根据颜色空间中唇部和皮肤颜色的差异提出了一种新的从视频中定位口形特征点的方法。首先将视频文件分解为一帧帧的图片序列,定位并提取出图片中的口形区域,然后利用支持向量机(SVM)将口形区域分为唇部和非唇部区域,最后根据口形图像几何特征的先验知识实现口形特征点的定位。实验结果表明提出的方法具有较高的准确性和鲁棒性。
为了合成具有真实感的视频序列,该文提出一种基于汉语视频三音素的可视语音合成方法。根据汉语的发音规律和音素与视素的对应关系,该文提出“视频三音素”的概念。在此基础上,建立隐马尔可夫(HMM)训练与合成模型,在训练过程中使用了视频音频联合特征,并加入了动态特征。在合成过程中,连接视频三音素HMM模型形成句子HMM,并从中提取特征参数,合成可视语音。从主观和客观评估结果来看,合成视频的真实感强,满意度较...
字音转换是德语语音合成系统不得不解决的难题。可以使用基于规则驱动的迭代有限状态转录机来解决这一问题。在该算法中,首先在一个词库的基础上制定一些字音转换规则,然后在此规则的基础上通过迭代有限状态转录机将德语单词中的所有字素转换成音素。经过对整个词库进行算法测试,单词的字音转换正确率可以达到94.4%。
利用语音合成芯片LR3991各种辅以外围电路设计了一套开发系统。在此系统下,对LR3991睛一些未揭示功能进行了深入研究,得到了几点有实用价值的结果。它对于有效地进行LR3991芯片应用系统的开发具有重要的意义。
汉语是声调语言,同一个音节带上不同的声调可以表述不同的语义。发音时两个或两个以上的音节连在一起时,音节所属调类调值所发生变化的现象称为“连读变调”,目前的语音合成系统没有考虑连续变调,使得合成语音自然度不够。采用TD-PSOLA对具有连续变调现象的语音进行合成,实验表明合成语音的自然度较高,是适合小语料库语音合成的良好算法。
英语中的多音词分成两类,一是因词性不同而读音不同,一是因词义不同而读音不同。前者只需经词性标注,根据其词性标记就可判别其正确的读音。而后者则复杂得多,论文采用了一种基于WordNet语义信息的多音词消歧算法,该算法将多音词的语义信息与上下文中词的语义信息进行匹配,根据匹配结果来判别多音词的读音。
SinoSonic是清华大学计算机科学与技术系和北京炎黄新星科技发展有限公司联合开发的中英文文语转换系统。它是在国家863和国家自然科学基金的长期资助下的结晶,采用了目前世界最先进的数据驱动技术,利用精心设计的语音语料库对TTS系统进行训练,得到的系统体现了自然语言的特性,从而使系统发音自然、亲切,用户乐于接受。系统的构成分为:用户编程接口以及TTS内核两大部分。其中,内核部分又可以按照系统运作的...
产品功能及应用领域:中文语音合成技术应用于嵌入式操作系统,集成TIS技术到DSP芯片中,可使掌上PC、PDA、WAP手机、信息家电发声,增加文本阅读功能;可实现因特网浏览内容的有声输出,随时聆听网络信息。技术特点:中文语音合成技术具有独特的音库压缩和音色转换特点,该技术向嵌入式操作系统移植具备先决条件,在国内外处于领先地位。与国内外同类产品比较:系统输出语音清晰度高;系统输出具有较好的自然度;音库...
语音合成系统     语音  合成系统       < 2008/12/16
语音合成又称“文语转换”或TTS(Text To Speech),能让计算机把文字“朗读”出来。语音合成技术追求的目标是计算机输出的合成语音正确、清晰、可懂、自然、具有丰富的表现力。在国家863计划支持下,北京语言大学语言信息处理研究所最近研制成功了汉语普通话语音合成系统。由于采取基于语音语料合成方法,采用了独创的自然语言韵律分析技术和合成单元选择技术,相比市场上其他语音合成产品,该系统合成效果在...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...