工学 >>> 信息与通信工程 >>> 信息处理技术 通信技术 广播与电视工程技术 雷达工程
搜索结果: 121-135 共查到信息与通信工程 语音相关记录319条 . 查询时间(0.039 秒)
本文提出了一种改进的混合蛙跳算法,利用混沌运动的遍历性改善初始个体的质量和引入高斯变异,提高了算法的全局搜索能力,同时将改进算法与人工神经网络结合,并把它应用到语音情感识别系统中。依据情感的维度空间模型,分别提取了情感语音的韵律特征与音质特征,研究了谐波噪声比特征随情感类别的变化特性。利用本文所提的蛙跳算法(SFLA)训练随机产生的初始数据,优化神经网络的连接权值,能快速地实现网络的收敛。在实验中...
盲信号处理算法主要有批处理算法和自适应算法两类,本文导出了一种批处理和自适应相结合的快速独立分量分析(Fast Independent Component Analysis, Fast ICA)算法,将该算法应用于语音信号盲分离处理,通过综合实验,从分离前后的波形、频谱图和主要评价参数说明该算法具有良好的信号分离效果。与扩展联合对角化(The Joint Approximative Diagona...
提出了一种语音情感识别中特征空间的优化方法。针对情感类别两两之间的区分度,优化了情感对各自的特征空间,考察了多类分类器分解为两类分类器的方法,采用置信度判决融合的方法进行两类分类器组的重组,实验中比较了单个多类分类器和两类分类器组的识别性能。结果表明,在同等条件下性能提升了8个百分点以上,对多类分类器进行分解,优化每个情感对各自的特征空间,并进行融合的方法适合语音情感识别,对特征空间的优化效果显著...
本文首先阐述了压缩感知(CS)的理论框架,然后分析了语音信号的特点——短时平稳性、离散余弦(DCT)基下的稀疏性,最后提出了基于CS理论的分布式语音压缩重构的框架。基于此框架采用基追踪(BP)和正交匹配追踪(OMP)算法对已压缩的语音信号进行重构,得出结论:每帧语音信号选取的帧长的大小,基于CS理论压缩得到的观测数的多少,都对重构性能有影响。
针对噪声环境下语音识别的顽健性问题,考虑到梅尔倒谱系数(MFCC, Mel-frequency cepstral coefficient)域的畸变模型高度非线性且难以处理,用分段线性插值函数代替对数函数,提出了一种新的线性畸变模型。在此基础上,导出了噪声参数估计和声学模型补偿方法,无需采用矢量泰勒级数(VTS, vector Taylor series)展开作近似处理,有效避免了模型误差的引入,增...
增强低信噪比(signal to noise ratio, SNR)下的语音质量是语音识别需要解决的问题。在众多增强方法中,经验模态分解(empirical mode decomposition, EMD)是目前应用最为广泛的一种方法。针对EMD在对语音进行增强时存在端点效应的问题,研究了极值域均值模式分解(extremum field mean mode decomposition, EMMD)...
基于国际电信联盟标准化组织(ITU-T)嵌入式变比特率(EV-VBR)编码标准提案,在本实验室开发的候选编码器基础上提出了一套改进的嵌入式变速率宽带语音编码方法。 本算法在前2层使用代数码激励线性预测(ACELP)编码,增加计算量化了中间子帧谱参数,设计实现了三脉冲深度优先树搜索算法;在后3个编码层,本算法使用累积频域系数矢量的方式重新构建了嵌入式变换域编码(TCX)。此外,改进编码器还实现了语音...
在实际环境中,训练环境和测试环境的失配会导致语音识别系统的性能急剧恶化。模型自适应算法是减小环境失配影响的有效方法之一,它通过少量自适应数据将模型参数变换到识别环境。最大似然线性回归是一种常用的基于变换的模型自适应算法,本文针对最大似然线性回归算法在数据较少时模型参数估计不准确的缺点,提出了基于最大似然子带线性回归的模型自适应算法。该算法将Mel滤波器组的全部通道划分为若干个子带,假设每个子带内多...
压缩感知是近年来兴起的研究热点,该文基于语音信号在KLT域的稀疏特性,提出了基于模板匹配的近似KLT,并在基于模板匹配近似KLT域上研究了语音信号的压缩感知性能。首先验证语音信号在基于模板匹配近似KLT域上的稀疏性,然后由语音信号与观测矩阵构造相应的观测,采取固定分配每帧观测个数和按帧能量自适应分配每帧观测个数两种方案,再以观测为已知条件利用L1优化算法重构语音信号在基于模板匹配近似KLT域的稀疏...
为了解决短波通信中语音检测的问题,针对短波语音信噪比低,噪声复杂的特点,对幅度谱熵算法进行了修正,选取功率谱熵作为VAD特征,加入谱熵平滑和hangover设计,研究了基于功率谱熵的语音端点检测算法。实验证明,算法对几种典型的短波语音均有比较理想的性能。
提出了一种抗噪声的端点检测新方法。针对谱熵特征对清音的检测性能以及抗噪声性能较差的缺点,结合对清音检测性能较好的短时过零率特征,以及抗噪声性能良好的美尔倒谱距离特征,实现了基于多种特征相结合的抗噪声的语音端点检测。仿真实验表明,该方法能显著提高端点检测在高噪声环境下的检测性能。
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。
在Bark子波的构造的基础上,提出一种改进的Bark子波变换构造方法,即直接由临界带中心频率确定Bark子波的中心频率,保证了其通带和临界带的对应一致性,并与人耳的听觉系统十分吻合。采用Bark子波对带噪语音进行分解,在语音信号的子带层次上用一种类似于软阈值的无穷阶可导的函数进行阈值处理,并应用谱减法进行二次增强。仿真实验表明,构建Bark子波与增强算法使信噪比和PESQ得分都有较大提高,特别是在...
提出一种对含噪语音进行基频检测的新方法。先对含噪语音进行小波去噪,然后再经过预处理后,采用归一化的AMDF算法对语音进行基频提取,后期对基频信号采用搜索试探方法进行平滑处理,通过实验表明,该方法比传统方法有更好的鲁棒性,尤其在低信噪比的情况下。
提出了一种基于二次离散小波变换(DWT)的语音增强算法。该算法首先对带噪语音信号进行离散小波变换,提取离散细节信号,并对其进行第二次离散小波变换。再按照不同的规则选取阈值,对信号进行去噪处理。最后再对出来后的语音信号进行合并。对比实验结果表明,该方法具有良好的消除噪声的效果,提高了语音的清晰度和可懂度。

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...