搜索结果: 121-135 共查到“信息与通信工程 语音”相关记录319条 . 查询时间(0.039 秒)
本文提出了一种改进的混合蛙跳算法,利用混沌运动的遍历性改善初始个体的质量和引入高斯变异,提高了算法的全局搜索能力,同时将改进算法与人工神经网络结合,并把它应用到语音情感识别系统中。依据情感的维度空间模型,分别提取了情感语音的韵律特征与音质特征,研究了谐波噪声比特征随情感类别的变化特性。利用本文所提的蛙跳算法(SFLA)训练随机产生的初始数据,优化神经网络的连接权值,能快速地实现网络的收敛。在实验中...
盲信号处理算法主要有批处理算法和自适应算法两类,本文导出了一种批处理和自适应相结合的快速独立分量分析(Fast Independent Component Analysis, Fast ICA)算法,将该算法应用于语音信号盲分离处理,通过综合实验,从分离前后的波形、频谱图和主要评价参数说明该算法具有良好的信号分离效果。与扩展联合对角化(The Joint Approximative Diagona...
基于特征空间分解与融合的语音情感识别
语音情感识别 特征优化 判决融合
<
2013/8/23
提出了一种语音情感识别中特征空间的优化方法。针对情感类别两两之间的区分度,优化了情感对各自的特征空间,考察了多类分类器分解为两类分类器的方法,采用置信度判决融合的方法进行两类分类器组的重组,实验中比较了单个多类分类器和两类分类器组的识别性能。结果表明,在同等条件下性能提升了8个百分点以上,对多类分类器进行分解,优化每个情感对各自的特征空间,并进行融合的方法适合语音情感识别,对特征空间的优化效果显著...
基于压缩感知的分布式语音压缩与重构
压缩感知 分布式语音压缩与重构 短时平稳性 稀疏性 基追踪 正交匹配追踪
<
2013/8/23
本文首先阐述了压缩感知(CS)的理论框架,然后分析了语音信号的特点——短时平稳性、离散余弦(DCT)基下的稀疏性,最后提出了基于CS理论的分布式语音压缩重构的框架。基于此框架采用基追踪(BP)和正交匹配追踪(OMP)算法对已压缩的语音信号进行重构,得出结论:每帧语音信号选取的帧长的大小,基于CS理论压缩得到的观测数的多少,都对重构性能有影响。
噪声环境下畸变模型线性化处理的顽健语音识别方法
噪声环境 线性畸变模型 语音识别 噪声参数
<
2012/4/19
针对噪声环境下语音识别的顽健性问题,考虑到梅尔倒谱系数(MFCC, Mel-frequency cepstral coefficient)域的畸变模型高度非线性且难以处理,用分段线性插值函数代替对数函数,提出了一种新的线性畸变模型。在此基础上,导出了噪声参数估计和声学模型补偿方法,无需采用矢量泰勒级数(VTS, vector Taylor series)展开作近似处理,有效避免了模型误差的引入,增...
基于极值域均值模式分解的语音增强方法
语音增强 极值域均值模式分解 经验模态分解 固有模态函数
<
2013/8/16
增强低信噪比(signal to noise ratio, SNR)下的语音质量是语音识别需要解决的问题。在众多增强方法中,经验模态分解(empirical mode decomposition, EMD)是目前应用最为广泛的一种方法。针对EMD在对语音进行增强时存在端点效应的问题,研究了极值域均值模式分解(extremum field mean mode decomposition, EMMD)...
改进的符合EV-VBR标准的嵌入式宽带语音编码器
EV-VBR标准 嵌入式 宽带语音 编码器
<
2012/4/20
基于国际电信联盟标准化组织(ITU-T)嵌入式变比特率(EV-VBR)编码标准提案,在本实验室开发的候选编码器基础上提出了一套改进的嵌入式变速率宽带语音编码方法。 本算法在前2层使用代数码激励线性预测(ACELP)编码,增加计算量化了中间子帧谱参数,设计实现了三脉冲深度优先树搜索算法;在后3个编码层,本算法使用累积频域系数矢量的方式重新构建了嵌入式变换域编码(TCX)。此外,改进编码器还实现了语音...
基于最大似然子带线性回归的鲁棒语音识别
语音识别 模型自适应 最大似然子带线性回归 隐马尔可夫模型
<
2013/8/25
在实际环境中,训练环境和测试环境的失配会导致语音识别系统的性能急剧恶化。模型自适应算法是减小环境失配影响的有效方法之一,它通过少量自适应数据将模型参数变换到识别环境。最大似然线性回归是一种常用的基于变换的模型自适应算法,本文针对最大似然线性回归算法在数据较少时模型参数估计不准确的缺点,提出了基于最大似然子带线性回归的模型自适应算法。该算法将Mel滤波器组的全部通道划分为若干个子带,假设每个子带内多...
基于近似KLT域的语音信号压缩感知
语音合成 压缩感知 稀疏性
<
2009/12/29
压缩感知是近年来兴起的研究热点,该文基于语音信号在KLT域的稀疏特性,提出了基于模板匹配的近似KLT,并在基于模板匹配近似KLT域上研究了语音信号的压缩感知性能。首先验证语音信号在基于模板匹配近似KLT域上的稀疏性,然后由语音信号与观测矩阵构造相应的观测,采取固定分配每帧观测个数和按帧能量自适应分配每帧观测个数两种方案,再以观测为已知条件利用L1优化算法重构语音信号在基于模板匹配近似KLT域的稀疏...
低信噪比下基于功率谱熵的语音端点检测算法
语音信号处理 谱熵 语音端点检测
<
2009/12/10
为了解决短波通信中语音检测的问题,针对短波语音信噪比低,噪声复杂的特点,对幅度谱熵算法进行了修正,选取功率谱熵作为VAD特征,加入谱熵平滑和hangover设计,研究了基于功率谱熵的语音端点检测算法。实验证明,算法对几种典型的短波语音均有比较理想的性能。
多特征相结合的带噪语音端点检测算法的研究
美尔倒谱距离 谱熵 短时过零率
<
2009/12/10
提出了一种抗噪声的端点检测新方法。针对谱熵特征对清音的检测性能以及抗噪声性能较差的缺点,结合对清音检测性能较好的短时过零率特征,以及抗噪声性能良好的美尔倒谱距离特征,实现了基于多种特征相结合的抗噪声的语音端点检测。仿真实验表明,该方法能显著提高端点检测在高噪声环境下的检测性能。
改进的混合MFCC语音识别算法研究
Mel频率倒谱系数(MFCC) 语音识别 特征提取
<
2009/12/10
针对MFCC特征参数在语音识别中对中高频信号的识别精度不高的特点,提出采用IMFCC,MIDMFCC,MFCC相结合的改进算法,使用混合滤波器组,提高在语音中高频区域中的识别精度。实验结果表明,改进之后的算法与经典算法比较,在相同环境下对语音信息的识别率都有一定程度的提高。
基于BARK子波变换的语音增强方法研究
Bark子波 语音增强 阈值
<
2009/12/10
在Bark子波的构造的基础上,提出一种改进的Bark子波变换构造方法,即直接由临界带中心频率确定Bark子波的中心频率,保证了其通带和临界带的对应一致性,并与人耳的听觉系统十分吻合。采用Bark子波对带噪语音进行分解,在语音信号的子带层次上用一种类似于软阈值的无穷阶可导的函数进行阈值处理,并应用谱减法进行二次增强。仿真实验表明,构建Bark子波与增强算法使信噪比和PESQ得分都有较大提高,特别是在...
对含噪语音进行基频检测的方法
基频检测 小波去噪 归一化AMDF
<
2009/12/3
提出一种对含噪语音进行基频检测的新方法。先对含噪语音进行小波去噪,然后再经过预处理后,采用归一化的AMDF算法对语音进行基频提取,后期对基频信号采用搜索试探方法进行平滑处理,通过实验表明,该方法比传统方法有更好的鲁棒性,尤其在低信噪比的情况下。