搜索结果: 1-13 共查到“知识库 信息与通信工程 说话人识别”相关记录13条 . 查询时间(0.053 秒)
说话人识别中的因子分析以及空间拼接
说话人识别 联合因子分析 本征音因子
<
2009/9/28
联合因子分析可以有效拟合混合高斯模型中的说话人和信道差异, 在说话人识别中得到广泛应用. 一般情况下, 该算法在对说话人和信道两个载荷矩阵进行联合估计时, 说话人残差矩阵无法发挥作用, 信道载荷矩阵的因子数不能提高. 本文提出说话人载荷矩阵、说话人残差载荷矩阵采用串行的训练模式, 在信道载荷矩阵训练中采用矩阵拼接的方法, 能够有效提高识别率; 在NIST SRE 2008年核心测试数据库的五个部分...
基于单字音特征提取的说话人识别方法
说话人识别 特征提取 单字音特征
<
2009/8/19
证实普通话可以分解为辅音音素和单元音音素通过过度音的连接,提出一种单字音特征提取方法。该方法在传统的帧特征提取基础上,对相关帧进行二次处理,得到单字语音中的多个代表帧,将代表帧进行拼接作为单字的特征矢量。这种特征提取方法能更好地表现说话人单字发音中相邻语音帧之间的连续性。仿真实验表明该方法在说话人识别系统的应用中达到较高的识别率,使识别时间进一步缩短。
VoIP压缩码流说话人识别研究
说话人识别 微聚类 压缩参数
<
2009/8/13
研究基于微聚类算法的VoIP压缩码流说话人识别算法。给出直接从G.729, G.723.1(6.3 Kb/s), G.723.1(5.3 Kb/s)压缩语音的码流中提取识别参数,以微聚类算法作为识别结构的说话人识别算法。实验结果表明,对比在压缩码流中使用同样识别参数的GMM模型,微聚类算法在识别正确率和效率上都有很大的提高。
基于类内方差归一化和SVM的说话人识别方法
支持向量机 广义线性序列核 类内方差归一化
<
2009/7/17
支持向量机(SVM)由于其强大的分类能力,引起人们广泛的重视,并且成功地应用于说话人识别。其中基于GLDS核的SVM系统性能比较优异。引入类内方差归一化(WCCN)方法来处理SVM的输入特征向量,并和GLDS核相结合,提出一种基于类内方差归一化和SVM的说话人识别方法。该方法利用WCCN方法对SVM的输入特征向量进行变换,增强特征向量的类间区分能力,再采用GLDS核函数进行SVM的训练,以提高SV...
通过分离语音空间和说话人空间的说话人识别
语音空间 说话人空间 线性判决分析(LDA)
<
2009/7/10
在说话人空间中,存在语音特征随句子和时间差异而变化的问题。这个变化主要是由语音数据中的语音信息和说话人信息的变化引起的。如果把这两种信息彼此分离就能实现鲁棒的说话人识别。在假设大的说话人变量的空间为“语音空间”和小的说话人变量的空间为“说话人空间”的情况下,通过子空间方法分离语音信息和说话人信息,提出了说话人辨认和说话人确认方法。结果显示:通过相对于传统方法的比较试验,能用小量训练数据建立鲁棒说话...
基于分层采样的集成k近邻说话人识别算法
最近邻识别器 集成学习 说话人识别
<
2009/6/25
k近邻学习器将复杂的全局非线性关系映射为大量局部线性关系的组合,具有易解释、易扩展、抗噪能力强等优点,被广泛应用于说话人识别领域并取得了良好的效果。而集成学习算法因其强泛化能力和易于应用的特性得到了许多领域研究者的关注,但是研究表明通过重采样产生训练集差异的集成算法并不能有效地提高k近邻学习器系统的泛化能力。提出了一种新的BagWithProb采样算法产生训练集。实验表明,该算法可以有效地扩展训练...
模糊C-均值(FCM)聚类法与矢量量化法相结合用于说话人识别
矢量量化 说话人识别 语音特征
<
2009/4/24
该文提出了一种将模糊C-均值聚类法与矢量量化法相结合进行说话人识别的方法。该算法将从语音信号中提取的 12阶 LPC(线性预测编码)倒谱系数作为待分类样本的 12个指标,先用矢量量化法求出每个说话人表征特征参数的码书,作为模糊聚类算法的聚类中心,最后将待识别的特征矢量以得到的码书为聚类中心,进行聚类识别。该算法所使用的特征参数较少,计算比较简单,但识别率较矢量量化法高。
电话信道下应用DMFCC进行说话人识别
电话信道 说话人识别 鉴别性Mel频率倒谱系数 (DMFCC) 融合
<
2013/6/28
鉴别性Mel 频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC), 其更加强调语音频谱各个子带携带的鉴别性信息, 采用自适应的非均匀的滤波器组设置。在宽带信号应用中, DMFCC的作用和效果已经被证明; 但在窄带信号应用中, DMFCC还鲜见有成功应用的例子。该文在电话信道下对应用DMFCC进行说话人识别研究, 在美国国家标准技术研究院(NIST) 2006年说话人识别评测Fem...
说话人识别中采用混合免疫算法的VQ码本设计
说话人识别 免疫算法 矢量量化
<
2009/1/6
矢量量化(VQ)方法是文本无关说话人识别中广泛应用的建模方法之一,它的主要问题是码本设计问题。语音特征参数是高维数据,样本分布复杂,因此码本设计的难度也很大,传统的LBG算法只能获得局部最优的码本。提出一种VQ码本设计的新方法,将小生境技术与K-均值算法融入到免疫算法训练过程中,形成混合免疫算法,采用针对高维数据聚类的改进变异算子,降低了随机变异的盲目性,增强群体的全局及局部搜索能力,同时通过接种...
基于小波神经网络的与文本无关说话人识别方法研究
说话人识别 小波神经网络 BP网络 Mel频率倒谱系数
<
2008/6/4
基于神经网络的说话人识别方法可以在一定程度上模仿人脑的功能,是说话人识别中的一种主要技术,但它通常难以确定隐层单元的数目,收敛速度慢,易于收敛到极小点。该文研究了一种用于说话人识别的小波神经网络模型,给出了网络结构和学习算法。采用Mel频率倒谱系数作为与文本无关的说话人识别的特征参数,并利用该模型进行了5个人的说话人识别实验,得到99.5%的识别率。实验结果表明,小波网络和传统的BP网络相比,训练...
基于语音谐波结构的鲁棒特征参数及其在说话人识别中的应用
说话人识别 短时谱 谐波特征 基音频率
<
2008/5/14
通过对纯净语音及含噪语音短时谱的分析比较,提出了一种基于基音频率及其谐波结构的新的语音特征参数。实验表明,与传统的倒谱特征相比,新特征对加性白噪声相对较不敏感,在闭集文本无关说话人识别中,新特征可以在加性白高斯噪声环境下提高系统的说话人识别率。