工学 >>> 信息与通信工程 >>> 信息处理技术 通信技术 广播与电视工程技术 雷达工程
搜索结果: 1-15 共查到信息与通信工程 说话人识别相关记录17条 . 查询时间(0.063 秒)
语音是一种复杂的非线性信号,这使得基于线性系统理论发展起来的传统说话人识别技术性能难以进一步提高。本文提出了多分形谱簇分析方法,用于分析语音信号的非线性特征,并应用于短语音(2秒)说话人识别。通过对Cantor集的仿真实验,发现不同标度区能反映出系统不同阶段的生长规律,因此可用一组连续变化的多分形谱分层次地表征系统的分形特性,即多分形谱簇分析方法。然后结合语信号的分形特点,提出一种语音的多分形谱簇...
基于语音信号在离散余弦基下的近似稀疏性,本文对语音信号采用压缩感知(Compressed Sensing)技术进行压缩和重构,即将语音信号投影到随机高斯观测矩阵,并采用线性规划(Linear Program)方法进行重构,研究了重构误差与观测矢量点数的关系,分析了噪声环境下重构信号的频谱变化情况。针对噪声环境下压缩感知重构信号比原始信号频谱变化小的特性,提出了一种基于压缩感知重构信号的说话人识别系...
缺失数据理论的置信度分析用于说话人识别时,使用的是滤波器组语音特征,虽然系统的鲁棒性可以提高,但整体的误识率依然很高。为了进一步降低系统的误识率,本文在滤波器组语音特征分量置信度的基础上,提出了一种用于计算倒谱域特征MFCC各维分量置信度的方法CBTM,该方法通过一个置信度变换矩阵,估算出经过Mel谱减法处理后的MFCC各维分量的置信度,在此基础上通过对GMM模型的方差加权来减少置信度小的特征分量...
联合因子分析可以有效拟合混合高斯模型中的说话人和信道差异, 在说话人识别中得到广泛应用. 一般情况下, 该算法在对说话人和信道两个载荷矩阵进行联合估计时, 说话人残差矩阵无法发挥作用, 信道载荷矩阵的因子数不能提高. 本文提出说话人载荷矩阵、说话人残差载荷矩阵采用串行的训练模式, 在信道载荷矩阵训练中采用矩阵拼接的方法, 能够有效提高识别率; 在NIST SRE 2008年核心测试数据库的五个部分...
证实普通话可以分解为辅音音素和单元音音素通过过度音的连接,提出一种单字音特征提取方法。该方法在传统的帧特征提取基础上,对相关帧进行二次处理,得到单字语音中的多个代表帧,将代表帧进行拼接作为单字的特征矢量。这种特征提取方法能更好地表现说话人单字发音中相邻语音帧之间的连续性。仿真实验表明该方法在说话人识别系统的应用中达到较高的识别率,使识别时间进一步缩短。
研究基于微聚类算法的VoIP压缩码流说话人识别算法。给出直接从G.729, G.723.1(6.3 Kb/s), G.723.1(5.3 Kb/s)压缩语音的码流中提取识别参数,以微聚类算法作为识别结构的说话人识别算法。实验结果表明,对比在压缩码流中使用同样识别参数的GMM模型,微聚类算法在识别正确率和效率上都有很大的提高。
MFCC中的基音频率信息对说话人识别系统性能的影响。
支持向量机(SVM)由于其强大的分类能力,引起人们广泛的重视,并且成功地应用于说话人识别。其中基于GLDS核的SVM系统性能比较优异。引入类内方差归一化(WCCN)方法来处理SVM的输入特征向量,并和GLDS核相结合,提出一种基于类内方差归一化和SVM的说话人识别方法。该方法利用WCCN方法对SVM的输入特征向量进行变换,增强特征向量的类间区分能力,再采用GLDS核函数进行SVM的训练,以提高SV...
说话人空间中,存在语音特征随句子和时间差异而变化的问题。这个变化主要是由语音数据中的语音信息和说话人信息的变化引起的。如果把这两种信息彼此分离就能实现鲁棒的说话人识别。在假设大的说话人变量的空间为“语音空间”和小的说话人变量的空间为“说话人空间”的情况下,通过子空间方法分离语音信息和说话人信息,提出了说话人辨认和说话人确认方法。结果显示:通过相对于传统方法的比较试验,能用小量训练数据建立鲁棒说话...
k近邻学习器将复杂的全局非线性关系映射为大量局部线性关系的组合,具有易解释、易扩展、抗噪能力强等优点,被广泛应用于说话人识别领域并取得了良好的效果。而集成学习算法因其强泛化能力和易于应用的特性得到了许多领域研究者的关注,但是研究表明通过重采样产生训练集差异的集成算法并不能有效地提高k近邻学习器系统的泛化能力。提出了一种新的BagWithProb采样算法产生训练集。实验表明,该算法可以有效地扩展训练...
该文提出了一种将模糊C-均值聚类法与矢量量化法相结合进行说话人识别的方法。该算法将从语音信号中提取的 12阶 LPC(线性预测编码)倒谱系数作为待分类样本的 12个指标,先用矢量量化法求出每个说话人表征特征参数的码书,作为模糊聚类算法的聚类中心,最后将待识别的特征矢量以得到的码书为聚类中心,进行聚类识别。该算法所使用的特征参数较少,计算比较简单,但识别率较矢量量化法高。
鉴别性Mel 频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC), 其更加强调语音频谱各个子带携带的鉴别性信息, 采用自适应的非均匀的滤波器组设置。在宽带信号应用中, DMFCC的作用和效果已经被证明; 但在窄带信号应用中, DMFCC还鲜见有成功应用的例子。该文在电话信道下对应用DMFCC进行说话人识别研究, 在美国国家标准技术研究院(NIST) 2006年说话人识别评测Fem...
矢量量化(VQ)方法是文本无关说话人识别中广泛应用的建模方法之一,它的主要问题是码本设计问题。语音特征参数是高维数据,样本分布复杂,因此码本设计的难度也很大,传统的LBG算法只能获得局部最优的码本。提出一种VQ码本设计的新方法,将小生境技术与K-均值算法融入到免疫算法训练过程中,形成混合免疫算法,采用针对高维数据聚类的改进变异算子,降低了随机变异的盲目性,增强群体的全局及局部搜索能力,同时通过接种...
基于神经网络的说话人识别方法可以在一定程度上模仿人脑的功能,是说话人识别中的一种主要技术,但它通常难以确定隐层单元的数目,收敛速度慢,易于收敛到极小点。该文研究了一种用于说话人识别的小波神经网络模型,给出了网络结构和学习算法。采用Mel频率倒谱系数作为与文本无关的说话人识别的特征参数,并利用该模型进行了5个人的说话人识别实验,得到99.5%的识别率。实验结果表明,小波网络和传统的BP网络相比,训练...

中国研究生教育排行榜-

正在加载...

中国学术期刊排行榜-

正在加载...

世界大学科研机构排行榜-

正在加载...

中国大学排行榜-

正在加载...

人 物-

正在加载...

课 件-

正在加载...

视听资料-

正在加载...

研招资料 -

正在加载...

知识要闻-

正在加载...

国际动态-

正在加载...

会议中心-

正在加载...

学术指南-

正在加载...

学术站点-

正在加载...