搜索结果: 1-15 共查到“信息与通信工程 语音识别”相关记录34条 . 查询时间(0.089 秒)
中国科学院自动化研究所噪声环境下语音识别性能研究取得进展(图)
中国科学院自动化研究所 噪声环境 语音识别性能
<
2018/5/8
在互联网和移动互联网时代,以PC和智能手机为载体的图形视觉交互是最主要的人机交互方式,占据了绝大部分用户流量入口。在更多智能设备的物联网时代,除了触屏之外,语音交互被普遍视为最有可能成为下一代信息、内容以及服务的核心入口之一。目前,语音交互赛道已汇集了互联网巨头、知名硬件企业、电商平台、传统家电厂商以及各类人工智能初创公司,特别是近几年以智能音箱为代表的语音交互产品在国内外的火爆,极大地激发了语音...
上海交通大学大数据技术突破传统语音识别
上海交通大学 大数据 语音
<
2015/5/26
近日,以“有反馈的计算机辅助方法在二语习得及语音训练中的应用”为主题的中德双边研讨会在上海举行,来自国内外高校、研究机构及业界的专家学者,共话智能语音技术的新进展及其在计算机辅助口语训练方面的潜在应用。
采用特征分类直方图均衡化的鲁棒性语音识别
语音识别 直方图均衡化 特征分类 鲁棒性
<
2013/8/19
大部分噪声会引起语音倒谱域特征参数的非线性失真,导致识别系统性能下降。直方图均衡化方法是一种非线性补偿变换技术,较传统的基于线性变换技术的抗噪声方法进一步提高了系统的鲁棒性。但实际识别系统中,除了噪声引起语音特征的非线性失真外,还存在训练和测试数据的语音特征类分布不一致问题,从而难以保证传统的直方图均衡化方法发挥其优势。本文提出一种基于特征分类的直方图均衡化方法,首先对初步均衡化后的含噪语音特征矢...
噪声环境下畸变模型线性化处理的顽健语音识别方法
噪声环境 线性畸变模型 语音识别 噪声参数
<
2012/4/19
针对噪声环境下语音识别的顽健性问题,考虑到梅尔倒谱系数(MFCC, Mel-frequency cepstral coefficient)域的畸变模型高度非线性且难以处理,用分段线性插值函数代替对数函数,提出了一种新的线性畸变模型。在此基础上,导出了噪声参数估计和声学模型补偿方法,无需采用矢量泰勒级数(VTS, vector Taylor series)展开作近似处理,有效避免了模型误差的引入,增...
基于最大似然子带线性回归的鲁棒语音识别
语音识别 模型自适应 最大似然子带线性回归 隐马尔可夫模型
<
2013/8/25
在实际环境中,训练环境和测试环境的失配会导致语音识别系统的性能急剧恶化。模型自适应算法是减小环境失配影响的有效方法之一,它通过少量自适应数据将模型参数变换到识别环境。最大似然线性回归是一种常用的基于变换的模型自适应算法,本文针对最大似然线性回归算法在数据较少时模型参数估计不准确的缺点,提出了基于最大似然子带线性回归的模型自适应算法。该算法将Mel滤波器组的全部通道划分为若干个子带,假设每个子带内多...