中国博士后科学基金(2013M531042)
- 作品数:3 被引量:7H指数:2
- 相关作者:何勇军孙广路韩纪庆更多>>
- 相关机构:哈尔滨理工大学哈尔滨工业大学更多>>
- 发文基金:中国博士后科学基金国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:电子电信医药卫生更多>>
- 基于稀疏编码的鲁棒说话人识别被引量:3
- 2014年
- 目前的说话人识别系统在噪声环境下性能将急剧下降,为了解决这一问题,提出了一种新的基于稀疏编码的说话人识别方法。该方法用一个通用背景字典(Universal background dictionary,UBD)刻画说话人语音的共性,并为每个说话人和环境噪声训练相应的字典来刻画说话人和环境的特殊变化。这些字典被拼接成一个大字典,然后将待测试语音稀疏分解在这个大字典上以实现说话人识别。为了提高说话人字典的区分能力,通过从说话人字典中移除与通用背景字典原子相似的原子来优化说话人字典。为了跟踪变化的噪声,采用混噪语音在线更新噪声字典。在各种噪声条件下的实验表明,所提出的方法在噪声环境下具有较强的鲁棒性。
- 何勇军孙广路付茂国韩纪庆
- 关键词:说话人识别
- 语音特征增强方法综述被引量:3
- 2014年
- 经过数十年的发展语音识别取得了长足进步,但各种语音识别系统的性能仍然难以满足现实应用的需求.造成这种情况的一个重要原因在于目前的系统仍然难以适应各种噪声环境.因此,增强语音识别系统的噪声鲁棒性是推动其走向现实应用的关键.系统地阐述了特征增强类方法的国内外研究现状,介绍了信号增强、从听觉层面或可区分层面的提取特征、特征归正和特征补偿等方法,分析了他们存在的局限性.在此基础上,分析了稀疏编码与语音特征增强的基本问题和研究现状,提出了稀疏编码在语音特征增强方面的需要解决的问题,为从事鲁棒语音识别的研究者提供参考.
- 何勇军付茂国孙广路
- 关键词:鲁棒性语音识别
- 数据不充分情况下的说话人识别被引量:1
- 2017年
- 在过去的数十年里,研究者们对说话人识别进行了广泛而深入的研究,提出了许多有效的方法。目前主流的说话人识别方法如高斯混合-通用背景模型(Gaussian mixture model-Universal background model,GMM-UBM)和高斯混合-支持向量机模型(Gaussian mixture model-Support vector machine,GMM-SVM),虽然能取得比较理想的识别效果,但都需要充分的训练和测试数据。而这一要求在现实应用中通常难以满足,导致其识别率急剧降低。针对这一问题,提出了一种基于稀疏编码的说话人识别方法。该方法在训练阶段为每个说话人训练一个语音字典;在识别阶段,将测试语音分别表示在每个字典上然后根据重构误差打分。实验表明,在少量无噪的训练和测试语音数据情况下,所提出的方法取得了比GMM-UBM和GMM-SVM更好的识别效果。
- 盖晁旭梁隆恺何勇军
- 关键词:说话人识别高斯混合支持向量机