黑龙江省博士后基金(LBH-Z13099)
- 作品数:2 被引量:4H指数:1
- 相关作者:何勇军孙广路韩纪庆更多>>
- 相关机构:哈尔滨理工大学哈尔滨工业大学更多>>
- 发文基金:中国博士后科学基金黑龙江省博士后基金国家教育部博士点基金更多>>
- 相关领域:医药卫生电子电信更多>>
- 数据不充分情况下的说话人识别被引量:1
- 2017年
- 在过去的数十年里,研究者们对说话人识别进行了广泛而深入的研究,提出了许多有效的方法。目前主流的说话人识别方法如高斯混合-通用背景模型(Gaussian mixture model-Universal background model,GMM-UBM)和高斯混合-支持向量机模型(Gaussian mixture model-Support vector machine,GMM-SVM),虽然能取得比较理想的识别效果,但都需要充分的训练和测试数据。而这一要求在现实应用中通常难以满足,导致其识别率急剧降低。针对这一问题,提出了一种基于稀疏编码的说话人识别方法。该方法在训练阶段为每个说话人训练一个语音字典;在识别阶段,将测试语音分别表示在每个字典上然后根据重构误差打分。实验表明,在少量无噪的训练和测试语音数据情况下,所提出的方法取得了比GMM-UBM和GMM-SVM更好的识别效果。
- 盖晁旭梁隆恺何勇军
- 关键词:说话人识别高斯混合支持向量机
- 基于稀疏编码的鲁棒说话人识别被引量:3
- 2014年
- 目前的说话人识别系统在噪声环境下性能将急剧下降,为了解决这一问题,提出了一种新的基于稀疏编码的说话人识别方法。该方法用一个通用背景字典(Universal background dictionary,UBD)刻画说话人语音的共性,并为每个说话人和环境噪声训练相应的字典来刻画说话人和环境的特殊变化。这些字典被拼接成一个大字典,然后将待测试语音稀疏分解在这个大字典上以实现说话人识别。为了提高说话人字典的区分能力,通过从说话人字典中移除与通用背景字典原子相似的原子来优化说话人字典。为了跟踪变化的噪声,采用混噪语音在线更新噪声字典。在各种噪声条件下的实验表明,所提出的方法在噪声环境下具有较强的鲁棒性。
- 何勇军孙广路付茂国韩纪庆
- 关键词:说话人识别