周峰
- 作品数:2 被引量:1H指数:1
- 供职机构:苏州大学电子信息学院更多>>
- 发文基金:江苏省自然科学基金国家自然科学基金更多>>
- 相关领域:电子电信更多>>
- 群延时谱参数在汉语数字语音识别中的应用被引量:1
- 2017年
- 汉语数字语音之间的高混淆性直接影响了汉语数字语音识别的效果,传统的语音识别方法很难对易混淆的语音做出有效的区分。本文提出了一种多参数、多级识别策略,先采用MEL谱参数基于HMM进行初级数字语音识别,然后对易混淆的数字对采用一种新的群延时谱参数——RRCGD-CC(Reflected Roots Chirp Group Delay-Cepstral Coefficients)基于SVM进行二次分类。实验结果表明,通过多参数多级识别方法,数字"2"和"8"的识别率提高了8%,数字识别系统的整体识别率提高了2.3%。这一结果充分说明了本文提出的多参数多级识别方法有利于提高汉语数字语音识别系统的识别性能,同时也说明了RRCGD-CC在易混淆数字语音的识别上是有效的。
- 周峰俞一彪
- 关键词:群延时
- 基于双线性频谱弯折的PSTN语音说话人身份保密通信
- 2017年
- 在日常生活中,语音是人们辨别或了解一个人的重要手段。一个人的声音中除了其字面的语义之外,还包括了说话人身份信息等其他特征,例如听者可以感受到说话者的大致年龄及其感情色彩。对于一些重要的人物,其语音特征往往是其身份的重要标志,保护这种特征也是必不可少的。文章提出一种PSTN语音通信说话人身份加密技术,利用频谱的双线性弯折变换改变语音频谱,实现说话人年龄特征的改变,达到身份保密的目的。
- 张尧周峰
- 关键词:语音通信PSTN