中国科学院“百人计划”(G13BR01)
- 作品数:2 被引量:5H指数:2
- 相关作者:颜永红吕萍赵庆卫潘复平更多>>
- 相关机构:中国科学院更多>>
- 发文基金:中国科学院“百人计划”国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 广播新闻语料识别中的自动分段和分类算法被引量:3
- 2006年
- 该介绍了中文广播新闻语料识别任务中的自动分段和自动分类算法。提出了3阶段自动分段系统。该方法通过粗分段、精细分段和平滑3个阶段,将音频流分割为易于识别的音频段。在精细分段阶段,文中提出两种算法:动态噪声跟踪分段算法和基于单音素解码的分段算法。仿效说话人鉴别中的方法,文中提出了基于混合高斯模型的分类算法。该算法较好地解决了音频段的多类判决问题。在“新闻联播”测试数据中的实验结果表明,该文提出的自动分段和分类算法性能与手工分段分类性能几乎相当。
- 吕萍颜永红
- 关键词:语音识别
- 使用无监督网络MLLR自适应改进算法的语音识别被引量:2
- 2007年
- 介绍了一种基于词网的最大似然线性回归(Lattice-MLLR)无监督自适应算法,并进行了改进。Lattice-MLLR是根据解码得到的词网估计MLLR变换参数,词网的潜在误识率远小于识别结果,因此可以使参数估计更为准确。Lattice-MLLR的一个很大缺点是计算量极大,较难实用,对此本文提出了两个改进技术:(1)利用后验概率压缩词网;(2)利用单词的时间信息限制状态统计量的计算范围。实验测定Lattice-MLLR的误识率比传统MLLR相对下降了3.5%,改进技术使Lattice-MLLR计算量下降幅度超过了87.9%。
- 潘复平赵庆卫颜永红
- 关键词:语音识别词网后验概率