刘庆峰 作品数:24 被引量:47 H指数:4 供职机构: 中国科学技术大学 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 安徽省科技攻关计划 更多>> 相关领域: 电子电信 自动化与计算机技术 理学 经济管理 更多>>
汉语语音合成理论研究及系统实现 该文在语音合成的基础技术研究和实用系统开发方面均进行了深入研究.针对传统的驻汉语文语转换系统存在的主要问题,该文从语音合成器设计、韵律规则总结和语音基元库设计等几个方面入手,在大量分析实验的基础上,提出了一系列理论和技术... 刘庆峰关键词:语音合成 汉语文语转换系统 自由表述口语语音评测后验概率估计改进方法 被引量:5 2017年 该文研究了两种用于改善深度神经网络声学建模框架下自由表述口语语音评测任务后验概率估计的方法:1)使用RNN语言模型对一遍解码N-best候选做语言模型得分重估计来获得更准确的识别结果以重新估计后验概率;2)借鉴多语种神经网络训练框架,提出将方言数据聚类状态加入解码神经网络输出节点,在后验概率估计中引入方言似然度得分以评估方言程度的新方法。实验表明,这两种方法估计出的后验概率与人工分相关度分别绝对提升了3.5%和1.0%,两种方法融合后相关度绝对提升4.9%;对于一个真实的评测任务,结合该文改进的后验概率评分特征,总体评分相关度绝对提升2.2%。 许苏魁 戴礼荣 魏思 刘庆峰 高前勇关键词:后验概率 XF32XXXF32XX系列语音合成模块 刘庆峰 尹波 黄海兵 谢信珍 李庆东 陈家志 刘强 徐承 该产品是基于KB1.0嵌入式语音合成系统,面向中高端嵌入式应用的板级语音合成产品,产品具有优质的合成效果,是可定制的语音合成系统,基本可以满足在嵌入式硬件领域的应用。其可以给电子仪表加上语音报读功能,增强仪器的智能化,在...关键词: CDMD-S/J系列车载数码听 刘庆峰 尹波 黄海兵 谢信珍 李庆东 陈家志 李劲松 刘强 该系列产品为车载电子设备,是利用语音合成技术和MP3解码技术实现的具备通用优盘的存储功能的硬件终端产品。该产品可以将车载数码听存储的各种文字内容信息转换成语音信号,通过汽车音响系统播放。结构上采用了可插拔或立体声无线(F...关键词:关键词:车载 数码听 基于音素相关后验概率变换的发音质量评价 被引量:3 2011年 帧规整对数后验概率是目前公认最有效的发音质量的度量。但该文证明了该度量还反映了当前发音对应的声学模型与概率空间中声学模型的混淆程度,使其在评分任务上存在着严重的缺陷。因此,该文提出了可训练的音素相关的后验概率变换;并研究了线性和非线性sigmoid变换,同时给出线性变换的显式全局最优解和非线性变换的梯度下降解法。在全国采集的普通话水平测试现场考试的篇章朗读题型上进行实验。实验结果表明:当概率空间包含所有音素时,该方法能使人机相关度从0.582提升至0.768;当采用优化的概率空间时,该方法能使人机相关度从0.696提升至0.773。 严可 魏思 戴礼荣 刘庆峰关键词:计算机辅助语言教学 基于听感量化的语音合成研究 该文通过'听感量化'思想的提出以及在此思想下对语料库设计、韵律预测、音库裁减、以高层韵律描述为输入的合成单元挑选等语音合成关键技术的深入研究,较好地解决了上述语音合成系统所遇到的困难.该文的创新点主要有以下几点:1、提出... 刘庆峰关键词:语音合成 文献传递 基于竞争信息的Tandem系统 2011年 Tandem技术是目前主流语音识别系统中提升性能的重要手段之一,它基于训练数据和其所对应的正确标注用有监督的方式训练神经网络的参数。该文提出一种基于解码中竞争信息对传统Tandem起到补充作用的方法,能够增强Tandem技术的区分性。为了获取竞争信息,首先在词图中生成识别解码中的竞争片段,再分别使用基于时长重叠信息和后验概率信息的挑选策略来选取对神经网络训练最为有效的竞争信息,以提高竞争网络对识别性能的补充作用。实验结果表明:加入竞争信息的改进Tandem系统获得了超过传统系统的性能。 周盼 刘聪 江辉 刘庆峰 戴礼荣关键词:语音识别 TANDEM 竞争信息 词图 多路实时、高音质数字串合成系统 1999年 根据汉语普通话中数字串发音的韵律规则和特点,利用LMA语音合成器,实现了一种全新的数字串报号系统。本系统可以在不足300kbytes的极小的音库容量下,通过采用预先计算、查表拼接快速处理方法,在各种特定应用场合下多路实时实现高自然度、高音质的任意多位的数字号码的合成语音。测听实验和用户反馈信息均表明,合成输出语音的听觉效果已经可以与播音员原始发音相媲美。 刘庆峰 膝永盛 王仁华关键词:LMA 语音合成器 多路 中文连续语音识别系统音素建模单元集的构建 被引量:2 2011年 在识别系统中,建模单元能够勾画一种语言的声学和语音学特性,因此对系统性能起到至关重要的作用。该文参照一些已在大词汇量连续语音识别系统(LVCSR)中取得较好效果的建模单元集,构建了新的音素建模单元集(Ne-wPS)。另外,根据NewPS中元音及其变体对前后接音素协同发音的影响,提出了基于扩展的元音三角图设计问题集(NewQS)的方法。实验表明:NewPS和NewQS结合的识别性能超越了传统的声韵母建模单元集;并且,建模单元数目大幅度的减少给系统后续模块的处理带来了便利。 包叶波 胡郁 刘聪 江辉 戴礼荣 刘庆峰加入调型信息的汉语孤立词识别研究 被引量:1 2010年 汉语是一种有调语言,因此在汉语语音识别中,调型信息起着非常关键的作用。在现有的隐马尔可夫模型(Hidden Markov Model)框架下,如何有效地利用调型信息是有待研究的问题。现有的汉语语音识别系统中主要采用两种方式来使用调型信息:一种是基于Embedded Tone Model,即将调型特征向量与声学特征向量组成一个流去训练模型;一种是Explicit Tone Model,即将调型信息单独建模,再利用此模型优化原有的解码网络。该文将两种方法统一起来,首先利用Embedded Tone Model采用双流而非单流建模得到Nbest备选,再利用Explicit ToneModel对调进行左相关建模并对Nbest得分重新修正以得到识别结果,从而获得性能提升。与传统的无调模型相比,该文方法的识别率的平均绝对提升超过了3.0%,在第三测试集上的绝对提升达到了5.36%。 王鹏 胡郁 戴礼荣 刘庆峰关键词:计算机应用 中文信息处理 计算机应用 汉语信息处理 汉语语音识别