公共文化服务平台

刘庆峰: 作品数：24 被引量：47H指数：4; 供职机构：中国科学技术大学更多>>; 发文基金：国家自然科学基金国家高技术研究发展计划安徽省科技攻关计划更多>>; 相关领域：电子电信自动化与计算机技术理学经济管理更多>>

合作作者

汉语语音合成理论研究及系统实现: 该文在语音合成的基础技术研究和实用系统开发方面均进行了深入研究.针对传统的驻汉语文语转换系统存在的主要问题,该文从语音合成器设计、韵律规则总结和语音基元库设计等几个方面入手,在大量分析实验的基础上,提出了一系列理论和技术...; 刘庆峰; 关键词：语音合成汉语文语转换系统

自由表述口语语音评测后验概率估计改进方法被引量：5: 2017年; 该文研究了两种用于改善深度神经网络声学建模框架下自由表述口语语音评测任务后验概率估计的方法:1)使用RNN语言模型对一遍解码N-best候选做语言模型得分重估计来获得更准确的识别结果以重新估计后验概率;2)借鉴多语种神经网络训练框架,提出将方言数据聚类状态加入解码神经网络输出节点,在后验概率估计中引入方言似然度得分以评估方言程度的新方法。实验表明,这两种方法估计出的后验概率与人工分相关度分别绝对提升了3.5%和1.0%,两种方法融合后相关度绝对提升4.9%;对于一个真实的评测任务,结合该文改进的后验概率评分特征,总体评分相关度绝对提升2.2%。; 许苏魁戴礼荣魏思刘庆峰高前勇; 关键词：后验概率

XF32XXXF32XX系列语音合成模块: 刘庆峰尹波黄海兵谢信珍李庆东陈家志刘强徐承; 该产品是基于KB1.0嵌入式语音合成系统，面向中高端嵌入式应用的板级语音合成产品，产品具有优质的合成效果，是可定制的语音合成系统，基本可以满足在嵌入式硬件领域的应用。其可以给电子仪表加上语音报读功能，增强仪器的智能化，在...; 关键词：

CDMD-S/J系列车载数码听: 刘庆峰尹波黄海兵谢信珍李庆东陈家志李劲松刘强; 该系列产品为车载电子设备，是利用语音合成技术和MP3解码技术实现的具备通用优盘的存储功能的硬件终端产品。该产品可以将车载数码听存储的各种文字内容信息转换成语音信号，通过汽车音响系统播放。结构上采用了可插拔或立体声无线（F...; 关键词：; 关键词：车载数码听

基于音素相关后验概率变换的发音质量评价被引量：3: 2011年; 帧规整对数后验概率是目前公认最有效的发音质量的度量。但该文证明了该度量还反映了当前发音对应的声学模型与概率空间中声学模型的混淆程度,使其在评分任务上存在着严重的缺陷。因此,该文提出了可训练的音素相关的后验概率变换;并研究了线性和非线性sigmoid变换,同时给出线性变换的显式全局最优解和非线性变换的梯度下降解法。在全国采集的普通话水平测试现场考试的篇章朗读题型上进行实验。实验结果表明:当概率空间包含所有音素时,该方法能使人机相关度从0.582提升至0.768;当采用优化的概率空间时,该方法能使人机相关度从0.696提升至0.773。; 严可魏思戴礼荣刘庆峰; 关键词：计算机辅助语言教学

基于听感量化的语音合成研究: 该文通过'听感量化'思想的提出以及在此思想下对语料库设计、韵律预测、音库裁减、以高层韵律描述为输入的合成单元挑选等语音合成关键技术的深入研究,较好地解决了上述语音合成系统所遇到的困难.该文的创新点主要有以下几点:1、提出...; 刘庆峰; 关键词：语音合成; 文献传递

基于竞争信息的Tandem系统: 2011年; Tandem技术是目前主流语音识别系统中提升性能的重要手段之一,它基于训练数据和其所对应的正确标注用有监督的方式训练神经网络的参数。该文提出一种基于解码中竞争信息对传统Tandem起到补充作用的方法,能够增强Tandem技术的区分性。为了获取竞争信息,首先在词图中生成识别解码中的竞争片段,再分别使用基于时长重叠信息和后验概率信息的挑选策略来选取对神经网络训练最为有效的竞争信息,以提高竞争网络对识别性能的补充作用。实验结果表明:加入竞争信息的改进Tandem系统获得了超过传统系统的性能。; 周盼刘聪江辉刘庆峰戴礼荣; 关键词：语音识别 TANDEM 竞争信息词图

多路实时、高音质数字串合成系统: 1999年; 根据汉语普通话中数字串发音的韵律规则和特点，利用LMA语音合成器，实现了一种全新的数字串报号系统。本系统可以在不足300kbytes的极小的音库容量下，通过采用预先计算、查表拼接快速处理方法，在各种特定应用场合下多路实时实现高自然度、高音质的任意多位的数字号码的合成语音。测听实验和用户反馈信息均表明，合成输出语音的听觉效果已经可以与播音员原始发音相媲美。; 刘庆峰膝永盛王仁华; 关键词：LMA 语音合成器多路

中文连续语音识别系统音素建模单元集的构建被引量：2: 2011年; 在识别系统中,建模单元能够勾画一种语言的声学和语音学特性,因此对系统性能起到至关重要的作用。该文参照一些已在大词汇量连续语音识别系统(LVCSR)中取得较好效果的建模单元集,构建了新的音素建模单元集(Ne-wPS)。另外,根据NewPS中元音及其变体对前后接音素协同发音的影响,提出了基于扩展的元音三角图设计问题集(NewQS)的方法。实验表明:NewPS和NewQS结合的识别性能超越了传统的声韵母建模单元集;并且,建模单元数目大幅度的减少给系统后续模块的处理带来了便利。; 包叶波胡郁刘聪江辉戴礼荣刘庆峰

加入调型信息的汉语孤立词识别研究被引量：1: 2010年; 汉语是一种有调语言,因此在汉语语音识别中,调型信息起着非常关键的作用。在现有的隐马尔可夫模型(Hidden Markov Model)框架下,如何有效地利用调型信息是有待研究的问题。现有的汉语语音识别系统中主要采用两种方式来使用调型信息:一种是基于Embedded Tone Model,即将调型特征向量与声学特征向量组成一个流去训练模型;一种是Explicit Tone Model,即将调型信息单独建模,再利用此模型优化原有的解码网络。该文将两种方法统一起来,首先利用Embedded Tone Model采用双流而非单流建模得到Nbest备选,再利用Explicit ToneModel对调进行左相关建模并对Nbest得分重新修正以得到识别结果,从而获得性能提升。与传统的无调模型相比,该文方法的识别率的平均绝对提升超过了3.0%,在第三测试集上的绝对提升达到了5.36%。; 王鹏胡郁戴礼荣刘庆峰; 关键词：计算机应用中文信息处理计算机应用汉语信息处理汉语语音识别