杨鉴
- 作品数:122 被引量:173H指数:7
- 供职机构:云南大学信息学院更多>>
- 发文基金:国家自然科学基金云南省自然科学基金云南省应用基础研究基金更多>>
- 相关领域:电子电信自动化与计算机技术文化科学语言文字更多>>
- 基于音素大语言模型及扩散模型的低资源越南语语音合成
- 2025年
- 随着深度学习技术的发展及语音合成研究的深入,汉语、英语等通用、高资源语言的合成语音已越来越接近于自然语音。越南语与汉语有密切联系,是一种声调语言,属于南亚语系越芒语族越语支。因受制于可获取的语料数据规模以及相关研究的深入程度,越南语语音合成离自然语音还有明显差距。在低资源前提下,提出了两种提高越南语语音合成自然度的方法:1)基于预训练的音素大语言模型XPhoneBERT构建音素编码器,在数据集有限的情况下,显著提高越南语语音合成的韵律表现力;2)改进轻量化扩散语音合成模型LightGrad中的U-Net结构,增加嵌套跳跃路径,使模型在低资源条件下得到充分训练、捕获更有效的信息、提高噪声预测的准确性,从而提升语音合成质量。实验结果表明,采用上述提出的方法,越南语语音合成系统的客观、主观评测性能有明显的提升,MCD(梅尔倒谱失真)和MOS(平均意见得分)分别达到6.25和4.22,相比于基线系统的7.44和3.56有明显的下降和提升。
- 邹睿杨鉴张凯
- 关键词:语音合成越南语
- 一种新的基于分段排序裁剪的分层构筑DTW识别算法
- 分层构筑DTW识别算法是连接词识别的一种有效算法。本文提出一种分段排序裁剪的新方法, 在减少DTW算法运算量方面有显著效果,并将其用于一个连续数字的识别系统中,经测试,可以明显缩短识别时间,具有很强的实时性,有较高的识别...
- 安镇宙杨鉴王红余映
- 关键词:语音识别
- 文献传递
- 信号处理类课程探究式教学方案研究被引量:1
- 2017年
- 针对数字信号处理课程教学中理论与实践相互脱节、重理论介绍、多验证性实验、缺乏实践相关的实验,提出信号处理类课程的探究式教学方法,指出结合教师的科研实践,应用实例引导学生学习相关知识,推动以学生为主体亲历探究的研究性学习活动,促进学生解决问题和创新能力的培养。
- 周浩丁海燕杨鉴梁虹
- 关键词:探究式教学实践教学
- 基于贝叶斯网络的云南民族口音说话人识别
- 介绍了贝叶斯网络的基本知识及其在说话人识别中的应用。构造了用于说话人识别的贝叶斯网络并介绍了网络参数的估计方法。针对文本无关的说话人识别任务,在云南少数民族口音汉语普通话语音数据库上进行了识别实验。比较了贝叶斯网络参数、...
- 普园媛徐洪杨鉴徐丹
- 关键词:说话人识别贝叶斯网络
- 文献传递
- 面向语音合成的傣语文本罗马化方法
- 传统的傣语语音学主要研究语言的语音描写,本文从语言工程学的角度,并面向傣语语音合成系统开发,研究傣语文本罗马化问题。本文详细分析了西双版纳傣语语音系统,制订了傣语字母到罗马字母的转写表;根据傣文的拼写规则,制定了傣语音节...
- 胡湘兴杨鉴李诗心王昱
- 关键词:傣语音位系统语音合成
- 文献传递
- 语种辨识的多特征信息应用被引量:2
- 2010年
- 提取动态的高层语言学特征建立了改进的语种相关的、联合的GMM-LM语种辨识方案。该方案减小了不同语种的高斯混合模型和语言模型之间的相关性,也降低了训练的复杂度。还提出了基于特征提取层和判决层融合技术的语种辨识系统。该系统利用了不同类型的特征对区分不同语种的贡献来增加不同语种语料之间的差异,并使相同语种的语料之间的差异减小。实验表明,设计的语种辨识系统具有较好的扩展性;基于特征提取层和判决层的融合系统能够有效地提高系统识别率。
- 曾秀花杨鉴徐永华
- 关键词:语种识别高斯混合模型
- 基于MATLAB的“信号与系统”计算机辅助教学系统设计被引量:9
- 2001年
- 对课程“信号与系统”的计算机辅助教学进行研究 ,提出了以MATLAB为平台开发的“信号与系统”计算机辅助教学软件模型 ,并介绍了重点知识演示子系统的具体实现 .
- 梁虹杨鉴普园媛
- 关键词:矩阵实验室MATLAB计算机辅助教学《信号与系统》教学软件软件设计
- 基于多特征和多分类器融合的语种识别被引量:2
- 2010年
- 多分类器协同合作克服了单个分类器识别效果不理想,适用范围较窄或对使用环境要求较高的不足。提取多层面的特征则增加了输入样本的多样性。本文提出了一种基于SVM分类器融合的语种识别系统,该系统采用了SVM作为子分类器,参数选取包括MFCC、LPCC,基音频率和第一共振峰,采用投票法,加权平均法和决策模板法三种不同的融合方法对汉语,英语,日语,白族语和纳西语进行识别研究,达到了预期的识别效果。
- 陈瑶玲杨鉴
- 关键词:语种识别多分类器
- 基于频域多尺度分析的显著性检测被引量:2
- 2020年
- 针对现有显著性检测方法得到的显著区域不完整以及缺乏生物学依据的不足,提出一种基于频域多尺度分析的图像显著性检测方法.首先利用小波变换将输入图像的离散余弦变换(DCT)系数的幅度谱进行多尺度分解,计算得到多尺度下的空间域视觉显著图,然后依据显著性评价函数选出较优显著图,最后以自适应权重合成输入场景的视觉显著图.对不同类型数据集进行实验,包括心理物理学模板数据集、人眼注视轨迹数据集及显著目标分割数据集(包括ASD和ECSSD数据集),该方法对于多类型数据集在P-R曲线、ROC曲线及AUC指标等客观评价标准上均取得较高精确度,且在计算速度统计中计算较快,表明该方法优于其他经典的显著性检测方法.
- 吴青龙余映杨鉴邵凯旋康迂星
- 关键词:视觉注意显著性检测离散余弦变换小波变换
- 基于音频信号的检索定位自适应方法
- 2007年
- 音频信息的检索是多媒体检索技术中的一个重要方面。本文讨论一种基于音频信号的广告条目检索和定位的一种自适应方法,它利用短时平均过零率和互相关函数从实时音频数据流中快速检测和定位广告条目.
- 刘磊杨鉴宋晓玲
- 关键词:互相关函数