孙颖 作品数:63 被引量:117 H指数:7 供职机构: 太原理工大学 更多>> 发文基金: 国家自然科学基金 山西省回国留学人员科研经费资助项目 山西省青年科技研究基金 更多>> 相关领域: 电子电信 自动化与计算机技术 文化科学 医药卫生 更多>>
基于聚合经验模态分解的情感语音特征提取 被引量:6 2017年 特征提取是情感语音识别系统的关键过程,决定系统整体识别性能。传统特征提取技术假定语音信号是线性、短时平稳信号,不具有自适应性。为此,通过聚合经验模态分解(EEMD)算法以非线性的处理方式提取特征。情感语音信号经EEMD分解后得到一组固有模态函数(IMF),利用相关系数法筛选出有效分量集合,对集合函数计算得到IMF能量特征(IMFE)。选用德国柏林语音库作为实验数据来源,将IMFE特征、韵律特征、梅尔倒谱系数特征以及三者的融合特征分别输入到支持向量机中,通过比较不同特征的识别结果验证IM FE特征的有效性。实验结果表明,IM FE特征与声学特征融合后的平均识别率达到91.67%,可有效区分不同的情感状态。 张乐 张雪英 孙颖 张卫关键词:特征提取 声学特征 一种特征增强的构音障碍语音处理方法 本发明属于语音信号处理技术领域,具体涉及一种特征增强的构音障碍语音处理方法,包括以下步骤:S1、对原始信号进行快速傅里叶变换,计算得到其频谱信号;S2、对频谱信号进行经验模态分解,得到各个本征模式分解分量;S3、计算前m... 段淑斐 朱婷 张雪英 卡米拉 孙颖 贾海蓉基于脑区划分的EEG-fNIRS电极排列方法及系统 本发明公开一种基于脑区划分的EEG‑fNIRS电极排列方法及系统,涉及情感识别分类领域,方法包括:利用62导联的脑电记录仪和18导联近红外脑功能成像系统同步采集大脑对情感认知活动过程中的实测EEG信号和实测fNIRS信号... 张雪英 张静 陈桂军 孙颖 黄丽霞 李晓辉一种情感语音PAD值预测方法及系统 本发明公开了一种情感语音PAD值预测方法及系统。该方法包括:获取测试情感语音数据;对所述测试情感语音数据进行特征提取,得到测试特征数据;获取训练好的支持向量回归模型;通过所述训练好的支持向量回归模型对所述测试特征数据进行... 张雪英 孙颖 张卫 张婷 黄丽霞 陈桂军基于PAD情绪模型的情感语音识别 被引量:10 2016年 简述梅尔频率倒谱系数、线性预测系数、韵律学特征、共振峰频率和过零峰值幅度特征,并将这五种语音特征应用于情感语音识别.根据识别结果从PAD情绪模型的三个维度进行相关性分析得到特征的权重系数,并将识别结果融合映射到PAD三维情绪空间,最终获得情感语音的PAD值.利用情感语音的PAD值可以从连续情感理论对情感语音进行描述分析,采用量化的方法揭示情感空间中各种情绪范畴的定位和关系. 宋静 张雪英 孙颖 张卫关键词:语音特征 基于模糊认知图的语音情感识别研究 2017年 利用模糊认知图构建一种新的情感语音识别网络,该网络将权值矩阵分为两部分:一部分是特征与情感类别之间的权值,使用实数编码遗传算法学习;另一部分是情感类别与类别之间的权值,使用PAD三维情感模型学习。从数学和心理学两方面对模糊认知图的权值进行学习。针对国际公认的柏林情感语音库(EMO-DB)以及本实验室录制的情感语音库(TYUT)进行仿真实验,验证了方法的有效性,并与BP神经网络进行对比,实验结果表明该方法有较高的识别率。 张卫 张雪英 孙颖关键词:模糊认知图 实数编码遗传算法 PAD 语音情感识别 一种情感识别方法及系统 本发明公开了一种情感识别方法及系统,该方法包括:获取待识别的脑电信号;提取待识别时频域特征、待识别非线性特征和待识别脑网络属性特征;待识别时频域特征为根据待识别的脑电信号的小波分解系数计算得到的小波熵;待识别非线性特征包... 陈桂军 张雪英 李凤莲 孙颖 黄丽霞 王杰文献传递 修正线性深度自编码网络语音识别方法 一种修正线性深度自编码网络语音识别方法,所述方法首先是采用修正线性单元作为激活函数替换传统的Sigmoid函数对深度自编码网络进行训练,其次是引入L2正则化来优化深度模型训练过程中容易产生的过拟合问题,最后通过逐层贪婪无... 黄丽霞 张雪英 孙颖 娄英丹文献传递 基于PVTCSE-RBGRU与交叉注意力的情感识别 2025年 针对语音和文本情感特征提取不充分,不同模态特征融合效果差等问题,为提高情感识别任务的准确率,提出了一种基于PVTCSE-RBGRU与复合交叉注意力的双模态情感识别模型。首先设计了PVTCSE(Pyramid Vision Transformer-CNN-Squeeze and Excitation)语音特征编码器,在全局情感特征的基础上进行特征深度处理,兼并局部情感特征并建模特征通道之间的相互依赖关系;接着提出了RBGRU(RoBERTa-BGRU)文本特征编码器,并行处理序列的同时加强文本特征的情感信息表达,充分考虑文本的上下文依赖关系;然后通过复合交叉注意力融合语音文本特征,对模态内部和模态之间的情感关系进行建模,改善了不同模态特征的异质性。在IEMOCAP数据集上的情感识别精度可达76.40%,表明了所提出模型在情感识别任务上的有效性。 陈威丹 张雪英 孙颖关键词:情感识别 相空间重构的情感语音特征提取及优化 被引量:10 2017年 针对现有语音情感特征在表征情感信息上的不完整,将相空间重构理论引入到情感语音的特征提取中.通过分析不同语音情感状态下相空间重构的几何特性,提取了该重构相空间下基于轨迹的描述轮廓的5种非线性几何特征作为新的情感语音特征参数,并根据情感与特征映射的关系提出一种特征参数优化方法.首先,选用德语柏林语音库中的高兴、悲伤、中性和生气4种情感作为实验样本;其次,提取非线性几何特征和非线性属性特征(最小延迟时间、关联维数、Kolmogorov熵、最大Lyapunov指数和Hurst指数);最后,根据设计方案采用支持向量机进行情感语音识别.实验结果表明,该特征相较于非线性属性特征在情感语音识别上有较强的优势度,联合非线性属性特征后,通过特征参数优化的方法获得了最优的非线性特征集合,验证了该方法的实用性. 孙颖 宋春晓关键词:相空间重构 语音情感识别