国家自然科学基金(60971129) 作品数:34 被引量:247 H指数:11 相关作者: 杨震 叶蕾 郭海燕 王天荆 孙林慧 更多>> 相关机构: 南京邮电大学 南京工业大学 教育部 更多>> 发文基金: 国家自然科学基金 国家重点基础研究发展计划 江苏省普通高校研究生科研创新计划项目 更多>> 相关领域: 电子电信 机械工程 更多>>
基于自相关观测的语音信号压缩感知 被引量:15 2011年 本文基于压缩感知技术,根据语音信号的特点,提出了一种基于自相关特性的截断循环自相关矩阵作为观测矩阵,并在此基础上,从实用的角度出发,提出了基于模板匹配的近似截断循环自相关矩阵作为观测矩阵,并证明其满足RIP特性。由语音信号与截断循环自相关矩阵、近似截断循环自相关矩阵和高斯随机矩阵分别构造相应的观测,采用基追踪(BP)算法来重构原始语音信号。实验表明,由2个模板元素线性组合而成的近似截断循环自相关矩阵重构原始语音信号的性能与截断循环自相关矩阵的重构性能相当,且优于经典高斯随机矩阵,而且在相同的重构性能下,其压缩比远大于高斯随机观测矩阵,对语音信号的压缩性能有了明显地提高。 季云云 杨震关键词:压缩感知 语音信号 自相关特性 基追踪 基于小波变换和压缩感知的低速率语音编码方案 被引量:27 2010年 本文提出一种新的低速率语音编码方案,基于语音信号小波变换高频系数的稀疏性,利用压缩感知原理,将小波变换高频系数进行压缩感知投影成数据量大大减少的观测序列,然后对观测序列采用码激励线性预测技术进行编解码,根据解码后的观测序列,利用线性规划技术对小波变换高频系数进行重构,小波变换低频系数采用矢量量化技术编解码,并采用后置低通滤波器改善解码后小波高低频系数合成语音的听觉效果。该编码方案在低数码率(2.64~3.5 Kb/s)时得到的重构语音平均MOS分为3.0~3.4,达到4.8 Kb/s码激励线性预测语音编码质量。 叶蕾 杨震 郭海燕关键词:小波变换 压缩感知 码激励线性预测 矢量量化 线性规划 行阶梯观测矩阵、对偶仿射尺度内点重构算法下的语音压缩感知 被引量:28 2012年 基于语音信号在离散余弦域上的近似稀疏性,针对采用随机高斯观测矩阵及线性规划方法进行语音压缩感知与重构时,重构零(近似零)系数定位能力差而导致重构效果不好的缺点,本文提出一种新的行阶梯矩阵做观测矩阵,用对偶仿射尺度内点重构算法对语音进行压缩感知与重构,并对该算法下的重构性能进行理论分析.语音压缩感知仿真结果表明,在离散余弦基下,压缩比(观测序列与原始序列样值数之比)为1∶4时,行阶梯观测矩阵下的平均重构信噪比比随机高斯观测矩阵下提高9.73dB,平均MOS分比随机高斯观测矩阵下提高1.22分. 叶蕾 杨震 王天荆 孙林慧关键词:压缩感知 语音重构的DCT域加速Landweber迭代硬阈值算法 被引量:20 2012年 重构信号的最基本理论依据是该信号在某个变换域是稀疏的或近似稀疏的。基于语音信号在DCT域的近似稀疏性,可以采用压缩感知(Compressed Sensing,CS)理论对其进行重构。压缩感知理论中的迭代硬阈值(Iterativehard thresholding,IHT)算法以其较好的性能被广泛用来重构信号,但其收敛速度比较慢,如何提高收敛速度,一直是迭代硬阈值算法研究的重点之一。针对压缩感知理论中的IHT算法收敛速度相当慢的问题,提出了语音重构的DCT域加速Landweber迭代硬阈值(Accelerated Landweber iterative hard thresholding,ALIHT)算法。该算法对原始语音信号做DCT变换,然后在DCT域将每一步Landweber迭代分解为矩阵计算和求解两步,通过修改其中的矩阵计算部分实现Landweber迭代加速,最后通过迭代硬阈值对信号做阈值处理。实验结果表明,加速Landweber迭代硬阈值算法加快了收敛速度、减少了计算量。 杨真真 杨震 李雷关键词:压缩感知 A DISTRIBUTED COMPRESSED SENSING APPROACH FOR SPEECH SIGNAL DENOISING 2011年 Compressed sensing,a new area of signal processing rising in recent years,seeks to minimize the number of samples that is necessary to be taken from a signal for precise reconstruction.The precondition of compressed sensing theory is the sparsity of signals.In this paper,two methods to estimate the sparsity level of the signal are formulated.And then an approach to estimate the sparsity level directly from the noisy signal is presented.Moreover,a scheme based on distributed compressed sensing for speech signal denoising is described in this work which exploits multiple measurements of the noisy speech signal to construct the block-sparse data and then reconstruct the original speech signal using block-sparse model-based Compressive Sampling Matching Pursuit(CoSaMP) algorithm.Several simulation results demonstrate the accuracy of the estimated sparsity level and that this de-noising system for noisy speech signals can achieve favorable performance especially when speech signals suffer severe noise. Ji Yunyun Yang Zhen关键词:DENOISING DCT域的语音信号自适应压缩感知 被引量:32 2010年 利用语音信号在DCT域的稀疏特性,提出了一种基于语音信号能量特性的帧间与帧内自适应压缩感知方法。首先根据语音信号各帧能量和各帧所属能量区间自适应分配每帧观测个数,称之为帧间自适应。然后当帧观测个数确定后,根据每帧完全观测各分量的能量自适应选取相应个数的观测,称之为帧内自适应。实验表明,用该算法重构的语音具有较高的平均分段信噪比和平均意见得分。 郭海燕 王天荆 杨震关键词:压缩感知 语音合成 稀疏性 自适应 基于自适应冗余字典的语音信号稀疏表示算法 被引量:23 2011年 基于冗余字典的信号稀疏表示是一种新的信号表示理论,当前的理论研究主要集中在字典构造算法和稀疏分解算法两方面。该文提出一种新的基于自适应冗余字典的语音信号稀疏表示算法,该算法针对自相关函数为指数衰减的平稳信号,从K-L展开出发,建立了匹配信号结构的冗余字典,进而提出一种高效的基于非线性逼近的信号稀疏表示算法。实验结果表明冗余字典中原子的自适应性和代数结构使短时平稳语音信号稀疏表示具有较高的稀疏度和较好的重构精度,并使稀疏表示算法较好地应用于语音压缩感知理论。 王天荆 郑宝玉 杨震关键词:语音信号处理 压缩感知 冗余字典 基于语音压缩感知观测序列语音能量估计及端点检测方法 被引量:2 2013年 根据压缩感知理论,文中分析了基于压缩感知观测序列语音能量估计的理论基础,并对不同压缩比下语音能量估计的准确度仿真结果做对比,然后将得到的语音能量估计做为语音端点检测的基础,分别对粉红噪声、高斯噪声和汽车噪声情况下不同信噪比的语音进行端点检测,并与基于压缩感知观测序列倒谱距离、传统的奈奎斯特采样中能量的语音端点检测方法做对比,减少了计算量。 王文娟关键词:压缩感知 端点检测 基于过完备线性预测字典的压缩感知语音重构 被引量:22 2012年 基于语音信号帧内样值间的相关性和冗余域的稀疏性,针对采用离散余弦转换矩阵及基追踪方法对压缩感知采样语音进行重构时,语音稀疏性不够好导致大压缩比采样后重构效果差的缺点,提出采用过完备线性预测字典做转换矩阵,用基追踪重构算法对压缩感知采样语音进行高质量重构。该方法预先由训练语音的预测系数聚类构造过完备字典,不需要测试语音的预测系数;基于过完备线性预测字典重构信号性能良好。对利用基追踪重构的语音进行了主客观评价,得出结论:同样的观测数目下,基于过完备线性预测字典比基于离散余弦变换矩阵压缩感知采样语音重构信噪比高出3~8 dB。 孙林慧 杨震 季云云 叶蕾关键词:压缩感知 语音信号 基于主分量分析的语音信号压缩感知 被引量:3 2011年 压缩感知理论是近年来兴起的一个新的研究热点。寻求适合于语音信号的稀疏基是压缩感知理论应用到语音信号处理领域的前提。本文基于主分量分析理论和大量的块数据,提取语音信号的特征信息,并根据压缩感知理论、字典构造的方法以及语音信号的特点,构造出一种适合于语音信号稀疏表示的冗余字典。该冗余字典是由多个正交基级联而成。为了更为客观的说明这种稀疏表示的优势,采用平均gini系数来比较语音信号在DCT基、GABOR基和该冗余字典下的稀疏性,并且分别对男女声语音信号和清浊音进行了分析。实验表明,无论是男声信号还是女声信号,清音还是浊音,在该冗余字典下的稀疏性均优于DCT基,与GABOR基相近,但是由于其原子数远少于GABOR基,其计算的复杂度和存储量均低于GABOR基,因而比GABOR基更具可用性。 季云云 杨震关键词:压缩感知 主分量分析 冗余字典 语音信号