潘接林 作品数:74 被引量:171 H指数:6 供职机构: 中国科学院声学研究所 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 中国科学院战略性先导科技专项 更多>> 相关领域: 电子电信 自动化与计算机技术 语言文字 理学 更多>>
一种基于距离测算和贝叶斯信息判据的音频分段算法 本文提出的分段算法先使用距离测算的方法将音频流分为较为零碎的片段,再利用贝叶斯信息判据(BIC)对相邻的片段进行合并,力图使每一个音频片段中仅含有单一的声学特征.此算法在广播新闻语料和访谈性质的电话交谈中均取得了较好的效... 徐燃 刘晓星 潘接林关键词:语音信号处理 文献传递 迭代数控制的稀疏约束波束形成算法 被引量:2 2017年 研究了基于L1范数约束的快速迭代算法,分析了其迭代过程以及与波束形成算法相结合的方式。提出了一种基于迭代数控制的波束形成算法,并给出了实现过程。所提算法避免了现有算法对信噪比估计的依赖,并提高了算法在低信噪比环境下的干扰抑制能力。经验证,该方法在维持了较低复杂度的前提下,其信干噪比在不同信噪比条件下的稳健性要优于对比算法。 曹占中 胡冬妮 李煦 李煦 颜永红关键词:波束形成 自适应滤波 阵列信号处理 小资源下基于神经网络的声学建模 小资源条件是指用于搭建语音识别系统的训练数据受限的情况。在该情况下,声学建模的精度亦受到影响。本文主要研究了小资源条件下神经网络声学模型的选择问题,重点对比了p-norm DNN(Deep Neural Networks... 杨晋仪 张鹏远 潘接林 颜永红关键词:语音识别 声学模型 文献传递 一种基于距离测算和贝叶斯信息判据的音频分段算法 音频流分段技术在语音识别的前端信号处理过程中有着重要的意义。好的音频分段算法应能根据说话人、信道等声学环境的变化对输入音频流进行分段,从而为后续的聚类和自适应过程做好准备。本文提出的分段算法先使用距离测算的方法将音频流分... 徐燃 刘晓星 潘接林关键词:声学特征 文献传递 基于长时特征与扩展音素集的韩语语音识别改良算法 韩语是黏着语的一种,其特点是音素发音会受到上下文影响。这一特点使语音识别中声学模型的建模产生混淆,从而影响系统的识别性能,鉴于传统短时特征的上下文信息极为缺乏,本文引入长时特征对分布于时域的信息进行收集与分析,进而缓解声... 徐及 潘接林 颜永红关键词:语音识别 韩语 文献传递 一种演唱的评分系统和方法 本发明公开了一种演唱的评分系统和方法,通过对演唱语音信号进行音符切分、量化,搜索歌曲中的对应演唱歌曲片段,计算多种距离,并综合得到演唱评分。通过应用本发明,使得只要演唱数据在旋律上与原声有较好的一致性,就可以得到较准确的... 颜永红 李明 曹川 刘建 潘接林文献传递 口语障碍者的语音特征分析与变换 声音变换技术在语音识别、语音合成、保密通信等领域都有广泛的潜在应用前景。本文将研究如何将不同程度口语障碍者的语音,通过分析和变换转换成另一种更易于听懂的语音。在分析中,我们用线谱频率(LSF)作为参数,用混合高斯模型(G... 张建平 潘接林 韩疆 颜永红关键词:口语障碍 LSF 混合高斯模型 GMM 声音转换 LPC 文献传递 一种用于维吾尔语语音识别的识别单元的选择方法及系统 本发明实施例涉及一种用于维吾尔语语音识别的词典单元的选择方法及系统。方法包括:为待识别的语音收集/准备相应的文本语料;从文本语料中抽取不同的词语;将所述不同词语输入形态分析器,分析成功时获得相应的词语的分解结果,分析失败... 潘接林 李鑫 颜永红文献传递 基于隐藏单元条件随机场的多知识源融合改进自动语音识别置信度 被引量:1 2014年 鉴于自动语音识别(ASR)中置信度估计困难的问题,该文提出一种基于多知识源融合的策略来提高置信度的鉴别能力。具体做法是,首先选择关于识别结果的声学层、语言层和语义层等不同层次的信息,然后通过实验确定这些信息不同的组合方式,并以此为特征在隐藏单元条件随机场(Hidden-units Conditional Random Fields,HuCRFs)框架下计算识别结果的条件概率。最后将HuCRFs条件概率作为语音识别结果置信度的新的估计。实验首先证明了HuCRFs条件概率是比归一化的网格后验概率鉴别能力更强的一种置信度估计方法。同时基于HuCRFs条件概率置信度,对解码器一遍识别得到的网格重新搜索最佳候选序列,取得了相对一遍识别最佳候选序列绝对近2%的字错误率(CER)下降。同时,该文也对比了基于HuCRFs条件概率搜索的最佳候选序列和基于长语言模型网格重估的最佳候选序列的性能,进一步证明了使用HuCRFs条件概率作为置信度估计是一种更好的选择。 高兴龙 潘接林 颜永红关键词:语音识别 一种基于歌词的歌曲检索系统及其检索方法 本发明涉及一种基于歌词的歌曲检索系统,包括:语音识别引擎,用于将用户输入的原始语音数据转化为文本识别结果;检索关键词选取模块,用于将文本识别结果中的部分词选出作为检索关键词;歌词定位模块,用于根据关键词在歌词库中定位候选... 赵庆卫 颜永红 吴晓 潘接林文献传递