在线评论在用户的购买决策中起到日益重要的作用,电商网站提供海量的用户评论,但是个体很难充分利用所有信息。因此,对这些评论进行分类、分析和汇总是很迫切的任务。首次提出一个基于注意力机制和双向LSTM(bi-directional long short-term memory,BLSTM)的模型来判定评论对象的类别,用于评论的分类。模型首先使用BLSTM对词向量形式的评论进行训练;然后根据词性为BLSTM的输出向量赋予相应权重,权重作为先验知识能指导注意力机制的学习;最后使用注意力机制捕捉与类别相关的重要信息用于类别判定。在SemEval数据集上进行了实验,结果表明,模型能有效提高评论对象类别判定的效果,优于其他算法。
为了不断发展和完善我国的社区服务体系,让信息技术逐步应用于社区服务,项目组设计实现了基于HTK的社区语音接入服务平台。HTK(Hidden Markov Model Toolkit)是一个基于隐马尔可夫模型(HMMs)的语音处理工具,在语音识别领域处于国际领先水平。平台由最初的高斯单音素HMMs模型,哑音素HMMs模型经训练得到了输出分布更加稳健的三音素HMMs模型。在非特定人低噪音环境下单词识别率达到93.22%,整句识别率达到80.50%,取得了良好的识别效果。