葛唯益 作品数:4 被引量:22 H指数:3 供职机构: 中国电子科技集团公司第二十八研究所 更多>> 发文基金: 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
基于双向门控循环神经网络的事件论元抽取方法 被引量:10 2022年 事件抽取是构建知识图谱的关键前置任务之一,而事件论元抽取是事件抽取的子任务,对事件抽取质量有显著影响。针对现有的流水线式事件抽取方法在论元抽取时忽略了触发词和论元间、论元和论元间相互关系导致抽取质量低的问题,该文提出了一种基于双向门控循环神经网络(Bi-GRU)的事件论元抽取方法。该方法融合Bert词向量、词性特征、词位置特征和触发词类型特征作为输入,采用Bi-GRU网络对文本中的词进行编码,进而应用改进的多注意力机制为句子不同部分分配权重提取句子级别特征,最后通过全连接层实现论元识别和角色分类。在基准数据集上进行了实验验证,结果表明论元识别和角色分类任务的F1-score值分别达到了69.2%和61.6%,优于现有方法。 葛唯益 程思伟 王羽 徐建关键词:事件抽取 循环神经网络 基于多语义相似性的关系检测方法 被引量:5 2021年 关系检测是知识库问答的关键步骤,直接影响问答质量。现有方法中基于编码比较的方法提取文本整体语义进行匹配会丢失序列的局部信息,而基于交互的方法在文本低层表征层面进行比较会忽略全局语义。针对现有方法无法兼顾全局语义和局部语义信息的问题,提出了一种基于多语义相似性的关系检测模型,通过BERT模型分别对问题和关系进行语义表示,然后引入注意力机制、双向长短期记忆网络和多层感知机进行局部关联性分析;利用BERT计算出的句向量中含有序列的全局语义信息,设计了问题和关系句向量的全局相似度度量。在基准数据集SimpleQuestions和WebQSP上进行了实验验证,所提方法分别取得了93.92%和87.81%的准确率,优于其他现有的方法。 谢金峰 王羽 葛唯益 徐建关键词:语义相似性 KEK:基于k-truss的短文本关键词提取方法 被引量:1 2021年 关键词提取在众多文本挖掘任务中扮演着重要的角色,其提取效果直接影响了文本挖掘任务的质量。以文本为研究对象,提出了一种基于k-truss图分解的关键词提取方法,名为KEK(keyword extraction based on k-truss)。该方法首先借助空间向量模型理论,以文本中的词为节点,通过词语之间的共现关系来构建文本图,接着利用k-truss图分解技术来获取文本语义特征,并结合词频、单词位置特征、复杂网络特征等构造无参评分函数,最终根据评分结果来提取关键词。通过在基准数据集上进行实验验证,结果表明KEK算法在提取短文本关键词上的F_(1)值性能指标优于其他基于文本图的关键词提取方法。 杨朝举 葛唯益 王羽 徐建关键词:文本挖掘 图分解 关键词提取 BGCN:基于BERT和图卷积网络的触发词检测 被引量:7 2021年 触发词检测是事件抽取的一项基本任务,该任务涉及对触发词进行识别和分类。目前,已有工作主要存在两方面的问题:1)用于触发词检测的神经网络模型只考虑了句子的顺序表示,且通过顺序建模的方法在捕捉长距离依赖关系时效率较低;2)基于表示的方法虽然解决了手动提取特征的问题,但用作初始训练特征的词向量对句子的表示程度有所欠缺,难以捕捉深层的双向表征。因此,文中提出了一种基于BERT模型和GCN网络的触发词检测模型BGCN,该模型通过引入BERT词向量来强化特征表示,并引入句法结构来捕捉长距离依赖,对事件触发词进行检测。实验结果表明,所提方法在ACE2005数据集上的表现优于其他现有的神经网络模型。 程思伟 葛唯益 王羽 徐建