张虎
- 作品数:137 被引量:211H指数:8
- 供职机构:山西大学计算机与信息技术学院更多>>
- 发文基金:国家自然科学基金山西省自然科学基金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信理学更多>>
- 法律文书命名实体识别研究进展被引量:1
- 2024年
- 实现“数字法治,智慧司法”是我们一直以来的宗旨和目标,为了加速推进智慧法院建设工作,为后续相关研究提供参考与借鉴,本文归纳梳理了法律文书命名实体识别的相关研究成果。首先介绍了智慧司法的重要性及针对法律领域探索命名实体识别任务的必要性;然后对现有法律文书命名实体识别中的实体类型、实体标注方式、信息抽取评测任务中使用的数据集及常用评测指标等进行了整理;并从基于深度学习的命名实体识别方法、基本模型框架及基于命名实体识别的下游任务等多个方面总结了法律文书命名实体识别的发展历程;最后从命名实体识别数据集及研究方法等角度指出了现存问题和未来研究方向。
- 高海慧张虎
- 关键词:法律文书命名实体识别知识图谱
- 一种融合语义场景的摘要自动生成方法及系统
- 本发明属于自然语言处理研究领域,具体为一种融合语义场景的摘要自动生成方法及系统。具体内容如下:一、图构建单元,根据文章中的框架分别构建语义场景图和词关系图;二、文章编码单元,使用预训练模型获取文章的向量表示;三、图编码单...
- 关勇李茹郭少茹谭红叶张虎
- 文献传递
- 一种汉语自监督词义理解方法及系统
- 本发明公开了一种汉语自监督词义理解方法及系统,属于自然语言处理技术领域。通过生成式自监督与判别式自监督两种方式,提高模型对词语具体含义识别的准确性。生成式方式即设计面向词义理解的预训练任务,提升模型对文本中歧义词表示的能...
- 谭红叶 金旭李茹张虎
- 规则与统计相结合的分词一致性检验被引量:7
- 2008年
- 建设高质量的大规模语料库是中文信息处理领域的基础性工程,保证语料库分词结果的一致性是衡量语料库分词质量的重要标准之一。在分析了大量的语料库切分不一致现象后,提出了规则与统计相结合的分词一致性检验的新方法。与以往单一的处理方法相比,该方法更具针对性的对语料库中存在的各种不同的分词不一致现象分别进行处理,能够更加有效的解决分词不一致问题,进一步保证语料库的质量。
- 刘博郑家恒张虎
- 关键词:中文信息处理大规模语料库分词语料库加工
- 一种对比增强和多尺度语义感知的互动论点对识别方法
- 本发明属于自然语言处理技术领域,具体涉及一种对比增强和多尺度语义感知的互动论点对识别方法。现有的互动论点对识别技术忽略了互动论点对之间以及互动论点对和上下文之间复杂的语义交互表示,并且没有充分利用到互动论点正负样本之间表...
- 张虎吴增泰
- 基于项目驱动的大学生计算思维能力培养
- 2024年
- 文章首先分析了大学生计算思维能力现状,然后提出了基于项目驱动的大学生计算思维能力培养模式,包括项目式学习模式设计、项目实施过程与方法,最后论述了基于项目驱动的大学生计算思维能力培养实践。
- 杨陟卓张虎杜航原谷波
- 关键词:大学生
- 知识引导的视觉关系检测模型
- 2024年
- 视觉关系检测(VRD)任务是在目标识别的基础上,进一步检测目标对象之间的关系,属于视觉理解和推理的关键技术。由于对象之间交互组合,容易造成对象间关系组合爆炸的问题,从而产生很多关联性较弱的实体对,导致后续的关系检测召回率较低。针对上述问题,提出知识引导的视觉关系检测模型。首先构建视觉知识,对常见的视觉关系检测数据集中的实体标签和关系标签进行数据分析与统计,得到实体和关系间交互共现频率作为视觉知识;然后利用所构建的视觉知识,优化实体对的组合流程,降低关联性较弱的实体对得分,提升关联性较强的实体对得分,进而按照实体对的得分排序并删除得分较低的实体对,对于实体之间的关系也同样采用知识引导的方式优化关系得分,从而提升模型的召回率。在公开数据集视觉基因库(VG)和VRD中验证所提模型的效果:在谓词分类任务中,与现有模型PE-Net(Prototype-based Embedding Network)相比,在VG数据集上,召回率Recall@50和Recall@100分别提高了1.84和1.14个百分点;在VRD数据集上,相较于Coacher,Recall@20、Recall@50和Recall@100分别提高了0.22、0.32和0.31个百分点。
- 王元龙胡文博张虎
- 关键词:知识引导
- 一种基于可解释因果模型的司法判决推理方法
- 本发明涉及机器学习、自然语言处理、因果推理等领域,具体涉及一种基于可解释因果模型的司法判决推理方法。包括分析与表示司法数据、定义司法判决推理框架、构建司法判决推理因果模型。其中定义司法判决推理框架包括:提取事实要素、认定...
- 张虎王鑫杨陟卓李茹谭红叶
- 文献传递
- 基于文本知识增强的问题生成模型被引量:2
- 2024年
- 预训练语言模型在大规模训练数据和超大规模算力的基础上,能够从非结构化的文本数据中学到大量的知识。针对三元组包含信息有限的问题,提出利用预训练语言模型丰富知识的问题生成方法。首先,利用预训练语言模型中丰富的知识增强三元组信息,设计文本知识生成器,将三元组中的信息转化为子图描述,丰富三元组的语义;然后,使用问题类型预测器预测疑问词,准确定位答案所在的领域,从而生成语义正确的问题,更好地控制问题生成的效果;最后,设计一种受控生成框架对关键实体和疑问词进行约束,保证关键实体和疑问词同时出现在问题中,使生成的问题更加准确。在公开数据集WebQuestion和PathQuestion中验证所提模型的性能。实验结果表明,与现有模型LFKQG相比,所提模型的BLUE-4、METEOR、ROUGE-L指标在WebQuestion数据集上分别提升0.28、0.16、0.22个百分点,在PathQuestion数据集上分别提升0.8、0.39、0.46个百分点。
- 陈佳玉王元龙张虎
- 关键词:自然语言理解知识图谱
- 一种基于多层知识感知的地址实体识别方法
- 本发明属于自然语言处理领域,具体涉及一种基于多层知识感知的地址实体识别方法。本方法结合地址实体识别在知识图谱构建过程中需要面对的应用场景,设计并提供了基于多层知识感知的地址实体识别方法,从地址实体识别的角度出发,依据地址...
- 李茹高俊杰邵文远谭红叶张虎闫智超苏雪峰张越梁吉业