何发镁 作品数:14 被引量:62 H指数:4 供职机构: 北京理工大学图书馆 更多>> 发文基金: 国家自然科学基金 北京市属高等学校人才强教计划资助项目 北京市科技新星计划 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
基于粗糙集理论的网络安全评估研究 本文提出了一种基于粗糙集理论(Rough Set Theory,RST)的网络安全评估模型,用于监控网络的安全态势。该方法使用粗糙集理论对网络连接数据提取检测规则模型。使用粗粗糙集理论提取规则模型,能有效地处理数据挖掘方... 王旭仁 何发镁 王彦丽 袁晓红关键词:粗糙集理论 网络安全评估 网络安全分析 文献传递 基于粗糙集理论的网络安全评估研究 本文提出了一种基于粗糙集理论(Rough Set Theory,RST)的网络安全评估模型,用于监控网络的安全态势。该方法使用粗糙集理论对网络连接数据提取检测规则模型。使用粗粗糙集理论提取规则模型,能有效地处理数据挖掘方... 王旭仁 何发镁 王彦丽 袁晓红关键词:粗糙集理论 网络安全评估 网络安全分析 文献传递 基于Tika和Lucene的桌面搜索引擎研究与实现 被引量:3 2014年 在桌面搜索引擎中,对于二进制文件格式的处理,通常需要针对每一种具体的文件格式编写独立的解析器,复杂度较高且不易维护。从分析开源搜索引擎Lucene出发,提出一种基于Tika和Lucene的桌面搜索引擎框架,能够使用统一的应用编程接口来处理不同二进制格式的文档。整个框架均为开放源代码形式,各模块间耦合度低,易于扩展。在实现方面,基于最新的Lucene4.1,实现了对桌面系统内文档的全文搜索;并在索引性能优化方面,相比于传统的参数配置优化和内存缓冲优化两方面,使用最新的DWPT(documents writer per thread)技术,使索引性能提升了35%。 王旭仁 郑秋辉 何发镁 李娜 王彦丽关键词:桌面搜索引擎 索引优化 推荐系统安全问题研究综述 在最近几年来,为有效地解决人们面临的信息过量问题,推荐系统出现了。作为一个有效的方法,它通过从以前用户的交互动作提取信息以形成个性化的产品建议。然而,推荐系统也存在严重的安全问题:恶意用户能够影响或破坏提供给其他用户的推... 何发镁 冯勇 许榕生 王旭仁关键词:协同过滤 推荐系统 攻击检测 文献传递 基于K-means和naive Bayes的数据库用户行为异常检测研究 被引量:8 2020年 针对数据库用户行为异常导致数据库泄露问题,提出了一种基于K-means和naive Bayes算法的数据库用户异常检测方法。首先,利用数据库历史审计日志中用户的查询语句与查询结果,采用K-means聚类方法得到用户的分组;然后,使用naive Bayes分类算法构造用户异常检测模型。与单独使用naive Bayes分类法构造的模型相比,在数据预处理时其精简了用户行为轮廓的表示方法,降低了计算冗余,减少了81%的训练时间;利用K-means聚类方法得到用户组别,使检测的精确率提高了7.06%,F 1值提高了3.33%。实验证明,所提方法大幅降低了训练时间,取得了良好的检测效果。 王旭仁 冯安然 何发镁 马慧珍 何发镁关键词:数据库 用户行为 K-MEANS聚类 NAIVE 网络威胁情报分析框架研究和实现 2024年 网络威胁情报基于大量网络威胁数据,通过信息共享和集体协作,实现对网络威胁的快速预警、检测和响应。如何快速、准确地从海量威胁情报报告中自动提取涉及网络安全信息已成为研究的热点和难点。文中提出了一个网络威胁情报分析框架,总结目前对网络威胁情报的全周期处理流程。并给出了在此框架下应用实例:创建公开威胁情报数据集、提出网络威胁情报关键信息抽取算法、实现基于异质信息图的恶意IP⁃域名的关联认知等。文中实现了多种网络威胁情报实体识别深度学习模型,其中基于XLnet和字典相结合进行嵌入表达,模型准确率最好达到95.27%。论文提出的网络威胁情报分析框架可以作为非结构化网络威胁情报分析的指导依据,论文的实验结果可以作为网络威胁情报信息抽取工作的对比基线。 何发镁 刘润时 贾赛男 岳桓州 王旭仁关键词:命名实体识别 个性化推荐系统描述文件攻击检测方法 被引量:3 2011年 个性化推荐系统能产生针对性的、个性化的信息来满足不同用户需求,但也很容易受到用户描述文件注入恶意攻击,影响正常的推荐结果。针对该问题,分析和研究了描述文件的形式化模型、描述文件的属性及分类方法,应用粗糙集理论,设计了数据预处理离散化、决策表约简和个性化推荐处理相应算法,提出了一种用户描述文件分类学习和攻击检测的方法;为降低攻击对推荐结果的影响,完善了推荐系统的安全,设计出一种动态交互的个性化推荐模型框架。实例证明,用户描述文件的属性分类及检测方法是有效的,准确率高,能够有效地改善个性化推荐系统模型的安全。 张靖 何发镁 邱云关键词:推荐系统 粗糙集理论 一种并行LDA主题模型建立方法研究 被引量:12 2013年 针对潜在狄利克雷分析(LDA)模型分析大规模文档集或语料库中潜藏的主题信息计算时间较长问题,提出基于MapReduce架构的并行LDA主题模型建立方法.利用分布式编程模型研究了LDA主题模型建立方法的并行化实现.通过Hadoop并行计算平台进行实验的结果表明,该方法在处理大规模文本时,能获得接近线性的加速比,对主题模型的建立效果也有提高. 王旭仁 姚叶鹏 冉春风 何发镁关键词:并行计算 主题建模 Web页面细粒度数据抽取方法研究 2014年 尽管有很多方法用于Web页面信息抽取,对细粒度信息如数据项等的抽取需求仍然很迫切。提出了一个用于结构化数据抽取的解决方案,将Web页面上的信息以更细的粒度抽取出来。对包装器(wrapper)生成时所依据的信息进行了基于稳定性的分类,实现了模板和种子之间多对多的自动关联(automatically correlating),并按照信息稳定性的高低为每个字段生成多个抽取规则,在抽取信息时根据多个抽取规则进行抽取,只有在所有规则失效时才会导致抽取失败,提高了抽取系统的鲁棒性。实验结果表明,该方法具有良好的抽取功率和准确率。 王旭仁 杨硕 何发镁 王彦丽 张为群关键词:信息抽取 WEB挖掘 包装器 DNS隧道检测技术研究综述 2025年 域名系统(DNS)作为将IP地址和域名互相转换的系统,是互联网中的重要基础协议之一。由于DNS在互联网中的重要性,一些安全设施如防火墙和入侵检测系统(IDS)等的安全策略默认允许DNS流量通过,这给了攻击者利用DNS隧道进行通信的机会。目前,已经有许多恶意软件支持DNS通信,甚至默认使用DNS通信,这为网络安全工具和安全运营中心带来了很大的挑战。然而,现有的研究主要聚焦于具体的检测方法,即使绝大部分研究者在他们的研究中依赖隧道工具生成样本,却很少对隧道工具本身进行探索。因此,对DNS隧道检测技术研究进行综述。首先,系统阐述DNS隧道的发展历史、研究现状和现有的检测方案,并对过去10年中的检测方案的优缺点进行探讨。其次,对检测方案中常见的dnscat2、Iodine和dns2tcp等6种通信工具进行评估与实验,并公开实验数据。实验结果表明,绝大多数检测方案都没有公开它们的隧道样本数据集或使用隧道工具生成流量时所设定的参数,使这些检测方案很难复现。此外,部分检测方案使用的DNS隧道工具具有明显签名特征,而使用具有签名特征的样本对基于模型的检测方案进行训练将导致模型的泛化能力存疑,即无从得知这一类模型在真实世界中是否具有良好表现。最后,展望相关未来的工作方向。 郑智强 王锐棋 范子静 何发镁 姚叶鹏 汪秋云 姜政伟关键词:隐蔽通信