您的位置: 专家智库 > >

国家自然科学基金(60975034)

作品数:22 被引量:96H指数:5
相关作者:胡学钢张玉红李燕胡春玲姚宏亮更多>>
相关机构:合肥工业大学合肥学院合肥师范学院更多>>
发文基金:国家自然科学基金安徽省自然科学基金国家重点基础研究发展计划更多>>
相关领域:自动化与计算机技术文化科学理学电子电信更多>>

文献类型

  • 22篇中文期刊文章

领域

  • 19篇自动化与计算...
  • 1篇电子电信
  • 1篇文化科学
  • 1篇理学

主题

  • 5篇数据流
  • 3篇数据挖掘
  • 3篇概念漂移
  • 2篇中文
  • 2篇网络
  • 2篇文本分类
  • 2篇聚类
  • 2篇决策树
  • 2篇分类器
  • 2篇贝叶斯
  • 2篇粗糙集
  • 1篇多变量
  • 1篇多任务
  • 1篇信息熵
  • 1篇序列模式挖掘
  • 1篇隐私
  • 1篇隐私保护
  • 1篇邮件
  • 1篇邮件过滤
  • 1篇证据理论

机构

  • 21篇合肥工业大学
  • 2篇合肥学院
  • 2篇合肥师范学院
  • 1篇安徽理工大学
  • 1篇安徽师范大学
  • 1篇宿州学院
  • 1篇皖南医学院

作者

  • 20篇胡学钢
  • 8篇张玉红
  • 2篇谢飞
  • 2篇何伟
  • 2篇姚宏亮
  • 2篇吴共庆
  • 2篇李培培
  • 2篇李燕
  • 2篇胡春玲
  • 1篇潘洁珠
  • 1篇袁暋
  • 1篇周红鹃
  • 1篇梅灿华
  • 1篇方玉成
  • 1篇李慧宗
  • 1篇潘正高
  • 1篇叶明全
  • 1篇杨秋洁
  • 1篇郑锦良
  • 1篇王海平

传媒

  • 6篇合肥工业大学...
  • 3篇计算机工程
  • 3篇计算机科学
  • 1篇情报科学
  • 1篇中国科学技术...
  • 1篇计算机研究与...
  • 1篇模式识别与人...
  • 1篇南京大学学报...
  • 1篇小型微型计算...
  • 1篇计算机系统应...
  • 1篇电子测量与仪...
  • 1篇浙江大学学报...
  • 1篇山东大学学报...

年份

  • 1篇2014
  • 5篇2013
  • 2篇2012
  • 7篇2011
  • 6篇2010
  • 1篇2009
22 条 记 录,以下是 1-10
排序方式:
基于规则和统计相结合的中文命名实体识别研究被引量:34
2012年
介绍命名实体识别在文本信息处理领域的重要地位,分析了中文命名实体识别存在的困难,介绍中文命名实体识别的一般过程、评价标准及方法。提出了一种在构造内部规则和外部规则的同时采用概率统计的中文命名实体的识别方法,并利用这种基于规则和统计相结合的方法。实验证明该方法获得了较高的准确率和召回率,具有可行性和合理性,同时也指出了它的局限性。
潘正高
关键词:文本特征中文命名实体
一种改进的二分网络链路预测算法被引量:1
2014年
针对二分网络图中基于链路预测的ILP算法在投影过程中只采用了底部节点,从而导致网络拓扑信息利用不充分的问题,文章提出改进的ILPExt算法,将顶部投影信息和底部投影信息结合起来,根据二部图的底部节点和顶部节点分别生成底部投影图和顶部投影图,然后在2个投影图中分别找出顶部节点和底部节点的内部链边集,并进行合并,得到预测链路的边集。实验结果表明,改进的ILPExt算法比ILP算法能够找出更多的链路预测边,并且提高了召回率。
马吴迪胡学钢何伟
关键词:链路预测复杂网络
基于蜕变关系的聚类程序测试方法被引量:4
2011年
数据挖掘技术在计算机系统中的应用越来越广泛,对其软件做质量保证的测试势必日益受到重视。然而,传统的测试方法难以适应数据挖掘领域,因为其应用程序存在"oracle"问题。基于蜕变测试技术,提出数据挖掘领域的软件评测方法,并以一个聚类算法为具体案例展开研究分析,构造了一系列蜕变关系。实验表明,此方法不仅能达到核查程序正确性的目的,还可揭示算法的适用性。并且,此方法具有推广到其他领域的可行性。
张晶胡学钢张斌
关键词:数据挖掘聚类
垂直划分多决策表下基于条件信息熵的隐私保护属性约简被引量:2
2010年
针对垂直划分多决策表,利用半可信第三方和交换加密体制,设计了一个安全多方计算交集基数协议。利用该协议设计了安全多方计算信息熵和安全多方计算条件信息熵的解决方案,提出了一种基于条件信息熵的隐私保护属性约简算法。该算法基于粗糙集信息观的约简理论实现了分布式环境下全局属性约简的求解,使各参与方在不共享其隐私信息的前提下达到集中式属性约简的效果。分析结果表明该算法是有效可行的。
叶明全胡学钢伍长荣
关键词:属性约简隐私保护安全多方计算粗糙集条件信息熵
D-S证据理论在决策支持系统中的应用被引量:9
2010年
D-S证据理论提供了一种解决多数据源不确定信息推理和融合的有效方法。证据理论能够对各自独立的证据加以综合给出一致性结果,并能处理具有模糊和不确定信息的合成问题,最终达到信息互补。与其他推理方法相比更符合人类思维决策过程。为此,提出一种基于D-S证据理论的灾害决策支持方法,并根据试验结果验证了该方法的有效性和可行性。
刘晓光胡学钢
关键词:D-S证据理论数据融合不确定性决策支持系统
基于Logistic回归分析的直推式迁移学习被引量:4
2010年
传统的机器学习方法基于一个基本的假设:训练数据和测试数据遵循相同的分布。然而,在许多现实的应用中,这种假设并不能够被保证。在这种情况下,传统的机器学习方法因没有意识到分布的改变而可能失败。近年来,迁移学习技术被专门用来解决这一缺陷。文章提出了一种叫做TTLR的方法,将原始领域中的训练数据有效地迁移到目标领域中,该方法首先对Logistic回归分析模型进行扩展,然后利用不同领域概率分布之间的差异性,调节训练数据中每个实例的权重,从而使得训练得到的分类器更加适应于目标领域;在所选取的数据集上得到的实验结果表明,与传统的监督式学习方法相比,所提出的方法有很大的优势。
胡学钢方玉成张玉红
关键词:LOGISTIC回归分析
基于C4.5和NB混合模型的数据流分类算法被引量:9
2010年
具有概念漂移的含噪数据流的分类问题成为数据流挖掘领域研究的热点之一。提出了一种基于C4.5和Nave Bayes混合模型的数据流分类算法CDSMM。它以C4.5作为基分类器,采用朴素贝叶斯分类器过滤噪音,同时引入假设检验中的μ检验方法检测概念漂移,动态更新模型。实验结果表明,CDSMM算法在处理带有噪音的概念漂移数据流时具有比同类算法更好的分类正确率。
李燕张玉红胡学钢
关键词:数据流概念漂移
基于张量空间模型的中文文本分类被引量:2
2010年
针对传统的基于向量的中文文本表示方法预处理过程比较复杂,应用于高维数据容易产生维数灾难的局限性,文章提出了一种基于张量空间模型的中文文本分类方法,用三阶张量表示文本集,将基于向量的kNN分类器扩展到张量上以构建分类器。该方法简化了预处理过程,提高了准确率,并使得更多张量学习方法能够在中文文本分类中得以应用。实验证明其具有较高的分类准确率,有一定的实用价值。
何伟胡学钢谢飞
关键词:文本分类
基于小样本学习的垃圾邮件过滤方法被引量:2
2010年
针对客户端垃圾邮件过滤器难以获取足够训练样本的问题,提出一种基于小样本学习的垃圾邮件过滤方法,利用容易获取的未标记样本提高垃圾邮件过滤的性能。该方法使用已标记的小样本邮件实例集训练一个初始Na?veBayes分类器,以此标注未标记邮件,再使用所有数据训练新的分类器,利用EM算法进行迭代直至收敛。实验结果证明,当给定5个~20个已标记小样本训练邮件时,该方法可有效提高垃圾邮件过滤性能。
潘洁珠周晓吴共庆胡学钢
关键词:EM算法垃圾邮件过滤
基于后验概率制导的B-KNN文本分类方法被引量:1
2011年
针对K最近邻(KNN)方法分类准确率高但分类效率较低的特点,提出基于后验概率制导的贝叶斯K最近邻(B-KNN)方法。利用测试文本的后验概率信息对训练集多路静态搜索树进行剪枝,在被压缩的候选类型空间内查找样本的K个最近邻,从而在保证分类准确率的同时提高KNN方法的效率。实验结果表明,与KNN相比,B-KNN的性能有较大提升,更适用于具有较深层次类型空间的文本分类应用。
周红鹃祖永亮
关键词:文本分类后验概率贝叶斯分类器
共3页<123>
聚类工具0