孙蕾 作品数:16 被引量:57 H指数:5 供职机构: 华东师范大学信息科学技术学院计算机科学技术系 更多>> 发文基金: 国家自然科学基金 上海市自然科学基金 国家教育部“985工程” 更多>> 相关领域: 自动化与计算机技术 交通运输工程 更多>>
关联规则下数据挖掘可视化技术的探讨与实现 被引量:7 2010年 随着数据挖掘技术的不断发展以及数据挖掘工具应用的日益深入,数据挖掘可视化技术已成为数据挖掘领域新兴的研究热点之一。本文首先探讨数据挖掘可视化技术的主流发展趋势;然后基于Netbeans 6.1开发平台,采用Java、JFreeChart等开发技术,结合PMML标准,完成关联规则下的数据挖掘可视化技术的设计与实施。实践表明:所完成的工作能够将关联规则下的数据挖掘过程以可视化的元素展示给参与数据挖掘的用户,让用户能够对挖掘结果进行有效评估。 施惠娟 孙蕾 李由关键词:数据挖掘 关联规则 可视化 PMML 基于改进的隐马尔可夫模型在网页信息抽取中的研究与应用 被引量:11 2017年 信息抽取是从大量的数据中准确、快速地获取目标信息,提高信息的利用率。考虑网页数据的特点,提出一种适用于网页信息抽取改进的隐马尔科夫模型(HMM),即结合最大熵模型(ME)在特征知识表示方面的优势,在HMM模型中加入后向依赖,利用发射单元特征来调整模型参数。改进后的HMM状态转移概率和观察输出概率不仅依赖于模型的当前状态值,而且可以以模型的前向状态值和后向特征值加以修正。实验结果表明,使用改进后的HMM模型应用到网页信息抽取中,可以有效地提高网页信息抽取的质量。 双哲 孙蕾关键词:隐马尔可夫模型 最大熵模型 网页信息抽取 基于列存储机制下多维数据仓库模型的优化与研究 被引量:3 2017年 通过对分布式列存储机制下多维数据仓库模型的研究,考虑到多维数据仓库模型上的关联和聚集操作常常会引入大量的数据迁移,提出一种有效的列存储机制下多维数据仓库模型的优化方法即结合层次编码技术。采用维表层次全局域编码和维表层次局部域编码相结合的方式对传统星型模型维表中的层次信息进行二进制编码整合,将维表的层次信息压缩进事实表形成无连接星型模型,并针对新模型下的数据特征提出一种复合压缩策略,以期减少分布式列存储机制下的OLAP操作引入的数据迁移并降低数据存储空间,提升系统的查询性能。实验结果表明,该优化方法是可行且有效的。 徐晓锦 孙蕾关键词:数据仓库 OLAP 数据压缩 基于进化编程的分类方法研究与应用 2009年 随着人们生产和搜集数据的能力大幅度提高,迫切需要找到从现有数据库系统/广域网的大量数据中提取知识的手段。因此产生了基于数据库与数据仓库系统的数据挖掘方法与技术,其中分类是数据挖掘中一个重要的分析过程。文中阐述了数据挖掘的相关概念、方法,并介绍了遗传编程相关理论,提出了基于进化编程的分类算法,将遗传编程的思想运用于数据挖掘的分类方法中,最后,结合实例给出了实验数据。 俞乐克 孙蕾关键词:数据挖掘 遗传编程 如何获得对需求的理解——CMMI需求管理过程域之特殊实践 被引量:3 2008年 虽然国内不少软件企业通过了CMMI某个等级的评估,但其实施过程流于形式的居多,原因是不少企业没有准确和深刻理解CMMI的精神实质,也缺乏这方面理论和实践相结合的研究和指导。"获得对需求的理解"是CMMI需求管理过程域的第一个特殊实践,对该特殊实践精神内涵的剖析及其对实践的指导意义的研究,对于软件开发中的需求管理具有重要的意义。 周汉平 孙蕾关键词:CMMI 需求管理 基于R树的空间数据索引技术的探索 被引量:5 2008年 目前,基于空间数据库管理系统的空间数据索引技术的研究与应用正不断地兴起,且日趋成熟。分析经典的空间数据索引技术R-树和R*-树的优势与特点,在R*-树索引结构的基础上融合了传统的四叉树索引方法的精髓,提出了一种改进的R*-树索引技术—即R*Q-树索引方法。设计并实现了R*Q-树索引方法中索引构造算法的主要改进部分,并采用大量的随机实验数据验证了改进算法对提高空间数据索引效率的有效贡献。 蔡浴泓 孙蕾关键词:空间数据库 多维数据库模式下联机数据分析技术的实施 被引量:1 2010年 随着社会的发展和技术的进步,越来越多的领域和企业组织都需要处理并分析其已有的海量数据和信息。基于目前数据库技术的日趋成熟与相应的数据仓库技术的不断兴起,提出了一个基于多维数据库模式的联机数据分析技术的原型平台解决方案,即侧重于多维数据库存储模式的实现和该存储模式下的联机数据分析功能的设计两方面,完成了该原型平台的设计与实现。文中主要研讨了该原型平台的开发过程中所涉及的重点以及难点技术问题,并最终将该原型平台应用并满足某信息系统的实际联机数据分析的需求,从而验证了该原型平台的相关功能的实用性和有效性。 林智超 孙蕾关键词:数据存储模式 数据仓库 Web挖掘在VOD服务器中的应用研究 被引量:1 2007年 网络的迅速发展使得视频点播系统的应用几乎无处不在,但如何能充分利用有限资源发挥其最大功效并为用户提供尽可能完备的服务是一个难题.本文从VOD服务器日志出发利用Web挖掘技术研究并实现了一系列管理和提高VOD系统服务质量的方法. 翁小兰 孙蕾关键词:VOD 数据预处理 会话识别 向量空间模型 基于SOA的数据挖掘原型平台的设计与实现 被引量:5 2011年 针对各类中小型企业在经营管理和决策制定过程中所提出的信息管理分析与辅助决策的实际需求,考虑到目前信息系统领域中已有的商用数据挖掘软件/工具中普遍存在的功能耦合性强、资源共享度低和可扩展性弱等问题,结合面向服务的系统体系架构SOA(Service-Oriented Architecture)的开放性、复用性、自治性和平台无关性等特点,提出了基于SOA的数据挖掘原型平台的设计和实现方案。基于Open ESB(Enterprise Service Bus,简称ESB)开发平台来构建系统的功能架构,完成其相应的主要服务组件/功能部件的研制工作。 韩璐 孙蕾 施惠娟 李由关键词:数据挖掘 SOA OPEN ESB 基于WEB日志挖掘优化VOD系统中影片的归类 2007年 提出一种从Web日志出发根据用户访问路径找出用户期望的影片归类的方法,通过该方法可以优化视频点播系统的站点结构,提高用户访问效率。算法的主要思想是基于Web日志统计出用户在查找目标影片过程中经过的类别页,并把这些类别页对应的类别作为用户的候选期望归类,最后根据影片各类别的期望支持度确定影片的恰当归类。 翁小兰 孙蕾关键词:VOD 网络日志