顾海杰
- 作品数:4 被引量:34H指数:2
- 供职机构:浙江大学更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 数据驱动方法在流程工业中的应用命题综述被引量:4
- 2009年
- 相对于具体技术方案,数据驱动方法在工业应用取得成功首先取决于应用命题本身。从流程工业应用的角度,对涉及数据驱动方法的应用命题进行了提炼和分类,并用典型的例子和文献将这些类别的应用命题具体化,包括应用命题背景、目标的简单描述和数据驱动方法在解决这些命题时所担负的角色。同时,还对数据驱动方法的流程工业应用研究做了展望,提出了数据完备性问题。
- 顾海杰荣冈
- 关键词:数据挖掘
- 数据库中动态关联规则的挖掘被引量:28
- 2007年
- 关联规则能挖掘变量间的相互依赖关系,但是不能反映规则本身的变化规律.为此本文提出了动态关联规则.首先将整个待挖掘数据集按时间划分成若干子集,每个子集挖掘得到的每条规则分别生成一个支持度和一个置信度,这样每条规则在全集上就对应了一个支持度向量和一个置信度向量.通过分析支持度向量和置信度向量,不仅可以发现规则随时间变化的情况,也能够预测规则的发展趋势.本文还提出了两个挖掘动态关联规则的算法,且对他们做了比较.并给出了柱状图和时间序列两种方法分析这两个向量.最后给出了一个挖掘动态关联规则的应用实例。
- 荣冈刘进锋顾海杰
- 关键词:动态关联规则关联规则柱状图时间序列
- 不确定性条件下炼油厂供应链优化问题研究
- 由于现实中不确定性广泛存在于供应链的各个环节,因此研究不确定性条件下的供应链决策问题以及由此衍生的不确定性评估和分析问题对供应链管理理论研究和实际应用都意义重大。本文在综述了炼油厂供应链管理研究现状的基础上,对炼油厂在需...
- 顾海杰
- 关键词:供应链管理炼油厂不确定性数据分析
- 文献传递
- 度量空间中基于距离孤立点的快速挖掘被引量:2
- 2009年
- 将数据点的k最近邻(k-NN)距离作为孤立程度指标能够有效地发现数据集中的孤立点,但是基本算法需要O(N2)次数据点间的距离计算,不适用于大数据集.为此提出了一种利用度量空间中三角不等式的快速挖掘算法———提前修剪(ADVP).ADVP利用每次k-NN查询中保存的近邻点到被查询点的距离计算出近邻点的孤立程度上界.孤立程度上界小于已发现最弱孤立点的孤立程度的数据点可被修剪而无须进行k-NN查询.基于抽样方法优化了搜索次序以提高修剪效果.同时将ADVP自然地扩展为增量式算法.在标准大数据集上的实验结果表明,ADVP和现有算法相比明显节省了计算开销,具有更好的伸缩性;增量式ADVP能够有效地处理新增数据.
- 邵纪东荣冈顾海杰
- 关键词:度量空间增量式挖掘伸缩性