蒋旭东 作品数:10 被引量:108 H指数:5 供职机构: 清华大学信息科学技术学院计算机科学与技术系 更多>> 发文基金: 国家重点基础研究发展计划 国家自然科学基金 更多>> 相关领域: 自动化与计算机技术 更多>>
改进联机分析处理系统性能的算法与存储结构的研究 该文具体内容包括:1、该文对针对数据仓库及其应用的特点,提出了新的多表连接算法MJoin,相比传统的多表连接处理方法,性能有显著提高;然后又在多表连接算法的基础上,提出了一种新的基于排序的分组聚集算法MuSA,该文在排序... 蒋旭东关键词:数据仓库 联机分析处理 星型模式 基于抽样的Cube占用空间预测算法 被引量:3 2001年 在数据仓库的设计中实物化视图的选择有赖于对cube占用存储空间大小的预测,然而传统的基于数据均匀分布的抽样预测算法不能准确地估计cube的大小。文章介绍了一种利用抽样原理预测cube大小的算法,这种算法能够自适应不同程度的数据倾斜,特别适用于数据倾斜程度较大的情况。实验数据表明,该算法对传统的抽样预测算法有明显的改进效果。 张季 周立柱 蒋旭东 冯建华关键词:CUBE 数据仓库 联机分析处理 数据库 数据仓库查询处理中的一种多表连接算法 被引量:50 2001年 在进行数据仓库的 OLAP( online analytical processing,联机分析处理 )查询处理时 ,经常会涉及到多表连接操作 ,因此 ,提高多表连接的性能就成了数据仓库领域的关键性问题 .基于数据仓库的星型模式 ,给出了一种新的多表连接算法 ( M- Join) .与传统关系数据库管理系统的多表连接查询处理相比 ,该算法充分考虑了数据仓库中的数据本身和多表连接的特点 ,采用对多个表进行一次性连接的方法 ,使得查询的性能有明显的改善 .同时 ,还给出了算法的实验结果和分析 . 蒋旭东 周立柱关键词:数据仓库 OLAP 数据库 数据仓库与数据仓库平台的系统结构与工具的研究 数据仓库技术是在应用的推动下发展起来的,它重新组织遗留系统中的数据,为决策支持系统提供支持.该文对近年来数据仓库技术的研究进行了综述,并在此基础上,给出出一种数据仓库中系统的结构框架.该文着重研究了数据仓库平台中,数据建... 蒋旭东关键词:数据仓库 决策支持 联机分析处理 文献传递 基于分组序号的聚集算法 被引量:14 2003年 联机分析处理OLAP(online analytical processing)查询作为一种复杂查询,当使用SQL(structured query language)语句来表述时,通常都包含多表连接和分组聚集操作,因此提高多表连接和分组聚集计算的性能就成为ROLAP(relational OLAP)查询处理的关键问题.提出一种基于分组序号的聚集算法MuGA(group number based aggregation with multi-table join),该方法充分考虑数据仓库星型模式的特点,将聚集操作和新的多表连接算法MJoin(multi-table join)相结合,使用分组序号进行分组聚集计算,代替通常的排序或者哈希计算,从而有效地减少CPU运算以及磁盘存取的开销.算法的实验数据表明,提出的MuGA算法与传统的关系数据库聚集查询处理方法以及改进后的基于排序的聚集算法相比,性能都有显著提高. 冯建华 蒋旭东 孟宪虎关键词:数据仓库系统 关系数据库 联机分析查询处理中的一种聚集算法 被引量:26 2002年 联机分析处理(online analytical processing,简称OLAP)查询是涉及大量数据的即席复杂查询,从SQL(structured query language)角度来看,这些查询通常都包含多表连接和分组聚集操作.从OLAP查询处理角度出发,提出一种新的基于排序的聚集查询算法MuSA(sort-based aggregation with multi-table join).该方法充分考虑到数据仓库星型模式的特点,将聚集操作和新的多表连接算法MJoin相结合,排序时采用关键字映射技术对排序关键字进行压缩,从而可以显著地提高排序速度.此外,通过预先估计聚集分组的数目,优化选择不同的排序方法,使得算法对不同的分组聚集查询都进行优化.算法实验数据表明,这种聚集查询算法与传统的聚集查询处理方法相比,其性能有显著的提高. 蒋旭东 冯建华 周立柱关键词:数据仓库系统 数据库 联机分析处理 查询 用于数据仓储的一种改进的多维存储结构 被引量:27 2002年 对于数据仓库中数据的物理存储组织,目前主要有关系和多维数组两种方式.这两种方式各有自己的优缺点,从提高联机分析处理(online analytical processing,简称OLAP)查询处理性能的角度出发,多维数组方式相对较优,目的主要是解决数据仓库的多维存储结构问题.针对当前多维数组存储组织方式存在的一些问题,提出了Cube(立方体)逻辑存储和物理存储的概念,首先将原多维数据空间划分为逻辑子空间,逻辑块再划分为多个物理块.在物理存储时充分考虑了多维数组的大容量和高稀疏度的问题,并采用新的多维数组的分布和压缩方法.这些概念和方法有效地解决了维内部层次结构的聚集操作和Cube操作的效率问题,显著提高了涉及维内部层次的聚集查询的响应速度,同时还解决了增量维护的效率问题. 冯建华 蒋旭东 周立柱关键词:数据仓储 多维数组 聚集查询 区域查询 联机分析处理 关系数据库 并行数据仓库的研究 被引量:5 2001年 1 前言
数据仓库技术是在需求的驱动下产生和发展起来的。最初为提高决策支持系统的性能,人们开始尝试对日常事务处理数据库中的原始数据进行加工,而单独形成一个综合的、面向分析、决策的数据组织,即数据仓库,然后在此基础之上构造决策支持系统。 蒋旭东 冯建华 周立柱关键词:并行数据仓库 数据库管理系统 联机事务处理 数据模型 互联网络上多数据库管理系统的可伸缩体系结构 被引量:3 1998年 互联网络上的多数据库系统由联结在网络上的先期存在的多个高度自治的异构数据库组成。研究多数据库系统的根本目的是在保护原有数据库建设投资的前提下,利用网络的基础设施,使这些数据库为整个网络上的用户提供信息服务。达到这一目的的关键是要设计与实现一个具有此功能的多数据库管理系统。在讨论这一需求之后,集中讨论了多数据库管理系统的体系结构问题,提出了一种可伸缩的结构方案。给出了这一方案在中国教育科研网上实现的细节。对体系结构中完成数据库资源管理的管理程序的关键技术进行了较深入的探讨。 周立柱 蒋旭东关键词:多数据库 多线程 元数据 CERNET 面向分析和预测的数据仓库平台设计中的若干问题 分析和预测的数据仓库平台能够有效地利用运作数据(operational data),供决策使用.本文给出了该数据仓库平台的总体框架,介绍了用于数据仓库数据组织的星型模式的特点,并且讨论了数据仓库平台实现的一些技术细节. 蒋旭东 周立柱关键词:数据仓库 星型模式 联机分析处理 数据组织