陈世敏 作品数:19 被引量:54 H指数:3 供职机构: 中国科学院计算技术研究所 更多>> 发文基金: 中国科学院“百人计划” 国家自然科学基金 国家自然科学基金创新研究群体项目 更多>> 相关领域: 自动化与计算机技术 文化科学 更多>>
基于NVM主存的数据索引方法及数据处理系统 本发明公开了一种基于NVM的数据索引方法,包括:于NVM主存设置树状索引结构的叶子节点;将新增数据写入叶子节点时,判断叶子节点是否存在空闲索引项,若存在,则进行数据写入操作,反之则进行并完成节点分裂操作后再进行数据写入操... 陈世敏 刘霁航文献传递 一种JSON数据的语法树提取方法 本发明提供一种JSON数据的语法树提取方法,包括:对给定的数据集中的JSON数据进行采样,记录JSON记录结构树;遍历所有的JSON记录结构树以累加生成一个统计结构树;遍历统计结构树中每个节点的计数器,将JSON记录中的... 陈世敏 王智义 祁琦文献传递 一种树状结构数据处理方法及系统 本发明提出一种树状结构数据处理方法及系统(System for TrEE structured Data,STEED),涉及数据处理技术领域,该系统支持读取文本数据,并将其解析为行式或者列式的二进制格式数据,其中在解析的... 陈世敏 王智义一种利用简单路径特征优化树状结构数据的方法及系统 本发明提出利用简单路径特征优化的树状结构数据处理方法及系统,该方法包括步骤1,设置简单路径,其中所述简单路径为在数据定义的语法树中,从根节点到叶子节点最多只存在一个多值的域的路径;步骤2,通过在扁平行式结构数据中存储所述... 陈世敏 王智义大数据分析与高速数据更新 被引量:46 2015年 大数据对于数据管理系统平台的主要挑战可以归纳为volume(数据量大)、velocity(数据的产生、获取和更新速度快)和variety(数据种类繁多)3个方面.针对大数据分析系统,尝试解读velocity的重要性和探讨如何应对velocity的挑战.首先比较事物处理、数据流、与数据分析系统对velocity的不同要求.然后从数据更新与大数据分析系统相互关系的角度出发,讨论两项近期的研究工作:1)MaSM,在数据仓库系统中支持在线数据更新;2)LogKV,在日志处理系统中支持高速流入的日志数据和高效的基于时间窗口的连接操作.通过分析比较发现,存储数据更新只是最基本的要求,更重要的是应该把大数据的从更新到分析作为数据的整个生命周期,进行综合考虑和优化,根据大数据分析的特点,优化高速数据更新的数据组织和数据分布方式,从而保证甚至提高数据分析运算的效率. 陈世敏关键词:数据更新 数据仓库 面向混合DRAM-NVM主存的联机事务型数据库系统 本发明提出一种面向混合DRAM‑NVM主存的联机事务型数据库系统,包括:用于缓存数据的DRAM和用于持久存储数据的NVM;NVM通过第一数据表记录NVM中存储的多个数据元组,用于事务处理并发控制的元信息仅保存在DRAM中... 陈世敏 刘刚 陈乐滢一种面向混合主存优化的基于外存的分析型数据库系统 本发明公开了一种面向混合主存优化的基于外存的分析型数据库系统,该系统采用持久性内存NVM和易失性内存DRAM的混合主存存储结构,包括:Buffer单元,配置为用于数据缓存,该Buffer单元又包含:第一缓存模块,配置为用... 陈世敏 黄子淳一种JSON数据的语法树提取方法 本发明提供一种JSON数据的语法树提取方法,包括:对给定的数据集中的JSON数据进行采样,记录JSON记录结构树;遍历所有的JSON记录结构树以累加生成一个统计结构树;遍历统计结构树中每个节点的计数器,将JSON记录中的... 陈世敏 王智义 祁琦文献传递 基于NVM主存的数据索引方法及数据处理系统 本发明公开了一种基于NVM的数据索引方法,包括:于NVM主存设置树状索引结构的叶子节点;将新增数据写入叶子节点时,判断叶子节点是否存在空闲索引项,若存在,则进行数据写入操作,反之则进行并完成节点分裂操作后再进行数据写入操... 陈世敏 刘霁航前言 被引量:1 2018年 数据特性和硬件特征是高效数据管理的两个关键因素.一方面,随着大数据时代的到来,数据管理系统需要支持越来越海量、高速、多样的数据.各种新的数据管理技术纷纷涌现,不仅包括对传统的关系型数据库系统的扩展,而且包括多种新型的大数据系统,例如N oS Q L系统、N ew SQ L系统等.数据的种类不仅有传统的关系型数据,而且有图类型、J S O N树状数据等多种非传统数据类型.另一方面,计算机系统的硬件正在经历着深远的变化.更大容量的主存、N V M技术等正改变着存储系统的面貌.GPU、FPGA、专用加速硬件正逐渐由专用领域走向通用计算,对数据的运算和管理发挥着越来越重要的影响.因此,如何把这两者相结合,利用新型的存储和计算硬件高效地支持数据管理的需求成为一个重要的学术课题.许多基本问题还有待探索,包括系统架构、数据存储、索引、查询处理、能源效率等. 孟小峰 陈世敏 罗琼关键词:关系型数据库系统 数据管理系统 数据管理技术 数据类型 数据特性 数据系统