唐碧霞 作品数:8 被引量:76 H指数:3 供职机构: 中国科学院北京基因组研究所 更多>> 发文基金: 中国科学院战略性先导科技专项 国家高技术研究发展计划 更多>> 相关领域: 生物学 自动化与计算机技术 医药卫生 更多>>
面向国际的生命组学大数据管理体系建设 被引量:4 2016年 组学数据是生命科学研究中的一类极其重要的大数据,特别是二代测序技术的发展推动了组学大数据的爆炸式增长。通过借鉴国际数据中心建设的成功经验,分析国内组学产出数据及数据库建设、数据管理现状及应用需求,构建了面向国际的生命组学大数据管理体系,涵盖组学原始序列归档库、基因组序列数据库、基因表达数据库、基因组变异数据库、DNA甲基化数据库系统等,初步形成中国组学数据资源的存储、共享与应用体系。 赵文明 张思思 唐碧霞 陈婷婷 郝丽丽 桑健 李茹姣 肖景发 章张关键词:大数据 数据共享 生物信息学 基因组 生物多样性保护的多组学数据资源进展——以国家基因组科学数据中心为例 2025年 基因组、转录组、表观组等多组学数据,因含有丰富的生物分子遗传信息,对生物遗传多样性的研究以及生物多样性的保护具有重要意义,但这些不同层面的组学数据不仅数据量大,而且分散在不同的数据资源网站甚至文献中,对数据的获取、共享、再整合利用等带来很大的挑战。为促进生命科学领域多组学数据的快速递交和及时共享,国家基因组科学数据中心(National Genomics Data Center,NGDC)构建了多个基础数据汇交平台。同时,为了充分整合和挖掘已有组学数据资源,构建了多个家养动植物的多组学整合资源库以及知识库。目前,NGDC形成了综合的多组学大数据资源体系,这将对生物多样性保护,包括物种鉴定、濒危物种保护、育种、生境变化监测等起到重要支撑作用。 唐碧霞 唐碧霞 张思思 张陌尘 张思思 王彦青 陈梅丽 田东梅 王彦青 李茹姣 陈梅丽 肖景发 田东梅 章张 鲍一明 李茹姣关键词:生物多样性 数据汇交 GSA-Human:人类遗传资源数据管理的公共系统 被引量:12 2021年 GSA-Human是人类遗传资源数据汇交、存储、管理与共享的数据库系统,可提供人类遗传资源数据的上传、下载、浏览、检索等公共服务,并有效支撑了国家重点研发计划科技项目数据的汇交与管理工作。系统具有符合《中华人民共和国人类遗传资源管理条例》数据安全管理策略,提供公开访问和受控访问相结合的数据使用模式。公开访问数据允许用户自由下载与获取;受控访问数据采用申请-审核的模式,即需要通过数据管理委员会(Data Access Committee,DAC)的授权方可获得下载和使用权限。系统自上线以来,截至2021年7月,汇集数据总量已超5.27 PB。 张思思 张思思 陈婷婷 陈旭 唐碧霞 陈婷婷 董丽莉 朱军伟 孙艳玲 唐碧霞 翟爽 孙玉彬 陈焕新 杜政霖 肖景发 章张 鲍一明 王彦青 陈焕新关键词:数据汇交 数据共享 2019新型冠状病毒信息库 被引量:61 2020年 2019年12月在中国武汉开始爆发的新型肺炎已造成全球25个国家/地区的31516人感染、638人死亡(截止2020年2月7日16时),引起该肺炎的病毒被世界卫生组织命名为2019新型冠状病毒(2019-nCoV)。为促进2019-nCoV数据共享应用并及时向全球公众提供病毒的相关信息,国家生物信息中心(CNCB)/国家基因组科学数据中心(NGDC)建立了2019新型冠状病毒信息库(2019nCoVR,https://bigd.big.ac.cn/ncov)。该信息库整合了来自德国全球流感病毒数据库、美国国家生物技术信息中心、深圳(国家)基因库、国家微生物科学数据中心及CNCB/NGDC等机构公开发布的2019-nCoV核苷酸和蛋白质序列数据、元信息、学术文献、新闻动态、科普文章等信息,开展了不同冠状病毒株的基因组序列变异分析并提供可视化展示。同时,2019nCoVR无缝对接CNCB/NGDC的相关数据库,提供新测序病毒株系的基因组原始测序数据、组装后序列的在线汇交、管理与共享、国际数据库同步发布等数据服务。本文对2019nCoVR数据汇交、管理、发布及使用等进行全面阐述,以方便用户了解该信息库各项功能及数据状况,为加速开展病毒的分类溯源、变异演化、快速检测、药物研发以及新型肺炎的精准预防与治疗等研究提供重要基础。 赵文明 宋述慧 宋述慧 陈梅丽 马利娜 马利娜 李茹姣 李茹姣 郝丽丽 田东梅 田东梅 唐碧霞 王彦青 朱军伟 陈焕新 章张 鲍一明面向生物组学大数据计算的云平台系统及方法 本发明公开了一种面向生物组学大数据计算的云平台系统及方法,涉及用于维护或管理的装置技术领域。所述系统包括系统管理模块、数据管理模块、应用程序管理模块、流程管理模块、任务管理模块、数据可视化操作模块以及用户与权限管理模块。... 唐碧霞 赵文明 朱军伟 王彦青文献传递 系统生物学中多组学综合数据库的设计与实现 系统生物学中多组学综合数据库以建立综合型组学数据库为目标,目前集成了水稻、家鸡、家蚕、流感病毒以及人的dbSNP数据供用户访问。本文结合系统生物学中多组学综合数据库系统的建设过程,详细描述了系统架构设计以及数据库结构设计... 唐碧霞 王彦青 陈旭 庞博 赵文明关键词:系统生物学 系统设计 功能模块 文献传递 面向生物组学大数据计算的云平台系统及方法 本发明公开了一种面向生物组学大数据计算的云平台系统及方法,涉及用于维护或管理的装置技术领域。所述系统包括系统管理模块、数据管理模块、应用程序管理模块、流程管理模块、任务管理模块、数据可视化操作模块以及用户与权限管理模块。... 唐碧霞 赵文明 朱军伟 王彦青基因组可视化工具GBrowse及其应用 基因组可视化工具是生物学领域一个比较重要的数据辅助分析工具,到目前为止,己有许多满足各种不同需求的可视化工具被开发出来并被使用。本文介绍了GBrowse的功能、特点,并结合实际给出了GBrowse在水稻基因组浏览器中的简... 唐碧霞 王彦青 陈旭 庞博 赵文明关键词:基因组 可视化工具 用户体验 文献传递