高倩
- 作品数:16 被引量:39H指数:4
- 供职机构:山西医科大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:医药卫生理学文化科学自动化与计算机技术更多>>
- 基于LASSO的FDR控制方法及其在高维数据生存分析中的应用被引量:5
- 2018年
- 目的基于LASSO-Cox模型探索交叉验证(cross validation)、pcvl法(penalized cross-validated log-likelihood)、EBIC准则(extended bayesian information criterion)、平稳选择(stability selection)四种方法在控制FDR(false discovery rate)方面的表现及其变量选择效果。方法通过模拟研究评价各方法在不同删失比例、自变量间不同相关程度以及回归系数的不同稀疏水平下的FDR和PSR(positive select rate),并从GEO上下载DLBCL数据进行基因与预后间的关联分析。结果模拟结果表明,在不同删失比例、自变量相关程度和稀疏水平的情况下,平稳选择法控制FDR的能力都优于其他方法且其变量选择效能也较高。EBIC准则在相关程度低、自变量较稀疏时表现较好,当样本量较小时结果较保守。pcvl法虽然不容易漏掉有效应的变量,但其FDR仍较高。实例结果显示,EBIC准则只选出1个基因,平稳选择法选出的基因中大部分有统计学意义且与其他方法的结果重合度高。结论在基于LASSO-Cox模型的高维数据生存分析中平稳选择法能较好地控制FDR且其变量选择效能也较高。
- 许树红董晓强陶然高雪高倩高倩王彤
- 体重指数在同煤集团职工打鼾与代谢综合征关系中的中介效应被引量:2
- 2018年
- 目的研究在山西大同煤矿集团职工中打鼾对代谢综合征(MS)的影响,并探讨体重指数(BMI)在打鼾与MS关联中的中介作用。方法选择3 794名大同煤矿集团职工为研究对象,调查其一般情况并测量身高、体重、腰围、血压以及MS相关生化指标。用Logistic回归模型在井上井下2个亚组中分析打鼾与MS的关联;并用中介效应模型分析BMI在打鼾与MS关系中BMI的中介效应。结果井上和井下职工中,打鼾者患MS的风险均较高。OR值分别为:1.40(1.11,1.76)和1.60(1.29,2.02)。BMI对打鼾与MS的中介效应有统计学意义(中介效应值为9.55,P<0.01)。中介效应百分比为20.53%。结论同煤集团职工中,打鼾是MS的危险因素,BMI在打鼾与MS的关系中起部分中介作用。
- 李艳艳高倩申亚男王慧黄建军孙晨明虞明星王彤
- 关键词:打鼾代谢综合征BMI中介效应
- 基于group LASSO的高维广义倾向性评分方法
- 本发明为一种基于group LASSO的高维广义倾向性评分方法,属于生物技术和数据分析技术领域。本发明首先借用GLiDeR的思想构建结局自适应group LASSO实现变量选择;随后使用npCBGPS方法计算均衡权重,并...
- 高倩王彤
- PDE4B基因过表达对弥漫大B细胞淋巴瘤患者的预后价值被引量:7
- 2017年
- 目的探讨磷酸二酯酶4B(phosphdiesterase 4B,PDE4B)基因过表达对弥漫大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)患者预后的影响,并分析其预后价值。方法从GEO(gene expression omnibus)数据库获得320例DLBCL患者的基因芯片数据,比较PDE4B基因过表达与正常表达患者生存率的差异。构建单变量国际预后指数(international prognostic index,IPI)、PDE4B和多变量(IPI+PDE4B)Cox比例风险模型,并用时点/动态受试者工作曲线(receiver operating characteristic curves,ROC)法分析模型的预测能力随时间的变化趋势,一致性统计量C用于评价和比较各模型的预测准确度。结果 PDE4B基因过表达的患者死亡的风险是正常表达的1.431倍(HR=1.431,95%CI:1.013~2.002,P=0.042)。多变量模型的C统计量与单变量模型相比,差异有统计学意义(IPI vs.IPI+PDE4B:Z=15.0,P<0.001;PDE4B vs.IPI+PDE4B:Z=53.7,P<0.001)。结论 PDE4B基因过表达是DLBCL患者预后的危险因素,结合IPI和PDE4B基因能提高DLBCL的预后准确性。
- 高倩李艳艳申亚男虞明星李璐郗彦凤王彤
- 关键词:基因表达预后
- 医学研究中交互作用综述被引量:5
- 2020年
- 随着个体化治疗和精准医学的兴起,如何从广泛群体中发现不同亚人群的异质性是现代医学的终极问题和目标,由此开展更有针对性的精准预防和治疗可以得到更大的成本效益。解决此问题的出发点就是寻找病因学和人群健康效应异质性的原因,从统计学的角度看解决此类问题的方法之一就是寻找交互作用,以确定对不同卫生干预措施有显著健康收益的亚组[1-3]。医学研究中交互作用研究的结局通常是二分类变量,如疾病或某个事件是否发生。
- 王慧高雪高倩李艳艳和思敏余红梅王彤
- 关键词:个体化治疗病因学
- 基于高维自变量的广义倾向性评分方法研究与应用
- 目的: 观察性研究或非随机对照研究中常使用倾向性评分(PropensityScore,PS)法校正已测量混杂变量带来的偏倚以期实现因果关联分析。为了识别出感兴趣暴露/处理因素与结局变量间的因果性并得到处理效应的无偏估计...
- 高倩
- 关键词:因果推断
- 文献传递
- 基于non-local先验的贝叶斯变量选择方法及其在高维数据分析中的应用
- 2020年
- 目的对高维数据进行变量筛选并构建预测模型是组学数据分析的研究热点之一。本研究旨在为结局为二分类变量的高维组学数据筛选自变量并构建预测结局的稀疏统计模型。方法本研究通过模拟研究和实例分析阐释基于non-local先验的贝叶斯变量选择方法--乘积逆矩先验(product inverse moment,piMOM)相较于惩罚类方法ISIS-光滑平切绝对偏差(iterative sure independence screening-smoothly clipped absolute deviation,ISIS-SCAD)和ISIS-最小最大凹惩罚(iterative sure independence screening-minimax concave penalty,ISIS-MCP)在高维数据中变量筛选及其预测效果的性能优劣。结果模拟研究发现:在高维的情况下,经piMOM、ISIS-SCAD和ISIS-MCP方法筛选所得变量的平均真阳性数和受试者工作特征曲线下面积(AUC,area under curve)基本相等,ISIS-SCAD、ISIS-MCP的平均假阳性数、回归系数均方误差以及预测均方误差明显高于基于non-local先验的贝叶斯变量方法所获得的对应值。piMOM方法分析弥漫大B细胞淋巴瘤实例数据共识别5个有意义的基因,AUC为0.996;ISIS-SCAD识别7个基因,AUC为0.975;ISIS-MCP识别7个基因,AUC为0.968。结论在模型选择相合性和预测准确性方面,piMOM方法与ISIS-SCAD和ISIS-MCP相比,具有优势,在一定意义上可有效控制假阳性率。
- 马金沙董晓强高倩陶然许树红李艳艳王彤
- 关键词:高维数据弥漫性大B细胞淋巴瘤
- 弥漫性大B细胞淋巴瘤预后相关microRNA筛选及其预后价值被引量:4
- 2019年
- 目的识别与弥漫性大B细胞淋巴瘤(diffuse large B-cell lymphoma,DLBCL)预后相关的microRNA,并结合临床数据评估其预后价值。方法从GEO (gene expression omnibus)数据库中获取116例DLBCL患者的Micro RNA表达谱数据与临床数据。采用lasso-logistic回归模型识别与DLBCL预后相关的miRNAs,卡方和Fisher确切概率检验筛选与DLBCL患者总生存期(overall survival,OS)相关的临床指标,再利用logistic逐步回归法筛选出预测因子并构建其单因素及多因素Cox比例风险模型。采用时依ROC (time-dependent receiver operating characteristic)曲线评价各模型的预测能力,各模型预测准确性用一致性统计量C评价。结果 Hsa-miR-23a (HR=0.20, 95%CI:0.10~0.39, P<0.001)和hsa-miR-566 (HR=6.69, 95%CI:2.40~18.65, P<0.001)与DLBCL患者的OS相关。单因素Cox回归模型与多因素Cox回归模型相比,C统计量差异具有统计学意义(IPI与IPI+hsa-miR-23a+hsa-miR-566:Z=36.2, P<0.001, hsa-miR-23a+hsa-miR-566与IPI+hsa-miR-23a+hsa-miR-566:Z=7.0, P<0.001)。结论 Hsa-miR-23a高表达是DLBCL患者预后的保护因素,hsa-miR-566高表达是DLBCL患者预后的危险因素,IPI、Hsa-miR-23a和hsa-miR-566这3个指标联合建模可提高DLBCL患者5年生存预测的准确性。
- 孙鹤立阙喜妹高倩王彤
- 关键词:弥漫性大B细胞淋巴瘤预后
- 高维情况下基于倾向性评分的因果推断方法被引量:2
- 2021年
- 目的观察性研究中使用倾向性评分法估计因果效应依赖于不存在未测量混杂假设。随着大数据时代的到来,越来越多的处理前协变量可被测量并纳入分析中,使得这一假设更合理,但同时也导致标准的倾向性评分法不再适用,这就促使了高维情况下因果推断方法的发展。本研究对现有的高维情况下基于倾向性评分的因果推断方法进行概述,为实际应用提供参考依据。方法从变量选择和协变量组间均衡性两个角度出发,对现有方法做归类和总结,系统回顾各方法的基本原理、方法步骤及优缺点等。结果基于变量选择的方法可分为Screening、惩罚和贝叶斯三类;基于均衡性的方法有明确的机制确保协变量的组间均衡性。结论实际应用中研究者应根据自身数据特点结合各方法的优缺点选择合适的方法进行分析,从而得到一致有效的因果效应估计量。
- 高倩王彤
- 关键词:高维数据因果推断
- 倾向性评分模型估计二分类处理因果效应的方法
- 2023年
- 目的对倾向性评分(propensity score,PS)模型估计二分类处理因果效应的方法进行概述,以期为相关研究提供参考。方法从PS模型的优化和协变量组间均衡性两个角度对现有方法进行梳理,对各方法的基本原理、适用条件、优缺点等归纳总结。结果基于模型类的方法通过优化估计处理分配机制的模型,以得到更好均衡组间协变量分布的PS;基于均衡类的方法在协变量组间均衡性约束条件下估计PS或直接估计权重。结论研究者在实际应用中可根据不同方法的适用条件及优缺点选择合适的方法进行分析。
- 王文杰王文杰高倩
- 关键词:因果效应