张文博
- 作品数:3 被引量:0H指数:0
- 供职机构:新疆大学更多>>
- 相关领域:自动化与计算机技术石油与天然气工程天文地球更多>>
- 基于MEGA网络和分层预测的标点恢复方法
- 2024年
- 标点恢复又称标点预测,是指对一段没有标点的文本添加合适的标点,以提高文本的可读性,是一项经典的自然语言处理任务。随着预训练模型的发展和标点恢复研究的深入,标点恢复任务的性能在不断提升。然而,基于Transformer结构的预训练模型在提取长序列输入的局部信息方面存在局限性,不利于最终标点符号的预测。此外,以往的研究将标点标签视为要预测的符号,忽略了不同标点的场景属性和标点间的关系。为了解决这些问题,引入移动平均门控注意力(MEGA)网络作为辅助模块,以增强模型对局部信息的提取能力。同时,构建分层预测模块,充分利用不同标点符号的场景属性和标点间的关系进行最终的分类。使用多种基于Transformer结构的预训练模型在不同语言的数据集上进行实验,在英文标点数据集IWSLT上的实验结果表明,在多数预训练模型上应用MEGA模块和分层预测模块都能获得性能增益,使用DeBERTaV3 xlarge在IWSLT的REF测试集上的F1值达到85.5%,相比于基线提升了1.2个百分点。此外,在中文标点数据集的实验中也取得较高的精度。
- 张文博黄浩吴迪唐敏杰
- 关键词:自然语言处理
- 时间域激发极化法在乌拉斯沟北铜矿区的应用
- 2014年
- 乌拉斯沟位于多金属成矿亚带北侧中部地段莫尤勒特—喇嘛昭金、铁、铜、铅锌多金属矿集区,成矿条件良好。本次工作通过1∶5000的激电中梯扫面,根据极化率和视电阻率的套合情况,并结合地质特征,圈定了W-IP-3、W-IP-2、W-IP-1三个异常靶区,W-IP-3异常区地表发现少量孔雀石,为最有利的成矿靶区,W-IP-2、W-IP-1异常来源不明显,为下一步工作提供理论指导。
- 张文博金璐刘雷
- 关键词:时间域激发极化法找矿意义数据采集
- 车排子地区新近系沙湾组储层与沉积相带关系研究
- 2014年
- 在前人研究的基础上,利用岩芯、薄片等资料以及岩石学粒度分析方法、结合测井相、地震相响应,对车排子地区沙湾组沉积相类型及其特征进行研究发现,区内发育缓坡扇三角洲、浅水辫状河三角洲、冲积扇和滨浅湖四种沉积相类型。碎屑岩成岩作用以压实作用、胶结交代作用以及溶解、溶蚀作用为主,孔隙结构类型划分为大孔粗喉型结构、中孔中喉型结构、小孔细喉型结构、紧密胶结微孔型结构4类。通过对各种孔隙结构类型的参数及储层评价分析认为,区内辫状河三角洲前缘水下分流河道储层最优,扇三角洲平原分流河道储层次之,滨浅湖相滩坝砂体储层略差于前两者。
- 金璐张文博蒋显忠邢浩罗挺
- 关键词:沉积相储层