马博
- 作品数:82 被引量:144H指数:7
- 供职机构:中国科学院新疆理化技术研究所更多>>
- 发文基金:中国科学院西部之光基金国家自然科学基金新疆维吾尔自治区重点实验室开放课题基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信语言文字更多>>
- 基于注意力机制多特征融合的虚假信息检测方法、装置、电子设备及存储介质
- 本发明公开了一种基于注意力机制多特征融合的虚信息检测方法、装置、电子设备及存储介质,获取微博和推特数据集,对所述微博和推特数据集中文本和图片进行预处理;将预处理得到的文本数据输入到BERT预训练模型中获取语义信息提取文本...
- 马博地力夏提·阿布都热依木杨雅婷王磊周喜董瑞
- 文献传递
- 一种小样本槽值提取方法、装置、设备及存储介质
- 本发明公开了一种小样本槽值提取方法、装置、设备及存储介质,该方法获取槽值提取数据集,对数据集进行处理,构建小样本槽值提取数据集;利用辅助集上的全部数据,训练基础领域上的槽值提取模型,获得历史信息编码器;将生成的历史信息特...
- 周喜杨奉毅杨雅婷马博董瑞艾比布拉·阿塔伍拉
- 基于汉语关键词的维吾尔语关键词生成方法、装置、电子设备及存储介质
- 本发明公开了一种基于汉语关键词的维吾尔语关键词生成方法、装置、电子设备及存储介质,涉及信息处理领域,尤其涉及文本过滤、内容监管领域。具体实现方案为:利用汉维双语将汉语关键词翻译为维吾尔语关键词;对获得的维吾尔语关键词进行...
- 杨雅婷艾孜麦提·艾尼瓦尔董瑞马博王磊周喜
- 文献传递
- 融合词对齐适配器模块的跨语言文本表示方法、装置、设备及存储介质
- 本发明公开了一种融合词对齐适配器模块的跨语言文本表示方法、装置、设备及存储介质,涉及人工智能、自然语言处理、文本建模等技术领域。具体实现方案为:构建源语言‑目标语言平行语料数据集,通过无监督词对齐算法对平行语句构建词对齐...
- 杨雅婷艾合塔木江·艾合麦提王磊马博董瑞周喜
- 多任务增强的文本生成式事件要素抽取方法
- 2025年
- 事件要素抽取旨在从非结构化文本中抽取结构化的事件数据,为下游任务提供结构化输入。近年来,许多研究采用预训练语言模型加提示学习的方式实现事件要素抽取,以模板槽位填空的形式完成该任务。然而,以往的研究主要采用单模板单任务的方法,但单一模板难以很好地捕捉事件要素实体间的结构依赖关系,其设计质量会影响最终的抽取结果;并且忽视了在进行多任务学习时,相似任务之间的促进作用。因此,设计了一种基于多任务增强的文本生成式事件要素抽取方法。具体地,分别构建了多模板指令增强任务模块与跨任务协同增强任务模块,以生成式模型作为共享主干网络,多种任务统一训练实现知识高效共享。该方法通过不同模板的指令增强,加强额外语义约束,提高了模型对指令的理解能力,通过跨任务的协同增强,使模型通过不同任务的互相监督,提高了模型对事件文本的理解分析能力。在ACE05数据集和RAMS数据集上的全样本实验中,该方法的Arg-C值分别达到了74.1%和52.4%,达到了最优水平。同时具有优异的少样本性能,在少样本场景下实验,仅需一半的数据量就可以达到阅读理解方法的抽取效果。
- 史张龙周喜王震周喜杨雅婷
- 关键词:信息抽取多任务学习自然语言处理
- 基于transformer的场景图像文字修改方法、装置、电子设备及存储介质
- 本发明公开了一种基于transformer的场景图像文字修改方法、装置、设备以及存储介质,利用基于深度卷积神经网络的编码器和解码器,对原始风格图像进行前景风格特征提取,将其文字字体,字体颜色,文字形状等前景风格迁移到目标...
- 艾孜麦提·艾尼瓦尔杨雅婷马博董瑞王磊周喜
- 面向连续时空加油数据的异常检测方法
- 本发明涉及一种面向连续时空加油数据的异常检测方法,该方法涉及面向多个加油站的实时采集数据,基于统计与机器学习相结合,通过预置的基于无监督的时序数据异常检测模块、基于半监督的时序数据异常检测模块和基于多视图的时空深度异常检...
- 马博蒋同海周喜杨雅婷王磊马玉鹏赵凡王轶
- 文献传递
- 基于语义增强与候选排序优化的背景感知事件预测方法
- 2025年
- 事件预测旨在结合事件的语义信息与结构关系,实现对未来事件的精准推断。针对现有图神经网络方法中存在语义捕捉不足及外部知识整合有限的问题,提出一种基于语义增强与候选排序优化的背景感知事件预测方法(SECRO)。该方法采用三阶段框架:首先,利用大语言模型生成高质量的事件节点嵌入,弥补语义表达的不足;其次,基于图神经网络建模事件间的结构与关联关系,生成初步预测结果;最后,设计了一种候选排序优化机制,结合大语言模型中蕴涵的世界知识提升事件预测精度。在三个公开数据集上的实验结果表明,该方法在平均排名分数(MRR)上分别较RGCN和SeCoGD方法提升了8.34和6.84个百分点,取得了新的SOTA性能。扩展实验结果进一步验证了该方法能够增强现有图方法在事件预测任务中的性能。
- 马荣马博王震艾孜麦提·艾尼瓦尔王震王磊
- 维吾尔语口语语音语料库的设计与研究
- 在分析维吾尔语语音语料特点的基础上,结合实际语料库建设需求和地域语言特色,提出了适用于维吾尔语口语语音语料库建设的语料库设计规范、语科内容、语音采集和标注方法,并就不同信道对语音特征参数的影响进行分析。研究拟建立时长30...
- 杨雅婷马博王磊吐尔洪·吾司曼李晓
- 关键词:维吾尔语口语语料库特征参数
- 文献传递
- 维吾尔语语音识别中发音变异现象被引量:5
- 2011年
- 维语口语发音中很多音素相对标准语产生了发音变异,基于标准语音的识别系统在识别带有发音变异的口语语料时识别率较低。该文针对维吾尔语同化、弱化、脱落、元音和谐等语流音变难点进行分析,对语音、韵律特性进行知识融合与技术创新,运用基于数据驱动和基于专家经验相结合的方法对维吾尔语方言口语中存在的发音变异现象进行研究,统计元音、辅音多发音变化映射对,建立音素混淆矩阵,为维吾尔语方言口语语音识别研究奠定基础。
- 杨雅婷马博王磊王磊李晓
- 关键词:语音识别维吾尔语数据分析