罗婷婷 作品数:22 被引量:143 H指数:6 供职机构: 中国农业科学院农业信息研究所 更多>> 发文基金: 国家社会科学基金 中央级公益性科研院所基本科研业务费专项 国家科技部农业科技成果转化资金 更多>> 相关领域: 文化科学 农业科学 自动化与计算机技术 经济管理 更多>>
中国农牧渔业丰收奖中畜牧业成果数量分析与展望 2012年 对中国农牧渔业丰收奖中畜牧业成果进行了数量分析,主要包括畜牧业在农牧渔业丰收奖成果中所占比重分析、畜牧业丰收奖成果数量变化分析以及畜牧业内不同类别获奖成果数量分析3方面,侧面反映了中国畜牧业科技推广工作的发展情况。 罗婷婷 赵瑞雪 于迎建 寇远涛 杜若鹏关键词:畜牧业 一种基于多因子混合排序机制的学科分类自动标引方法 本发明提出一种基于多因子混合排序机制的学科分类自动标引方法,其特征在于:包含以下步骤:1.构建不同数据来源的基础语料库,获取每一个关键词在基础语料库中在对应的所有学科分类号下出现次数、最大次数及概率;2.根据待标引的文献... 赵瑞雪 鲜国建 李娇 孙坦 黄永文 寇远涛 罗婷婷基于多因子算法的自动分类研究 被引量:4 2020年 【目的】从实用角度出发,研制领域适用性广、人力投入少的分类标引方法,支撑海量信息资源分类管理与学科领域地图揭示。【方法】基于文献中代表主题概念的术语、概念等关键词和分类号的兼容关系,研究设计多因子加权分类算法,在此基础上提出全流程自动分类标引方案。【结果】以权威的多领域标注语料库和标准集为数据来源进行分类标引实验,单类号文献标引准确率84.1%,召回率79.8%,F值81.9%;双类号文献标引准确率83.4%,召回率78.8%,F值81.0%。【局限】学科分类标引的准确率及完整性依赖高质量标注语料库,且在多类号资源的标引上有待提升。【结论】本文提出的多因子算法自动分类标引具有较高的可操作性和实践应用价值。 李娇 黄永文 罗婷婷 赵瑞雪 鲜国建关键词:学科分类 大数据与人工智能背景下新型知识服务研究与实践 被引量:44 2022年 [目的/意义]大数据、人工智能等技术正引发知识服务的深刻变革,我国科技文献知识服务领域的核心关键技术还较为薄弱,因此探索利用智能化技术实现新型智能知识服务成为图书馆当前的必要任务。[方法/过程]通过对国内外新型知识服务进行分析和总结,设计NSTL新型知识服务体系的总体思路、应用场景和功能框架,并实现NSTL下一代知识服务示范平台。[结果/结论]NSTL下一代知识服务示范平台在智能检索与问答、自动综述、文献与科学数据的关联发现、突破性研究文献识别、领域技术演化分析与预测等智能知识服务的实践,可以为我国图书情报领域开展新型知识服务提供技术思路和应用场景借鉴。 黄永文 孙坦 赵瑞雪 鲜国建 鲜国建 罗婷婷关键词:知识服务 语义检索 国际开放仓储目录整合研究与实践 2022年 开放仓储目录是对开放仓储的描述说明和索引,是开放学术资源利用、发现、共享的基础。本文首先通过对OpenDOAR、ROAR、BASE等5个国际主流开放仓储目录的建设现状进行调研分析,发现在国际开放仓储目录建设方面,还存在仓储目录收录不够完整、目录元数据项不够丰富、目录更新时效性有待提高、揭示系统功能相对单一等不足。在此基础上,本文提出开放仓储目录元数据整合研究,包括元数据描述规范设计、基于OAI协议和ETL工具收割元数据,使用数据清洗工具OpenRefine对元数据进行“形式去重”和OAI-Identify获取结果的“内容去重”,并建立对多源异构仓储目录进行匹配融合的方法路径,形成数据内容更丰富、数量更加全面的全球开放仓储目录GOAR核心集和扩展集。最后从建立动态更新融合机制、常态化监控机制和目录发布系统三方面提出下一步研究方向。 张云玲 罗婷婷 赵瑞雪 赵瑞雪关键词:OAI-PMH 科学数据与学术文献关联服务的研究与实现 被引量:7 2021年 [目的/意义]针对科研人员日益强烈的科学数据检索与发现需求,丰富和完善科学数据的元数据,实现科学数据与学术文献的深度关联发现。[方法/过程]通过对国内外关联服务方式和服务实践进行分析和总结,提出科学数据检索与关联服务系统架构,并实现学术资源元数据采集及融合、科学数据元数据丰富与增强以及科学数据检索与关联发现服务。[结果/结论]科学数据元数据质量的改善可以支持科学数据和学术文献之间更深层次、更细粒度的语义关联服务,助力用户发现科学数据以及与其相关联的学术文献。 黄永文 孙坦 赵瑞雪 鲜国建 鲜国建 罗婷婷关键词:科学数据 学术文献 数据检索 大语言模型驱动的科学数据自动分类研究 2025年 [目的/意义]将科学数据分类到特定的学科领域,可以增强信息检索效果以及提高资源的可发现性,不过以人为主体对科学数据进行分类已难以应对海量数据处理的需求,因此有必要探索科学数据自动分类的有效方法。[方法/过程]提出大语言模型驱动的科学数据自动分类的研究思路。首先,利用数据期刊“Data in Brief”构建高质量标注数据集;然后,设计提示模板和遴选少样本数据,使开源模型Qwen2.5-7B快速适配分类任务,并利用标注数据进一步对大语言模型进行监督式微调;最后,进行少样本学习实验以及利用微调后的大语言模型分别针对元数据和全文进行分类实验。[结果/结论]将提示模板、少样本学习以及监督式微调相互结合,可以有效提高大语言模型的自动分类性能。同时,用于模型微调的标注数据的数量和学科分布,决定了大语言模型在不同学科分类的效果。 黄永文 马玮璐 鲜国建 李娇 罗婷婷 罗婷婷农业立体污染防治重点领域信息门户建设实践 2017年 本文阐述NSTL重点领域信息门户农业立体污染防治专项的建设背景、门户构建策略与服务思路,提出学科语义知识库构建思路和情报加工质量控制方法。结合专项门户实践,总结学科门户资源建设的关键问题及采取的技术手段,提出开放资源整合与门户建设是图书馆拓展服务渠道,丰富知识服务内容,提升服务能力的重要措施。 赵瑞雪 金慧敏 鲜国建 罗婷婷关键词:信息门户 本体构建 情报产品 从人工密集型到计算密集型:NSTL数据库建设模式转型之路 被引量:4 2020年 近年来,在国家科技图书文献中心(National Science and Technology Library,NSTL)业务流程再造总体规划指导下,NSTL数据库建设模式发生了深刻变化与全面转型。本文总结梳理了由“全自主加工”到“自主加工+第三方数据利用”,再到当前“多源异构文摘数据深度融合利用”的发展脉络,展现了NSTL数据库建设模式正从人工密集型向计算密集型转型的特点,而近十年来文摘数据加工与第三方数据利用情况印证了这一发展历程。在此基础上,本文以期刊文摘数据加工为例,重点探讨多源异构文摘数据深度融合利用模式,包括基本原则、总体框架、规则设计与算法实现、融合系统设计与实现。最后指出,NSTL数据库建设最终将实现从人工密集型到计算密集型、从加工流程驱动向多源大数据驱动的全面转型发展,也将为NSTL构建下一代新型、智能化的知识发现服务体系,提供坚实的数字科技文献大数据支撑。 鲜国建 罗婷婷 罗婷婷 赵瑞雪 杨增秀关键词:数据库建设 业务流程再造 基于多模型的农产品供求信息预测系统研究 被引量:3 2009年 介绍了基于多模型的农产品供求信息预测系统的预测模型理论基础、系统总体平台结构、系统功能结构,并重点介绍其主要功能模块,同时,指出了系统实现中解决的关键问题,最后进行总结并提出改进方法。 罗婷婷 赵瑞雪关键词:农产品 供求信息