您的位置: 专家智库 > >

胡小鹏

作品数:3 被引量:11H指数:2
供职机构:中国电子信息产业发展研究院更多>>
发文基金:国家自然科学基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 3篇中文期刊文章

领域

  • 3篇自动化与计算...

主题

  • 1篇多引擎
  • 1篇信息环境
  • 1篇信息披露
  • 1篇义域
  • 1篇引擎
  • 1篇语言
  • 1篇语言模型
  • 1篇语言迁移
  • 1篇语义
  • 1篇语义域
  • 1篇融合技术
  • 1篇年报
  • 1篇披露
  • 1篇企业
  • 1篇企业财务
  • 1篇企业年报
  • 1篇迁移
  • 1篇基于语义
  • 1篇翻译
  • 1篇翻译模型

机构

  • 3篇中国电子信息...

作者

  • 3篇袁琦
  • 3篇胡小鹏
  • 1篇管东升
  • 1篇朱姝
  • 1篇李响
  • 1篇耿鑫辉

传媒

  • 2篇工业技术创新
  • 1篇计算机工程与...

年份

  • 1篇2017
  • 1篇2015
  • 1篇2014
3 条 记 录,以下是 1-3
排序方式:
面向多引擎融合技术的统计后编辑方法研究被引量:1
2015年
本文介绍了我单位研发的机器翻译系统融入统计后编辑方法后实现串行结构多引擎融合技术,该方法的目的是解决翻译领域适应性的问题,矫正规则为主导的系统翻译结果,提高翻译译文的质量。其中包括提取系统生成的译文作为源语言构建中文平行语料库,然后采用统计的方法训练翻译模型和语言模型,抽取短语表和N-gram文本用于统计后编辑翻译引擎的解码。文中给出了该方法综合性能评价,最后给出下一步工作设想。
李响胡小鹏袁琦
关键词:翻译模型语言模型
构建和剖析中英三元组可比语料库被引量:5
2014年
由于受到翻译腔的影响,中英平行语料库存在固有的扭斜的语言模型。显然,用这样的语料库训练的机器翻译、跨语言检索等自然语言处理系统也承袭了扭斜的语言模型,严重影响到应用系统的性能。为了克服平行语料库固有的缺陷,提出构建和剖析中英三元组可比语料库的技术研究。这项研究采用可比语料库和语言自动剖析技术,使用统计和规则相结合的方法,对由本族英语、中式英语和标准中文三元素所组成的三元组可比语料库中的本族英语和中式英语进行统计分析。在此基础上,利用n-元词串、关键词簇等自动抽取技术挖掘基于本族语言模型的双语资源,实现改进和发展机器翻译等自然语言的处理应用。
胡小鹏袁琦耿鑫辉朱姝
关键词:语言迁移
企业年报信息披露的战略内容分析——基于语义分析系统被引量:5
2017年
介绍使用计算机系统分析企业年报信息披露的战略内容的国内外发展现状,提出利用USAS语义分析系统(UCREL Semantic Analysis System)提取中文年报战略内容核心术语和概念的研究方法。收集2007~2014年发表的10个有代表性的中国上市公司、且产业覆盖率较宽的5 7份年报,着重关注与企业战略描述密切相关的3个语义域——I(钱财和商业)、H(建筑和建筑物)和Y(科学技术),通过人工匿名评分,开展全面、客观的有效性评估。对实验结果的分析表明,利用开发的中文语义分析系统从企业年报信息披露文本中自动识别和提取中文关键术语用于企业战略信息的进一步分析是可行的。
胡小鹏袁琦管东升
关键词:语义域
共1页<1>
聚类工具0