国家社会科学基金(08xyy006)
- 作品数:4 被引量:26H指数:2
- 相关作者:安见才让王玲玲更多>>
- 相关机构:青海民族大学青海师范大学更多>>
- 发文基金:国家社会科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 面向汉语教学的汉藏语料库系统设计和实现
- 2012年
- 主要介绍了开发制作的汉藏平行语料库系统的特点、功能,以及系统的设计思想和总体框架。系统以藏区使用的小学和初中汉语教材的内容为生语料,实现了改进的B+树索引、词表生成、词语搭配分析、汉藏双语检索、朗读和对齐等功能,为少数民族地区的汉语教学、信息挖掘和自然语言处理等方面的研究提供了丰富而真实的语言环境。
- 安见才让
- 关键词:汉语教学
- 一种汉藏双语句子对齐算法
- 2011年
- 双语语料库建设及其自动对齐研究对计算语言学的发展具有重要意义。双语对齐技术是加工双语文本的核心,对齐效果的好坏直接影响了以后工作的进行。基于汉藏双语的实际情况,提出了一种利用句子长度、相似度和锚点信息的汉藏双语句子对齐方法,该方法用相似度找到句子的锚点,用锚点将双语文本分割成几个分块,在对应双语分块中用基于长度的对齐实现句子的对齐。通过测试数据进行的实验结果显示,这种方法有着良好的准确率,有效地解决了汉藏双语真实文本的句子对齐问题。
- 安见才让王玲玲
- 关键词:句子对齐锚点相似度
- 基于分段的藏字校对算法研究被引量:12
- 2013年
- 该文提出了一种规则和藏字语法分析相结合的藏字自动校对算法,不使用藏字字典和大规模语料库。通过研究藏字构字语法,得到藏字的结构特征,进而对藏字的字母组合进行分段处理,简化藏字构字复杂度,研究出各分段部分的构字规则,然后按照规则进行字的校对。实验表明,系统对现代藏文字的查错率达100%。
- 安见才让
- 藏语句子相似度算法的研究被引量:14
- 2011年
- 该文提出了一种藏语句子相似度的计算方法,即采用散列单词倒排索引和基于句长相似度粗选的算法,快速从语料库中筛选出候选句子的集合,散列单词倒排索引能够有效提高算法的查找速度;再采用基于词形和连续单词序列相似度的多策略精选算法,可以有效衡量两个藏语句子的相似程度。实验结果证明算法是有效的。
- 安见才让
- 关键词:自然语言处理语料库藏语句子相似度