马芳
- 作品数:5 被引量:12H指数:2
- 供职机构:解放军信息工程大学信息工程学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 一种面向英汉机器翻译的从句识别方法被引量:2
- 2006年
- 针对英汉机器翻译中的从句识别问题,建立了基于最大熵原理的训练模型,详细分析了该模型的特征约束条件,并将训练结果用于完整从句的标注,实验结果显示开放集测试的Fβ值达到72.18。同时,本章还对最大熵的平滑问题进行了讨论,句首识别实验结果表明高斯平滑不适合在本模型中应用。
- 马芳吴保民王炳锡
- 关键词:最大熵
- 英语从句识别中的特征表示被引量:2
- 2007年
- 英语从句识别是句法分析的基本问题,它是进一步进行英汉机器翻译的基础。提出一种基于最大熵原理的英语从句识别方法,即先将提取后的特征表示为最大熵模型形式并对其编码,再采用最大熵原理完成最后的识别过程。采用该方法进行完整从句识别的正确率和召回率分别达到80.92%和62.36%,实验表明,该方法的正确识别率远高于CoNLL01的底线标准,是一种简单有效的从句识别方法。
- 马芳王炳锡李弼程
- 关键词:最大熵英语
- 基于粗糙集的基本名词短语识别被引量:6
- 2006年
- 本文提出了一种基于粗糙集的基本名词短语(BaseNP)识别方法。该方法首先进行BaseNP标注,然后实现BaseNP识别。它把BaseNP标注看作一个决策问题用粗糙集理论解决,因而具有特征约简和规则优化的特点。文章介绍了基于粗糙集的规则学习方法和相应的算法,同时也给出了BaseNP标注和识别的算法流程,提出了解决实例冲突问题的方法,并提高了识别效果。文章最后给出了详细的实验步骤和结果,并与几个典型系统进行了比较与分析,提出了进一步改进的方向。
- 郭永辉杨红卫马芳王炳锡
- 关键词:人工智能自然语言处理基本名词短语粗糙集
- 机器翻译系统中英语从句的识别研究
- 在英汉机器翻译系统中为了实现对各种复杂语句的正确分析,必须首先完成从句识别的任务。从句是一个至少包含一个主语和谓语并且表达一个观点的语法单元。而从句识别是指将句子按照其语法结构标注出从句层次的过程,它隶属于浅层句法分析的...
- 马芳
- 关键词:最大熵BAGGING
- 一种新的自纠错句对齐算法的研究与实现被引量:2
- 2005年
- 本文提出了一种基于词性的判别函数,用来自动识别句子对齐结果的正确性。通过反向采用基于长度的对齐算法,纠正了初步对齐产生的连续性错误。该方法节省了人力,同时提高了对齐结果的正确率。实验结果表明,本模型开放集测试的召回率达到97.60%,已满足实际应用的需求。
- 马芳王炳锡郭永辉
- 关键词:句子对齐双语语料