舒燕
- 作品数:4 被引量:3H指数:1
- 供职机构:北京信息科技大学更多>>
- 发文基金:国家社会科学基金国家质检公益性行业科研专项更多>>
- 相关领域:自动化与计算机技术语言文字经济管理更多>>
- 搜索引擎日志中“V+N_1+N_2”型短语研究被引量:1
- 2011年
- 搜索引擎用短语词典能够有效地改善和提高信息检索的性能,"V+N1+N2"型结构是一种常见汉语短语结构。本文基于搜狗语料,分别从各组成要素特点、语义特征以及句法功能,对"V+N1+N2"型动词短语和名词短语进行统计分析和相关数据处理。针对不同语义关系,在不改变原语义的条件下,提出了相应的转换模式,为搜索引擎用短语词典的构建提供了理论支撑。
- 吕学强舒燕孙立华程涛
- 关键词:搜索引擎句法功能
- 搜索日志中“V+N”、“V+V”型短语识别被引量:1
- 2012年
- 从搜狗日志语料出发,分析语料特点,以词语本身、词性信息、位置信息、查询词串频次和音节数为特征,提出了基于SVM_HMM模型的短语自动识别方法,对"V+N"、"V+V"短语进行多重对比实验,实验验证了上下文信息量的增加能提高短语识别效率,证实了音节数、位置特征对实验效果的低影响力,为搜索引擎用短语词典的构建提供技术支持,为进一步的短语类别识别研究提供方向性指导。
- 吕学强舒燕施水才
- 搜索引擎日志短语标注规范
- 2013年
- 语料标注是语料库构建的一项重要的基础性工作。基于搜狗日志,该文借助XML文档的结构化特点,将语料标注转换成节点属性的改写,根据语料的特点,制定了一套服务于搜索引擎用短语词典构建的短语语料标注加工规范及执行原则,并对标注集及加工规范进行了详细描述。利用此规范,已完成145 645条查询词串的标注,而且标注质量很高。
- 舒燕吕学强
- 关键词:短语词典
- 基于电子商务交易主体的个人信用评价指标实证研究被引量:1
- 2011年
- 文章通过对比当前几大电子商务网站现有的信用评价指标体系,提出个人信用评价指标草案,采用李克特量表设计调研问卷,获取各指标的认同情况。对回收的调研数据进行描述性分析和主成分分析,实证了草案,并量化了各指标对信用评价的影响,为个人信用评价指标体系的制定提供了参考,也为信用信息共享关键技术标准的实证研究提供了个案分析和总体研究的方向性指导。
- 舒燕刘坤吕学强
- 关键词:电子商务信用评价描述性分析主成分分析实证研究