唐琦
- 作品数:3 被引量:111H指数:2
- 供职机构:华北电力大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于格语法的FQA自动问答系统
- 2008年
- FAQ问答系统是一种在已有的"问题—答案"对集合中找到与用户提问相匹配的问句,并将其对应的答案返回给用户的系统。句子相似度计算是FAQ问答系统的关键技术,系统通过句子相似度算法计算用户问句与FAQ库中的问句的相似度,把相似度最大的问句答案返回给用户。因此,句子相似度算法的好坏直接决定了系统结果的准确度。文章给出了一个基于格语法的句子相似度计算方法,通过加入格语法的语义分析提高句子相似度算法的准确度。
- 唐琦郭庆琳周亚辉
- 关键词:相似度计算格语法语义分析
- 基于VSM的文本相似度计算的研究被引量:110
- 2008年
- 文本相似度的计算作为其他文本信息处理的基础和关键,其计算准确率和效率直接影响其他文本信息处理的结果。提出改进的DF算法和TD-IDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,并通过适当增加关键词的方法,弥补了其对个别有用信息错误过滤的不足;另一方面,利用特征项在特征选择阶段的权重对TD-IDF方法进行加权处理,在不增加开销的情况下扩大了文档集的规模,还提高了相似度计算的精确度。
- 郭庆琳李艳梅唐琦
- 关键词:文本相似度向量空间模型
- 基于语义分析的句子相似度计算研究
- 在中文信息处理中,相似度计算是一项基础而又核心的工作,它直接决定着某些领域的研究发展状况,例如,在基于实例的机器翻译、信息检索、自动问答、拼写检查以及数据清理等方面,相似度计算都是一个非常关键的问题,长期以来一直是人们研...
- 唐琦
- 关键词:相似度计算语义分析知网自然语言处理
- 文献传递