陈黎 作品数:65 被引量:245 H指数:7 供职机构: 四川大学计算机学院 更多>> 发文基金: 国家自然科学基金 四川省科技支撑计划 国家教育部博士点基金 更多>> 相关领域: 自动化与计算机技术 文化科学 理学 经济管理 更多>>
一种面向专业搜索引擎的查询推荐算法 被引量:4 2013年 根据专业搜索引擎的特点,提出了一种新颖的基于词语共现与HITS算法的查询推荐算法QR-CH(Query Recom-mendation algorithm based on word Co-occurrence and HITS algorithm)。该算法一方面利用HITS算法对基于词语共现筛选出的关联词按语义关联性进行排序,选取排序靠前的关联词作为推荐词,提高了推荐词与原查询词的相关性;另一方面使用HITS算法排序关联文档,从查询结果文档集的角度来判断推荐是否冗余,降低了推荐词的冗余性。该算法将推荐相关的信息存储到知识树中,利用知识树实现查询推荐。实验结果表明QR-CH算法在推荐词的相关性和冗余词的判断方面均优于文献中已有的类似算法。 王桂华 秦湘清 陈黎 王亚强 于中华关键词:查询推荐 专业搜索引擎 一种情感感知模型的构建与早期抑郁症风险检测方法 本发明提供了一种情感感知模型的构建和早期抑郁症风险检测方法,解决了现有方法中忽略用户在社交媒体中表达的情感内容与早期抑郁症状描述,难以准确判断用户是否已经处于抑郁症的早期阶段,本发明通过构建数据集,获取待检测用户的社交媒... 琚生根 万宇杰 董再全 姜宝兴 陈黎 李每文一种大语言模型驱动的会话式知识图谱问答方法、装置、电子设备及介质 本发明涉及大语言模型技术领域,尤其涉及一种大语言模型驱动的会话式知识图谱问答方法、装置、电子设备及介质,该方法包括:获取当前会话中待应答问题中的第一候选焦点实体,以及在待应答问题之前的历史问答中的第二候选焦点实体;将待应... 陈黎 李瑞奇 赵明明 李洲针对循证医学的文献筛选标注系统 本发明公开了一种针对循证医学的文献筛选标注平台,包括后端服务器和其分别连接的管理端、仲裁端以及至少两个标注端,管理端导入文献、向标注端发布标注任务和导出最终标注文献数据;每一个标注端分别对标注任务所包含的文献进行若干轮标... 陈圣恺 谢雨 姚攀 毛渤淳 李春洁 臧义 于中华 曹钰彬 陈黎 刘露一种建立在对客户端浏览历史进行LDA建模基础上的个性化查询推荐算法 被引量:2 2015年 现代搜索引擎普遍采用简单的关键词形式来表达查询,这为用户带来便利的同时也增加了准确获取信息的难度.搜索引擎很难基于少量的几个关键词准确捕捉用户的信息需求.查询推荐作为缓解上述问题的关键技术,已经开始应用于目前主流的搜索引擎.然而,绝大多数现有的查询推荐技术基于群体智慧,以搜索引擎日志为数据源,从中挖掘用户群体在构造查询方面的习性及查询之间的语义关联性,未考虑不同用户个性化的信息喜好,而且在搜索引擎服务器端进行查询推荐计算也会影响搜索引擎的响应效率和查询吞吐率.为此,本文提出一种运行于客户端的个性化查询推荐策略,该策略以用户浏览历史为数据源,采用LDA模型,并从中学习用户的信息喜好,在此基础上利用原始查询被主题模型生成的概率确定用户的查询意图,以词条与查询意图之间的关联来度量词条作为扩展查询被推荐的强度,最后选择Top N强度最强的词条作为查询推荐的结果.以人工标注的测试数据对本文所提出的算法进行了实验验证,结果表明,该算法在推荐扩展查询的准确率方面明显优于单纯基于词条与原始查询语义相关的方法. 王桂华 陈黎 于中华 丁革建 罗谦关键词:查询推荐 个性化 LDA模型 基于依存关系和最大熵的特征-情感对分类 被引量:2 2014年 中文产品评论特征词与关联的情感词的分类是观点挖掘的重要研究内容之一。该文改进了英文依存关系语法,总结出5种常用的中文产品评论依存关系;利用最大熵模型进行训练,设计了基于依存关系的复合特征模板。实验证明,应用该复合模板进行特征-情感对的提取,系统的查全率和F-score相比于传统方法,分别提高到78.68%和75.36%。 张磊 李珊 彭舰 陈黎 黎红友关键词:最大熵 WEB数据挖掘 基于本体翻译的领域本体自动构建 被引量:3 2011年 手工构建本体是一项既费时又费力的工作,为解决此项工作的瓶颈问题,本体自动构建成为当前的一个研究热点和重点。考虑到不同语言描述的本体在本质上是相同的,只是表层的表示符号不同,提出了一种基于本体翻译的领域本体自动构建算法,该算法针对已存在本体中概念标签的不同情况,分别采用不同的统计指标来筛选标签的目标语翻译。通过将一个英文金融本体翻译成中文对算法进行了实验验证,说明了算法的有效性。 卢文兴 陈黎 朱洪波 王亚强 韩国辉 于中华关键词:语义网 本体 信息熵 长度分布约束下的摘要文本无监督分割算法 被引量:2 2017年 作为文章内容的浓缩表达,摘要蕴含着文章关键的发现和结论。自动分析挖掘摘要内容,对于充分利用快速增长的科技文献具有重要意义。该文以Medline生物医学文章的摘要为对象,对摘要的文本分割问题进行了研究。针对摘要各论述侧面(内容块)之间在长度分布上倾向于均匀的特点,提出了一种考虑长度分布约束的摘要文本无监督分割算法,该算法以信息熵作为长度分布均匀性的度量指标,将信息熵与块内语义相似度及块间语义相似度相结合作为优化的目标函数,采用动态规划方法搜索最佳分割点。在8 603篇Medline摘要上对算法进行了实验验证,并与文献中最新的无监督分割算法进行了实验对比。结果表明,该文提出的增加了长度分布约束的分割算法更加适用于摘要文本分割,分割的准确率有3%的提高。 骆俊帆 陈黎 于中华 丁革建 罗谦关键词:文本分割 动态规划 生物医学 清代成都重庆城市发展比较研究 清代的成都、重庆代表着两种不同的城市类型,前者是传统的内陆政治中心城市,有很强的政治军事功能;后者是近代开埠后迅速发展起来的沿江经济中心城市,经济功能异常突出,它们各自发展的特殊性与同一性对此时期其他城市而言较为典型。因... 陈黎关键词:清代 城市发展 文献传递 基于K近邻的新话题热度预测算法 被引量:31 2012年 随着互联网的快速发展,网络舆情成为政府部门和企业以及社会大众关注的焦点,对网络舆情进行有效监管和正确引导是当前亟待解决的问题,话题热度预测是舆情监管和引导的基础。针对现有算法无法对新话题的热度进行有效预测的缺点,提出了一种基于K近邻的新话题热度预测算法。该算法利用与新话题相似的历史话题的点击数时间序列来对新话题的热度进行预测。实验结果表明,在允许相对误差分别低于10%、20%和30%的情况下,算法预测的前3天点击数的平均正确率分别为47.26%、61%和67.7%,点击数变化趋势平均正确率达到73.73%,这也说明了相似的话题在话题出现的初期具有近似的热度变化趋势。 聂恩伦 陈黎 王亚强 秦湘清 金宇 于中华关键词:K-近邻算法 网络舆情