您的位置: 专家智库 > >

陈毅恒

作品数:13 被引量:166H指数:6
供职机构:哈尔滨工业大学计算机科学与技术学院更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划哈尔滨工业大学校科学研究基金更多>>
相关领域:自动化与计算机技术经济管理更多>>

文献类型

  • 9篇期刊文章
  • 2篇学位论文
  • 1篇会议论文
  • 1篇科技成果

领域

  • 12篇自动化与计算...
  • 1篇经济管理

主题

  • 3篇意图
  • 3篇语义索引
  • 3篇索引
  • 3篇结果聚类
  • 3篇聚类
  • 3篇检索结果聚类
  • 2篇意图识别
  • 2篇映射
  • 2篇用户
  • 2篇社会媒体
  • 2篇水印
  • 2篇潜在语义
  • 2篇潜在语义索引
  • 2篇自然语言
  • 2篇自组织
  • 2篇网络
  • 2篇文本分类
  • 2篇文本水印
  • 2篇媒体
  • 2篇类方

机构

  • 13篇哈尔滨工业大...
  • 1篇北京语言大学

作者

  • 13篇陈毅恒
  • 11篇刘挺
  • 5篇李生
  • 4篇秦兵
  • 3篇赵世奇
  • 2篇付博
  • 2篇张宇
  • 1篇张宇
  • 1篇李雪婷
  • 1篇林建国
  • 1篇高立琦
  • 1篇宋巍
  • 1篇黄永光
  • 1篇赵妍妍
  • 1篇车万翔
  • 1篇丁效
  • 1篇李洋
  • 1篇宋凡
  • 1篇钱岳
  • 1篇邵艳秋

传媒

  • 4篇中文信息学报
  • 2篇中国科学:信...
  • 1篇计算机研究与...
  • 1篇电子学报
  • 1篇软件学报

年份

  • 3篇2017
  • 1篇2016
  • 1篇2015
  • 1篇2013
  • 1篇2010
  • 1篇2009
  • 1篇2008
  • 1篇2007
  • 2篇2005
  • 1篇2004
13 条 记 录,以下是 1-10
排序方式:
基于错误预测的文本分类方法
本文提出一种基于潜在语义索引(LSI)和互信息(MI)相融合的文本分类模型。使用 LSI 进行特征表示和特征降维在提高分类的性能上有优异的表现,但 LSI 本身在处理速度和耗用空间上存在缺陷。本文先对文本使用向量空间模型...
陈毅恒秦兵刘挺林建国李生
关键词:文本分类潜在语义索引互信息
文献传递
文本检索结果聚类及类别标签抽取技术研究
检索结果聚类技术致力于实时地将检索结果按主题整理成若干类别,并赋予每个类别一个准确可读的标签。用户可以根据标签直接定位真正感兴趣的结果集,还可以根据其它类别的标签更好地了解查询词,必要时重新构造更准确的查询词等。相比一般...
陈毅恒
关键词:文本检索检索结果聚类自组织特征映射语义索引
中英文双语例句检索与机器翻译系统
刘挺车万翔陈毅恒秦兵张宇高立琦赵世奇赵妍妍宋巍
随着全球化步伐的加剧,越来越多的中国人开始学习外语,尤其是英语。该项目针对单纯词典查询方式的不便,提出使用双语例句检索和机器翻译的方式,来满足人们日益增长的英语写作和阅读的需求。该项目所属领域为:电子与信息→计算机软件产...
关键词:
关键词:机器翻译系统
微博信息传播预测研究综述被引量:40
2016年
微博已经逐渐成为人们获取信息、分享信息的重要社会媒体,深刻影响并改变了信息的传播方式.针对微博信息传播预测问题展开综述.该研究对舆情监控、微博营销、个性化推荐具有重要意义.首先概述微博信息传播过程,通过介绍微博信息传播的定性研究工作,揭示微博信息传播的特点;接着,从以信息为中心、以用户为中心以及以信息和用户为中心这3个角度介绍微博信息传播预测相关研究工作,对应的主要研究任务分别是微博信息流行度预测、用户传播行为预测和微博信息传播路径预测;继而介绍可用于微博信息传播预测研究的公开数据资源;最后,展望微博信息传播预测研究的问题与挑战.
李洋陈毅恒刘挺
基于潜在语义索引和自组织映射网的检索结果聚类方法被引量:6
2009年
随着互联网的不断发展和数据量的不断增加,搜索引擎的作用日益明显,用户更多地依靠搜索引擎来查找需要的信息.利用潜在语义索引(LSI)理论和自组织映射神经网络(SOM)理论,提出了一种文本聚类的新方法——LSOM.该方法应用SOM网络来实现检索结果文本聚类,不必预先给定类别个数,具有聚类灵活和精度高等特点;同时,该方法应用LSI理论来建立向量空间模型,在词条的权重中引入了语义关系,对于高维的文本特征向量,消减原词条矩阵中包含的噪声,提高聚类速度.LSOM使用一种新的类别标签提取方法,并将提取的标签用于解决SOM基本类划分问题,算法在类别标签和聚类效果评价指标上都比已有的算法有所提高.
陈毅恒秦兵刘挺王平李生
关键词:检索结果聚类潜在语义索引标签
聊天机器人中用户出行消费意图识别方法被引量:9
2017年
聊天机器人中的出行消费意图是指用户为了满足出行的需要,通过文本表达出对出行类产品或者服务的购买意愿.识别出用户的消费意图可以进行相应的产品推荐,增强用户体验.传统的消费意图识别主要使用基于模板匹配或者基于人工特征集合的机器学习方法,这类方法费时费力,扩展性不强.本文将出行消费意图识别任务看成一个分类问题,结合深度学习方法识别用户的出行消费意图,该方法不需要人工构造特征集合或匹配模板.具体而言,本文构建了基于卷积的长短期记忆神经网络(Convolutional-LSTM)模型进行出行消费意图识别,首先通过卷积神经网络(CNN)对用户的聊天文本进行特征抽取,随后进行特征组合并送入长短记忆神经网络(LSTM)进行特征表示学习,最后输出分类结果.实验结果表明,在出行消费意图识别任务上,基于Convolutional-LSTM的模型在F值上优于最好的基线方法 2个百分点.
钱岳丁效刘挺陈毅恒
关键词:卷积神经网络
基于用户自然标注的微博文本的消费意图识别被引量:7
2017年
消费意图是指用户在文本中明确表达出的购买产品或服务等一些商业消费的意愿,如"想买一部手机"。该文针对微博上的消息文本,提出一种基于用户自然标注的微博消费意图识别方法。该方法将微博消费意图识别看作为领域自适应学习问题,通过自动获取的训练语料基于源域和目标域共同特征设计分类器,抽取置信度高的伪标注消费意图微博,再利用微博特征训练新的分类器对微博进行消费意图识别。实验结果表明该文所采用的方法是有效的,F值达到69%和77%,其中使用的各种特征对于提高消费意图识别的效果皆有帮助。
付博陈毅恒邵艳秋刘挺
关键词:社会媒体领域自适应
基于网络结构的多种用户影响力分析算法对比研究被引量:1
2017年
随着社交网络的发展,人们可以非常平等、快捷地发布和接受信息,这导致线上生活对线下生活的影响越来越大。社会化营销应运而生,其非常重要的一个需求是要最大化营销活动在社交网络中的影响力。因此,社交网络中用户影响力分析成为一个至关重要的研究点。该文重点考察了基于网络结构的影响力分析方法,主要包括最大度算法、距离中心点算法、类似PageRank算法的PeopleRank算法等,并给出了具体的分析结论。
陈毅恒李雪婷王彪刘挺
关键词:网络结构社交网络
基于ontology抽取优化初始选择的检索结果聚类被引量:8
2008年
本文针对互联网的数据量的不断增加,准确搜索引擎的作用日益困难的问题,为了提高搜索引擎返回结果结构化聚类的效果,让信息的定位更迅速,本文采用基于标签的聚类算法,并使用自然语言处理技术中的依存句法分析和词典资源,深度挖掘语义结构,提出基于优化初始选择的K均值聚类方法.本文深入分析K均值聚类算法特点,并利用类别标签技术对该算法进行有效改进.实验证明该算法不仅在效果上优于一般聚类算法,对结果描述也有很大帮助,在效率上也得到很大提高.
陈毅恒秦兵宋凡刘挺李生
关键词:检索结果聚类ONTOLOGY标签
基于图排序的社会媒体用户的消费意图检测被引量:1
2015年
消费意图是指用户为满足某种需要,在一定购买动机的支配下,通过文本内容表达出对产品或服务的购买意愿.消费意图检测旨在推断用户在文本中是否表达出消费意图的含义.我们定义微博中的消费意图必须包含两个重要元素,分别是消费意图触发词和消费意图对象(即需要购买的产品),这两种元素直接引发用户的购买意愿,是决定用户消费意图的重要特征.本文提出了基于弱监督的图排序算法,该方法适用于数据总量较大、已标注数据量相对较小的情形中,并且可以使未标注数据和标注数据同时参与到图排序算法的学习过程中.实验结果表明,所采用的图排序方法对于消费意图检测是行之有效的.
刘挺付博陈毅恒
关键词:社会媒体
共2页<12>
聚类工具0