公共文化服务平台

2024年7月18日星期四

|

欢迎来到南京江宁区图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

国家自然科学基金(61100083): 作品数：3 被引量：13H指数：2; 相关作者：程学旗刘悦俞晓明程工李海燕更多>>; 相关机构：中国科学院大学中国科学院国家互联网应急中心更多>>; 发文基金：国家自然科学基金国家高技术研究发展计划更多>>; 相关领域：自动化与计算机技术更多>>

相关作品
相关人物
相关机构
相关资助
相关领域

文献类型

3篇中文期刊文章

领域

3篇自动化与计算...

主题

1篇带权
1篇信息抽取
1篇信息检索
1篇用户
1篇正交
1篇中文
1篇网页
1篇可扩展
1篇垃圾
1篇查询
1篇抽取

机构

3篇中国科学院
3篇中国科学院大...
1篇国家互联网应...

作者

3篇刘悦
3篇程学旗
2篇俞晓明
1篇关峰
1篇张瑾
1篇郭岩
1篇薛源海
1篇郭少华
1篇李海燕
1篇程工

传媒

2篇中文信息学报
1篇计算机研究与...

年份

1篇2015
2篇2014

共 3 条记录，以下是 1-3

全选清除导出

排序方式：

中文微博客的垃圾用户检测被引量：9: 2014年; 微博客的出现改变了我们获取信息的方式。然而,大量垃圾消息却此起彼伏,危害着微博的健康发展。该文研究了中文微博客中的垃圾用户检测问题。我们首先对垃圾用户的行为进行了分析,提出了基于用户图、用户资料、微博内容的3大类7种检测特征。随后,讨论了基于SVM分类器的垃圾用户检测方法。最后,我们对采集的微博数据进行了标注,并评价了分类器的效果。实验表明:分类器具有较高的准确率和召回率,该文提出的特征具有较好的区分度。; 李赫元俞晓明刘悦程学旗程工

可扩展的网页关键信息抽取研究被引量：3: 2015年; 该文提出了一种可扩展的网页关键信息抽取框架。该框架很好地融合了模板无关的全自动信息抽取算法和基于模板的信息抽取算法,从本质上提高抽取精度和抽取效率。该框架中的一些关键环节可根据需求进行替换,因此该框架具有很好的可扩展性。同时,该文还提出了模板的正交过滤算法。将该算法引入基于模板的抽取算法中,能够从本质上提高生成的模板的准确性。实验结果验证了上述结论。; 郭少华郭岩李海燕刘悦张瑾程学旗; 关键词：信息抽取

信息检索中的带权邻近度度量研究被引量：1: 2014年; 信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没有考虑查询中各个词重要性的差异.在现代信息检索的查询请求中,查询词之间不仅不完全相互独立,而且分别具有不同的重要程度.因此,在计算邻近度信息时对查询词的重要性进行区分,将有助于提高检索效果.带权邻近度BM25模型(WP-BM25)使用待检索数据集的背景信息对查询词的重要性进行区分,并将带权邻近度度量方法整合到BM25模型中.在TREC评测的3个标准数据集FR88-89,WT2G和WT10G上的一系列对比实验表明,该模型具有较好的鲁棒性,且能够使检索效果得到显著提升.; 薛源海俞晓明刘悦关峰程学旗; 关键词：信息检索

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有@南京江宁区图书馆 2015－2016 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张