公共文化服务平台

2025年4月24日星期四

|

欢迎来到南京江宁区图书馆•公共文化服务平台

登录 | 注册 | 进入后台

[APP下载]

[APP下载]

扫一扫,既下载

全民阅读
职业技能
专家智库
参考咨询

您的位置： 专家智库 > >

陈爽: 作品数：3 被引量：2H指数：1; 供职机构：西北工业大学计算机学院更多>>; 发文基金：国家自然科学基金北京市自然科学基金更多>>; 相关领域：自动化与计算机技术更多>>

合作作者

陈福北京科技大学计算机与通信工程学...
李素北京工商大学计算机与信息工程学...
钱榕北京科技大学计算机与通信工程学...
李先国西北工业大学计算机学院
杜天苍北京石油化工学院信息工程学院自...

作品列表
供职机构
相关作者
所获基金
研究领域

文献类型

3篇中文期刊文章

领域

3篇自动化与计算...

主题

2篇网页
1篇新闻
1篇新闻网
1篇新闻网页
1篇信息采集
1篇信息采集系统
1篇信息抽取
1篇引擎
1篇元搜索
1篇支持向量
1篇支持向量机
1篇搜索
1篇搜索引擎
1篇索引
1篇主题发现
1篇资源发现
1篇向量
1篇向量机
1篇链接
1篇链接分析

机构

3篇西北工业大学
2篇北京工商大学
2篇北京科技大学
1篇北京石油化工...

作者

3篇陈爽
3篇陈福
2篇李素
1篇杜天苍
1篇李先国
1篇钱榕

传媒

1篇燕山大学学报
1篇计算机工程与...
1篇北京石油化工...

年份

3篇2007

共 3 条记录，以下是 1-3

全选清除导出

排序方式：

一种抽取新闻网页结构化数据的方法被引量：1: 2007年; 根据统计结果,从阅读角度对网页页面空间的构成进行了噪声与信息实体的划分与判断,改进了传统的DOM模型,增加了层次与样式等属性作为噪声判断的依据,逐级降噪,并利用新闻的标题、时间等外显特性,提出并实现了一种结合正向直接抽取与反向过滤降噪抽取新闻网页得到结构化数据的方法,并使用这种方法进行了大范围的效果验证。验证结果表明:这种方法信息抽取准确率高,对中英文新闻网页都有良好的适用性。; 陈爽李先国陈福李素; 关键词：信息抽取 HTML解析 DOM

一种启发式网络信息采集系统设计与实现: 2007年; 为解决目前网络信息采集中信息主题单一与垃圾信息过多的问题,讨论了一种半人工监督的启发式采集系统。用户向系统提交同一个主题的一组关键词后,系统自动合并多个搜索引擎返回的结果,从而构成一个有序的文档集合。对这个集合利用后缀树算法进行聚类,人工对聚类的结果进行有效与垃圾状态标注并生成训练集构造分类器。当用户提交该主题更多的关键词时,系统可以从各成员搜索返回的结果中自动识别并采集有效数据而过滤垃圾信息。实验结果显示,系统对定主题数据的平均有效信息识别率达到92%以上。; 陈爽陈福杜天苍; 关键词：后缀树聚类支持向量机

网页链接繁殖在搜索引擎资源发现中的应用被引量：1: 2007年; 为解决搜索引擎返回结果数量上的限制,扩展了元搜索技术,提出链接群落、链接繁殖的概念,并与生物群落进行了对比。链接繁殖的思想是首先将多个搜索引擎返回的结果作为起始信息源,利用预定义的繁殖规则,优化并整合搜索结果,对链接所指网页的链接进行分析,繁殖出更多的相关信息源。在分析不同的搜索引擎结果集时,系统根据不同搜索引擎直接与繁殖发现信息源的能力与质量,动态调整繁殖的链接的优先次序。经过实验验证,链接繁殖可以大大扩展通过搜索引擎发现主题信息源的数量。; 陈爽钱榕陈福李素; 关键词：主题发现元搜索链接分析

全选清除导出

共1页<1>

执行隐藏清空

网站首页| 关于我们| 联系我们| 产品服务| 客服中心| 版权声明

版权所有@南京江宁区图书馆 2015－2016 客户热线：400-638-5550

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

用户登录

用户反馈

标题：

*标题长度不超过50

邮箱：

*

反馈意见：

反馈意见字数长度不超过255

验证码：

看不清楚？点击换一张