2025年4月7日
星期一
|
欢迎来到南京江宁区图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
西安工业大学校长基金(XAGDXJJ-200715)
作品数:
1
被引量:3
H指数:1
相关作者:
徐飞
姚红革
张素芹
更多>>
相关机构:
西安工业大学
更多>>
发文基金:
西安工业大学校长基金
更多>>
相关领域:
自动化与计算机技术
更多>>
相关作品
相关人物
相关机构
相关资助
相关领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
中文期刊文章
领域
1篇
自动化与计算...
主题
1篇
数据提取
1篇
WEB表格
1篇
XML
1篇
HTMLPA...
机构
1篇
西安工业大学
作者
1篇
张素芹
1篇
姚红革
1篇
徐飞
传媒
1篇
西安工业大学...
年份
1篇
2009
共
1
条 记 录,以下是 1-1
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
面向结构的Web表格数据抽取系统
被引量:3
2009年
针对Web数据挖掘预处理中,Web表格无结构化描述及缺乏清晰语义信息的问题,构建了面向结构的Web表格数据提取系统.利用HTMLParser库的解析原理,设计启发式规则对Web表格结构进行定位、识别、提取并剔除非数据型结构;以Xml规范化模型对提取表格数据进行存储.最后抽取9个中文网站171个数据表格进行验证试验,结果表明对于结构化完整的表格具有较高的识别率并有一定的容错能力.
徐飞
张素芹
姚红革
关键词:
HTMLPARSER
WEB表格
数据提取
XML
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张