2025年1月7日
星期二
|
欢迎来到南京江宁区图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
吴新涛
作品数:
4
被引量:24
H指数:1
供职机构:
大连理工大学
更多>>
发文基金:
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
理学
更多>>
合作作者
宋明秋
大连理工大学管理科学与工程学院...
李文立
大连理工大学管理科学与工程学院...
张瑞雪
大连理工大学管理科学与工程学院...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
2篇
专利
1篇
期刊文章
1篇
学位论文
领域
2篇
自动化与计算...
1篇
理学
主题
3篇
网页
3篇
网页信息
2篇
知识
2篇
网页文本
2篇
文本
2篇
文本知识
2篇
空间知识
2篇
不良信息
1篇
信息抽取
1篇
信息提取
1篇
网页信息提取
1篇
网页正文
1篇
向量
1篇
向量空间
1篇
向量空间模型
1篇
包装器
1篇
HTML
1篇
抽取
机构
4篇
大连理工大学
作者
4篇
吴新涛
3篇
宋明秋
1篇
张瑞雪
1篇
李文立
传媒
1篇
大连理工大学...
年份
1篇
2010
1篇
2009
2篇
2007
共
4
条 记 录,以下是 1-4
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于中文标点符号的三重网页文本内容识别及过滤方法
一种基于中文标点符号的三重网页文本内容识别及过滤方法。该方法针对现有的基于URL、基于关键字的网页信息过滤方法中存在的滤准率和滤全率低的问题,提出了一种复合型的基于URL、基于关键字、以及基于文本向量空间知识表示方法的网...
宋明秋
吴新涛
文献传递
基于中文标点符号的三重网页文本内容识别及过滤方法
一种基于中文标点符号的三重网页文本内容识别及过滤方法。该方法针对现有的基于URL、基于关键字的网页信息过滤方法中存在的滤准率和滤全率低的问题,提出了一种复合型的基于URL、基于关键字、以及基于文本向量空间知识表示方法的网...
宋明秋
吴新涛
文献传递
网页正文信息抽取新方法
被引量:23
2009年
基于包装器的信息抽取方法只能处理一种特定的信息源,而且对网页结构的依赖性强.基于此提出了一种将中文标点符号和HTML树结构作为识别网页正文内容重要特征的网页分析方法,通过统计中文标点符号确定部分正文信息,然后根据正文信息在结构上的相似性确定其他正文信息内容.实验结果表明该方法能有效地剔除网页噪音并提取网页正文,具有较好的通用性和较高的准确性.
宋明秋
张瑞雪
吴新涛
李文立
关键词:
包装器
网页信息提取
基于向量空间模型的网页信息过滤方法研究
互联网的发展带动了整个社会的发展与变革,电子商务的兴起改变了人们的生活方式,给人们的生活带来了极大便利。但随着电子商务的快速发展,安全问题越来越突出。网络钓鱼等非法站点的存在及迷信、色情、暴力和反动信息的传播严重威胁电子...
吴新涛
关键词:
向量空间模型
文献传递
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张