朱精南
- 作品数:5 被引量:58H指数:3
- 供职机构:清华大学信息科学技术学院电子工程系更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家教育部“985工程”更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 网页版面信息分析
- 2004年
- 针对HTML网页版面中区域的形成及特点进行了分析,研究了网页版面中区域构成,相互关系等区域信息的分析和表示的方法,提出了一个便于描述网页版面信息的区域树结构,并举例说明了网页版面信息在网页信息处理中的应用。
- 朱精南赵明生
- 关键词:标记树
- 基于内容的中文网页自动分类研究被引量:12
- 2001年
- 本文主要介绍基于内容的网页自动分类系统 ,具体介绍了类别词典的建造方法 ,网页超文本类别词切分的方法 ,中文网页自动分类算法以及利用类别词与网页间的模糊关系对网页文本进行自动分类等内容 .通过对旅游网页进行测试 ,自动分类正确率可达 93.37%以上 。
- 张义忠赵明生朱精南
- 关键词:信息检索中文网页计算机网络
- 网页视图的重构与转化被引量:1
- 2003年
- 文中提出一种用于描述网页结构化信息的数据模型———区域树模型和一种便于计算机处理 ,表示网页信息中间数据结构———标记树。讨论了从网页文本生成网页的标记树和区域树的过程和方法 ,以及使用网页结构化信息对网页视图进行重构和转化。网页版面重构解决了PAD ,SMARTPHONE等智能终端上网浏览Web信息中遇到的一系列的问题。
- 兰东俊朱精南
- 关键词:HTML标记树
- 基于内容的网页特征提取被引量:40
- 2001年
- 文章主要研究基于内容的中文网页的特征提取技术,具体介绍了分词词典的建造方法,网页正文、标记信息和超链信息的特征提取。通过对旅游类网页的实验结果显示,文中的方法和应用效果良好。
- 张义忠赵明生朱精南
- 关键词:信息检索数据库信息资源知识库
- 网页版面中区域几何信息的确定被引量:6
- 2004年
- 针对HTML网页版面中区域的形成及特点进行了分析,研究了估算元素区域在版面中的位置、形状、相互关系等几何分布信息的方法,提出了一种网页版面中区域几何信息分析子系统的实现框架。
- 朱精南赵明生
- 关键词:几何信息