房晓南
- 作品数:11 被引量:23H指数:3
- 供职机构:山东师范大学更多>>
- 发文基金:山东省自然科学基金国家教育部博士点基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于半监督和集成学习的不平衡数据特征选择和分类
- 随着大数据时代的到来,机器学习和数据挖掘技术正面临着前所未有的机遇和挑战。作为机器学习最核心的研究领域之一,分类问题受到了研究者持续而广泛的关注,并且出现了大量的经典理论、算法模型和应用软件。但是在现实应用领域,获取到的...
- 房晓南
- 关键词:不平衡数据数据分类半监督学习
- 基于多视图典型相关分析的垃圾网页检测被引量:4
- 2013年
- 首先将垃圾网页特征分为两个不同的视图,即基于内容特征的视图和基于链接特征的视图,利用典型相关分析及其相关改进方法进行特征提取,生成两组新的特征;再对新生成的两视图特征采用不同组合方式产生单视图数据,并用这组数据作为训练数据构建分类算法。实验结果表明,将垃圾网页看成两视图数据,并应用多视图典型相关分析技术,可有效提高垃圾网页的识别精度。
- 高爽张化祥房晓南
- 关键词:特征抽取
- 课堂教学过程不平等及对策研究
- 2005年
- 随着教育的普及,教育"不平等"渐从"就学权利"的不平等转向"教育过程"的不平等.即便是在同一班级,也存在课堂学业指导的不平等,加重了学生入学时存在的差距,进而导致就读高中机会的不平等.课堂教学不平等导致的学生学业差距的加大、厌学情绪的出现、后继教育的不平等等现象,应引起我们的重视并努力研究解决的策略.
- 杜颜伶刘文贤房晓南
- 关键词:课堂教学过程班级学业指导厌学情绪教育过程后继教育
- 高校学生思想政治教育主题网站建设研究被引量:2
- 2008年
- 大学生思想政治教育主题网站是开展网络思想政治教育的重要阵地,但各高校的大学生思想政治教育网站普遍存在理念滞后、内容枯燥、形式单调、技术不新、特色不明等主要问题。针对这种情况,笔者从教育理念、制度建设、内容建构等方面对主题网站建设策略进行了分析和探讨。
- 房晓南郝迎伟刘楠
- 关键词:高校网络思想政治教育主题网站
- Web数据挖掘在电子商务推荐系统中的应用研究
- 电子商务因其成本低廉、快捷、不受时空限制等优点在全球范围内得到普及和发展,它的规模也在进一步扩大。在电子商务为用户提供越来越多选择的同时,它的结构也变得越来越复杂,电子商务的发展面临这样一个新问题——一方面,用户对网络上...
- 房晓南
- 关键词:电子商务WEB数据挖掘CRM推荐系统关联规则聚类
- 文献传递
- 西方逻辑与传统文化在教育中的碰撞
- 2004年
- 物理课程标准明确提出“从生活走向物理,从物理走向社会”的基本理念,新课程不再是单一的、理论化的、体系化的书本知识,而是向学生呈现人类群体的生活经验,并把它们纳入到学生生活世界中加以组织建构。但不能否认,寻逻辑之名起于欧洲,虽逻辑之理存乎天壤,但现用的理科逻辑对国人来说终究 [1]是拿来主义。西方逻辑与中国传统文化生活有冲突也有联系,本文试图通过对该问题在教育生活中的讨论,探讨怎样使理科的蕴含逻辑更好地融入学生生活,以期用优质的教育促进学生的发展,促进中国文化的发展。
- 杜颜伶刘文贤房晓南
- 关键词:传统文化西方逻辑跨文化交流社会实践活动
- 课程模块化设计与有效选择
- 2004年
- 课程改革与选择经过专家的审议和教育部党组的研究审定,2003年3月31日,教育部印发了《普通高中课程方案(实验)》和15个学科的课程标准(实验)。在普通高中新课程中,许多科目将内部的课程模块分为必修模块与选修模块,学生可以在选修模块中自由选择。例如高中物理课程由12个模块构成,每个模块占2学分,其中物理1和物理2为共同必修模块,其余为选修模块。学生完成共同必修模块的学习后,可获4学分,接着必须再选择学习一个模块,以便完成6个必修学分的学习任务。在获得6个必修学分后, 学生还可以根据自己的兴趣。
- 杜颜伶刘文贤房晓南
- 关键词:必修模块选修模块高中物理教育部党组模块化设计
- 基于SMOTE和随机森林的Web spam检测被引量:12
- 2013年
- Web spam是指采用某些技术手段,使得网页在搜索引擎检索结果中的排名高于其应得排名的行为,它严重影响搜索结果的质量。考虑到Web spam数据集的严重不平衡情况,本研究提出先使用SMOTE过抽样方法平衡数据集,再利用随机森林算法训练分类器。通过对常见的单分类器和集成学习分类器的对比实验,发现SMOTE+RF方法表现较为突出,并根据实验结果优化了方法中的重要参数,对使用SMOTE方法后AUC值提高的原因进行了分析。在WEBSPAM UK2007数据集上的实验证明,该方法可以显著提高分类器的分类效果,其AUC值已经超过了Web Spam Challenge 2008上的最好成绩。
- 房晓南张化祥高爽
- 关键词:SMOTE搜索引擎作弊
- 基于集成学习方法的Web spam检测
- 房晓南张化祥高爽
- 关键词:SMOTE搜索引擎作弊
- 文献传递
- 基于独立成分分析和协同训练的垃圾网页检测被引量:1
- 2013年
- 垃圾网页检测具有重要意义,由于只有少量标记网页,所以可使用半监督协同训练方法检测垃圾网页。将网页特征分为两个视图,即内容视图与链接视图。首先使用独立成分分析分别提取两视图特征的独立成分,然后进行协同训练。实验结果表明,该方法可有效提高垃圾网页检测精度,同时验证了对两个视图分别进行独立成分分析相比于其他方法更为有效。
- 高爽张化祥房晓南