张明西
- 作品数:30 被引量:75H指数:4
- 供职机构:上海理工大学出版印刷与艺术设计学院更多>>
- 发文基金:国家自然科学基金上海市自然科学基金上海市教育委员会创新基金更多>>
- 相关领域:自动化与计算机技术文化科学艺术轻工技术与工程更多>>
- 基于深度神经网络的影视评分预测
- 2024年
- 影视评分能直接反映影视作品的上映效果或收益情况,然而目前影视特征的提取方法单一,信息挖掘不充分。针对这一问题,提出一种基于混合特征表示向量的深度神经网络影视评分预测模型。根据影视作品的属性特征通过词袋模型、特征拆分、TF-IDF文本矢量化方法生成影视混合特征表示向量,并构建基于深度神经网络的影视评分预测模型。实验结果表明:测试集MAE、MSE、SmoothL1 Loss指标值在模型100轮迭代训练后收敛,MAE为0.82,MSE为1.07,SmoothL1Loss为0.45,验证了所提方法对影视作品的评分预测有很好效果,能有效评估影视作品上映后的价值。
- 朱衍熹张明西赵瑞许星波
- 关键词:TF-IDF
- 云数据管理研究综述被引量:52
- 2010年
- 作为一种全新的互联网应用模式,云计算已成为人们未来获取服务和信息的主导方式。随着云计算中大数据集高效管理、海量数据中特定数据的快速定位、云端海量数据精准查询等迫切需求的日益显现,Web数据管理正逐步向云数据管理阶段发展,一个新的云数据管理研究领域正逐渐形成。在云计算技术的基础上,提出了云数据管理系统的概念,深度剖析了BigTable、Hbase、Sector/Sphere等当前互联网主流云数据管理系统的基本原理,最后指出了云数据管理领域的主要研究方向。
- 吴吉义傅建庆张明西平玲娣
- 关键词:云计算数据管理软件即服务
- 一种根据维基百科中话题信息使查询词项多样化的方法
- 本发明属于关系数据库技术领域,具体为一种根据维基百科中话题信息使查询词项多样化的方法。该方法的步骤为:给定目标查询词<I>t</I><Sub>0</Sub>,候选扩展集<I>T</I>,维基百科中的话题信息<I>C</I...
- 胡昊张明西汪卫王鹏何震瀛
- 具有历史特征的Biba模型严格完整性策略被引量:3
- 2011年
- 针对Biba模型中的严格完整性策略在保证数据完整性的同时会降低系统兼容性的问题,在Biba严格完整性模型基础上提出了具有历史特征的Biba模型严格完整性策略,将主体完整性等级扩展为独立的读写区间,并根据主体读写历史调整主体可读写的区间,并给出形式化的描述.该模型既可以保护系统数据的完整性,又能提高系统的兼容性.同时,给出所构造规则的实施策略的实现算法,说明该实施策略和常规实施策略具有相同的时间复杂度.
- 张明西韦俊银程裕强王影刘晖
- 关键词:BIBA模型完整性兼容性
- 按需印刷平台中的相似搜索研究
- 2015年
- 目的研究按需印刷平台中的相似搜索效率问题。方法利用用户与产品之间的"购买"关系构建"用户-产品"关系,基于P-Rank提出一种高效的相似搜索方法 POD-Rank,用于从"用户-产品"关系中发现相似产品。POD-Rank相似搜索过程依据"用户-产品"关系离线计算用户相似性,并利用用户相似性在线计算产品相似性,而后进一步提出优化的在线查询处理算法,以降低查询处理的时间开销。结果 POD-Rank的计算时间开销和存储开销显著低于P-Rank,而且能够快速响应查询请求。结论POD-Rank的相似性计算开销为P-Rank的0.03%,存储开销为P-Rank的0.06%,计算效果与P-Rank接近,能够满足按需印刷平台中大规模产品数据处理的需求。
- 张明西张雷洪吕巍孙刘杰
- 关键词:按需印刷P-RANK相似搜索
- 基于本体的程序设计试题语义研究被引量:2
- 2011年
- 采用基于本体的方法,解决在计算机中对试题语义表达问题,实现了对试题的元数据的定义和表示,规范了试题格式和基本语义。通过采集实验数据并根据本体模型对试题进行修正,帮助学生更好地理解试题的语义。同时,试题本体语义能够为将来有关生成多国语言试题的研究提供依据。
- 程裕强张明西王影朱国进
- 关键词:本体语义
- 基于链接关系的Web页面相似度搜索被引量:4
- 2014年
- Web页面相似度搜索对于网络新闻推荐、近似查询等研究领域具有重要作用。SimRank是经典的相似度计算模型,但其预计算时间和空间开销非常巨大,不适用大规模Web页面网络。利用SimRank快速收敛的特点,在SimRank基础上提出高效Web页面相似度搜索方法(WSR),预计算1步迭代相似度矩阵,根据预计算的1步迭代相似度矩阵在线计算给定查询页面和其他页面的2步迭代相似度。通过对Web网络进行静态剪枝,进一步提高预计算和在线查询处理的效率。实验结果显示,WSR显著降低了存储开销和预计算时间开销,且具有较高精确度和快速查询响应时间。
- 靳黛露张月琴张明西
- 关键词:SIMRANK
- 基于预训练–微调策略的电影票房预测
- 2024年
- 有监督学习模型对数据量有着较高的依赖,然而现有电影票房数据集较少,导致预测精度降低。针对上述问题,提出一种基于预训练–微调策略的电影票房预测模型。利用电影评分和电影票房之间的相关性,在电影评分数据集上采用预训练的方式,使模型提前获取有关电影的先验知识,同时利用电影间的属性差异信息进行数据增强,最后在电影票房数据集上进行微调,实现对电影票房的预测。实验结果表明,所提方法R2指标提升了7%,MSE下降了69%。
- 赵瑞张明西杨薪钟昌梅王博闻符云杰
- 信息网络中的相似度搜索问题研究
- 现实生活中存在各种类型的实体,实体之间的相互联系共同构成了大规模的、互联的、复杂的交互网络,这些网络被统称为信息网络。信息网络实体之间的链接关系蕴涵着丰富的语义信息,分析这些信息有助于发现更多有价值的潜在知识。随着信息网...
- 张明西
- 关键词:信息网络
- 一种基于深度神经网络的SimRank相似度计算方法
- 本发明提出一种基于深度神经网络的SimRank相似度计算方法,首先在数据获取阶段将语料库进行预处理成实体ID形式并利用NetWorkX库进行网络构建;将实体进行Node2vec网络特征学习得到语料库网络中特征向量矩阵;将...
- 张明西冒鸿宇朱衍熹