肖宝 作品数:19 被引量:45 H指数:5 供职机构: 钦州学院 更多>> 发文基金: 广西壮族自治区自然科学基金 国家自然科学基金 广西壮族自治区科学研究与技术开发计划 更多>> 相关领域: 自动化与计算机技术 文化科学 环境科学与工程 更多>>
基于潜在语义与图结构的微博语义检索 被引量:4 2017年 微博文本短小、特征稀疏、与用户查询之间存在语义鸿沟的特点会降低语义检索效率。针对该问题,结合文本特征和知识库语义,构建基于潜在语义与图结构的语义检索模型。通过Tversky算法计算基于Hashtag的特征相关度;利用隐含狄利克雷分布算法对Wikipedia语料库训练主题模型,基于JSD距离计算映射到该模型的文本主题相关度;抽取DBpedia中实体及其网络关系连接图,使用SimRank算法计算图中实体间的相关度。综合以上3个结果得到最终相关度。通过短文本和长文本检索对Twitter子集进行实验,结果表明,与基于开放关联数据和图论的方法相比,该模型在评估指标MAP,P@30,R-Prec上分别提高了2.98%,6.40%,5.16%,具有较好的检索性能。 肖宝 李璞 胡娇娇 蒋运承关键词:图结构 语义检索 面向RDF数据的语义扩展查询方法 2016年 随着大数据时代的到来,互联网所承载的信息呈现出异构性强、价值密度低、来源分布广、实时性高等新的特点.因此在信息检索时,与获取相关网页相比,人们更希望获得页面中包含的知识.RDF作为一种新的知识表示和发布形式,以其精确且易于理解的语义结构得到了广泛的认可和应用.但传统基于语法匹配策略的SPARQL查询方法无法发现RDF数据中不同谓词间的隐含语义,不能从语义层面上获取更加完备的查询结果.针对这一问题,设计了一种新的查询方法来扩充传统SPARQL查询模式.首先分析RDF三元组中谓词的语义属性.在此基础上,根据不同谓词间语义属性的标注,对输入SPARQL语句中具有语义属性的谓词进行扩展,从而给出了一种新的一般化的查询策略.最后通过实验验证了这种语义扩展查询方法的可行性和正确性. 李璞 肖宝关键词:语义扩展 RDF数据 大数据 基于Ontology的北部湾海洋信息知识库的研究 被引量:2 2009年 Ontology在许多领域的知识库都得到研究和应用,但在海洋信息领域还是空白。研究分析了北部湾海洋信息的特点;构建了一个海洋领域本体,实现了知识的表示和复用,并结合Ontology给出了知识库的架构,采用Jena技术实现知识的推理,提高了知识共享和协作能力。 肖宝 施雅贤 黄瑜关键词:ONTOLOGY 知识库 一种基于RFID阵列的无轨自动导航小车系统 本实用新型公开了一种基于RFID阵列的无轨自动导航小车系统,包括车体和用于控制车体的控制装置,还包括作为车体运行场地的RFID阵列地板,RFID阵列地板主要由M块RFID地板砖依次铺设而成,每一块RFID地板砖按顺序对应... 梁家海 赵荣阳 黄瑜 刘志先 梁剑烽 阳建中 肖宝 姜愉基于语义相关度和频繁项集挖掘的文本分类 2017年 为丰富和更好识别文本的特征以提高分类精度,采用一种新的算法CBAFIS(classifier based ESA and frequent item sets):首先引入基于有着内容丰富、更新速度快特点的维基百科而设计的ESA算法对训练文本中特征与维基中的概念进行语义相关度计算,把相关度最高的若干概念对词袋进行特征扩展;然后以扩展后的文档为事务、文档中的概念为项,构建FP-Tree,利用FP-Growth挖掘不同类别文本的特征频繁项集;最后将频繁项集结合Naive Bayes算法构建一个文本分类器。实验表明:新的方法在进行语义扩展后的正确率、召回率在最优的情况下分别比Native Bayes和SVM算法高出2.7%和2.6%以上,具有更高的精度。 肖宝 李璞 曲艺 胡文君关键词:语义相关度 频繁项集 NAIVE BAYES 文本分类 一种移动式计算机机房 本实用新型涉及计算机领域,公开了一种移动式计算机机房,包括机房、支撑杆、轴承、螺旋弹簧、盛放箱、门、导杆、滑动环、紧固螺钉、连接杆、滑杆、定位块、螺杆、通风口、照明灯和支撑板,所述支撑板焊接在机房内部,所述轴承上侧焊接有... 孙继旋 肖宝 张科研 庞启硕 贾广攀 刘浩宇 席红霞搪瓷釉料 本发明公开了一种搪瓷釉料,按重量百分比计,由以下组分构成:SiO<Sub>2</Sub> 50~65%、Al<Sub>2</Sub>O<Sub>3</Sub> 20~30%、B<Sub>2</Sub>O<Sub>3</S... 孙继旋 张科研 蒋庆华 钟恒成 王宁 甘冠蓝 贾广攀 肖宝面向旅游领域的语义查询扩展方法 被引量:9 2010年 针对传统语义查询扩展方法存在返回结果多以及准确率不高的问题,以旅游领域为背景,提出一种语义加权查询扩展方法。利用本体推理能力与本体中的实体相关度进行查询扩展,结合TF-IDF算法的词频加权与语义相关度加权改善检索结果的排序。实验结果表明,相比其他2种方法,该方法能使更多符合要求的查询结果靠前排列,提高了旅游信息检索的正确率。 施雅贤 李璞 肖宝 韦婷婷 蒋运承关键词:语义查询扩展 领域本体 信息检索 混合词汇特征和LDA的语义相关度计算方法 被引量:5 2017年 文本语义相关度计算在自然语言处理、语义信息检索等方面起着重要作用,以Wikipedia为知识库,基于词汇特征的ESA(Explicit Semantic Analysis)因简单有效的特点在这些领域中受到学术界的广泛关注和应用。然而其语义相关度计算因为有大量冗余概念的参与变成了一种高维度、低效率的计算方式,同时也忽略了文本所属主题因素对语义相关度计算的作用。引入LDA(Latent Dirichlet Allocation)主题模型,对ESA返回的相关度较高的概念转换为模型的主题概率向量,从而达到降低维度和提高效率的目的;将JSD距离(Jensen-Shannon Divergence)替换余弦距离的测量方法,使得文本语义相关度计算更加合理和有效。最后对不同层次的数据集进行算法的测试评估,结果表明混合词汇特征和主题模型的语义相关度计算方法的皮尔逊相关系数比ESA和LDA分别高出3%和9%以上。 肖宝 李璞 蒋运承关键词:词汇特征 基于项目驱动法的模块化教学改革研究 被引量:9 2016年 "模块化教学体系"是高校向应用技术型转型中采用的一种被国际公认有效的人才培养模式,针对目前进行模块化教学中普遍存在的问题,应将模块中的多项课程视为一门综合课程,将项目驱动法融入到模块体系中进行教学,并从模块划化、项目设计、教师与教材配备等多方面进行改革。计算机科学与技术专业的系统开发能力模块项目驱动法在模块化教学中的应用,可为模块化教学改革提供一种新的可行的有效方案。 肖宝 李璞关键词:模块化教学 项目驱动法 计算机科学与技术