陈刚
- 作品数:77 被引量:331H指数:10
- 供职机构:浙江大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划浙江省科技计划项目更多>>
- 相关领域:自动化与计算机技术经济管理文化科学机械工程更多>>
- 基于关键词和关键句抽取的用户评论情感分析被引量:10
- 2019年
- 情感分析的一项主要研究任务是根据文档内容对其情感极性(即正类和负类)进行判断。在判断文档的情感极性时,不同的词语和句子具有不同的情感贡献度,因此如何从整个文档中准确地提取与情感分类更相关的词语和句子,从而提升分类性能,成为了一个重要问题。在有监督实验中,基于依存句法关系分析句子的逻辑结构,提取出了与表达情感更相关的词语进行加权,提高了分类性能。在半监督实验中,使用基于中文评论的关键句抽取和分类器融合算法,对整篇文档中包含更多情感词和总结意味的关键句进行了抽取,充分考虑了句子的情感词属性、位置属性、标点符号属性和关键词属性,并且使用分类器融合算法,让置信度最高的子分类器决定分类效果。在大众点评网和头条新闻的数据集上将所提算法与已有的经典算法进行对比,发现所提方法的性能更高,从而证明了基于依存句法分析的关键词抽取和基于特征的中文关键句抽取算法的有效性。
- 喻影陈珂寿黎但陈刚陈刚
- 关键词:情感分析依存分析半监督学习
- 关于主动学习下的知识图谱补全研究被引量:7
- 2020年
- 知识图谱补全任务研究如何补全知识图谱中的缺失关系。知识图谱补全任务有许多广泛的应用,例如可以应用到轨道交通运维知识库中以支撑轨道交通的系统设计、运维优化。现有的算法在用于现实的大规模知识图谱时时间开销巨大,并且无法很好地利用知识图谱外部的数据信息。针对以上两点局限性,提出了一种基于主动学习的知识图谱补全框架。该框架结合主动学习的思想,利用链接预测预先筛选缺失知识图谱中最有可能产生链接的前k对实体对,然后充分考虑知识图谱内部信息和外部信息,采用内外部数据相结合的方式实现知识图谱的缺失补全。基于Freebase和DBpedia数据集,针对已有的工作进行了对比实验,实验结果表明提出的增强链接预测算法(ELP)效果更好,并且具有主动学习能力;提出的内部数据和外部数据相结合的关系验证方法能更有效地验证三元组。
- 陈钦况陈珂伍赛寿黎但陈刚
- 关键词:链接预测
- 一种有效的基于网格和密度的聚类分析算法被引量:22
- 2003年
- 讨论数据挖掘中聚类的相关概念、技术和算法。提出一种基于网格和密度的算法,它的优点在于能够自动发现包含有趣知识的子空间,并将里面存在的所有聚类挖掘出来;另一方面它能很好地处理高维数据和大数据集的数据表格。算法将最后的结果用DNF的形式表示出来。
- 胡泱陈刚
- 关键词:数据挖掘聚类网格高维数据子空间
- 增强权限约束支持的基于任务访问控制模型被引量:25
- 2006年
- 针对基于任务访问控制模型的权限管理与实现机制的不足,在任务规则的基础上,提出一种增强权限约束支持的基于任务访问控制模型.该模型通过任务型权限集合的定义,把任务与权限融合在一起研究权限产生的约束机制,同时给出模型形式化定义以及权限关联的各种约束规则,并介绍了该模型在AVIDM中的应用.实践表明,该模型提供了更灵活的授权机制,增强了任务模型的实用性,方便了权限管理工作,适合事务管理系统与工作流环境下的访问控制建模.
- 尹建伟徐争前冯志林陈刚董金祥
- 关键词:访问控制角色
- 一种面向协作标签系统的图片检索聚类方法被引量:3
- 2010年
- 为了更有效地进行图片检索,提出了一种面向Web2.0协作标签系统的图片检索聚类方法。该算法首先针对标签空间由于标签表达多样性带来的不一致问题,并通过挖掘标签间的词汇关系实现语义级查询扩展来得到语义可能相关的扩展图片结果集;然后根据标签间的相关度度量选出图片结果集中与查询标签高相关的标签集,接着采用一种自顶向下启发式的图划分算法来自动对次相关标签集进行分类。最后图片结果集即根据标签分类结果被聚类。为验证该方法的效果,从标签图片共享网站Flickr上随机下载了大量真实图片集以及所含带的标签元数据,在已实现的图片检索原型系统PivotBrowser上进行了大量实验,结果证明,该聚类算法能有效解决标签空间存在的标签表达不一致问题和标签查询歧义性问题,能提供更满意的用户检索。
- 李晓燕陈刚寿黎但董金祥
- 关键词:标签歧义性
- 基于JAAS企业级的访问控制模型被引量:7
- 2005年
- 目前RBAC模型已得到广泛的认同,但传统的RBAC实现脱离了企业的组织架构,同时认证模块与应用程序紧耦合也可给系统的维护和实现带来困难。该文在大量研究已实现RBAC模型的基础上提出了基于Principal的认证与授权模型、算法的大致思想,并提供了基于J2EE的实现方案。
- 徐光伟尹建伟陈刚董金祥
- 关键词:访问控制企业级责任人JAASJ2EE
- Web服务环境中的SIP增强商业资源列表
- 2004年
- 解析了在未来下一代网络(NGN)中利用Web服务环境和SIP的通信协议进行商业业务开发应用的系统结构,其中在Web服务环境中主要采用SOAP这个消息传递表达的协议与SIP通信协议进行组合交互,实现在下一代网络中的各种商业应用。
- 马原陈刚董金祥
- 关键词:SIP协议简单对象访问协议
- 自然语言生成多表SQL查询语句技术研究被引量:16
- 2020年
- 自然语言生成SQL查询不仅是构建智能数据库查询系统的一个重要组成部分,亦是新型供电轨道交通系统混合时态大数据个性化运维的难点之一。目前利用深度学习模型的方法专注于数据库中单表SQL查询生成,无法解决数据库中多表SQL查询生成。针对这个问题,采用一种基于SQL语句模板填充的方法,将序列生成问题转化为多个分类问题,在训练深度学习模型的过程中充分利用SQL子句不同预测成分之间的依赖关系。在FROM子句的多表JOIN路径生成方面,将其建模为斯坦纳树问题,采用一种全局最优的算法来进行求解。在一个开放的文本生成SQL数据集Spider上对模型和算法进行实验验证,实验结果表明该方法能有效地提升多表SQL查询生成的查询匹配准确率。
- 曹金超黄滔陈刚吴晓凡陈珂
- 关键词:自然语言
- 工作流柔性角色解析研究与实现被引量:14
- 2004年
- 在活动分配管理过程中能够实现多大限度的适应性和柔性,是影响一个工作流管理系统的性能的重要方面。针对工作流的活动分配的适应性需求,提出一种融合负载平衡,实例级上下文环境的柔性角色解析方法,从而提高了工作流的适应性。
- 周勇军尹建伟陈刚董金祥
- 关键词:角色解析负载平衡
- 基于路径连接的XML复杂小枝模式查询处理被引量:1
- 2011年
- 针对可扩展标记语言(XML)查询中具有嵌套OR谓词的复杂小枝模式查询处理,提出一种基于路径连接的查询方法.该方法以路径为分解粒度,结合分支扩展(AOBE)的概念,通过路径连接过程实现对复杂小枝模式查询的整体处理.为了进一步提高算法效率,在已有研究的基础上挖掘相应的优化规则,利用索引跳过那些明显不参与连接的元素的访问和计算.与已有算法相比,基于路径连接的查询方法大大简化了复杂小枝模式查询处理过程,只访问查询叶节点对应的元素,可以显著减少结构连接的操作数目和扫描元素的个数.实验结果表明,该方法能够有效地改善复杂小枝模式查询处理的性能.
- 江锦华吴羽胡天磊陈刚
- 关键词:小枝模式索引