王利鑫
- 作品数:2 被引量:3H指数:1
- 供职机构:南京信息工程大学计算机与软件学院更多>>
- 发文基金:中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 文本自动比对研究与应用
- 互联网与计算机技术的迅速发展,各种资源呈爆炸式增长,共享程度越来越高,给工作和生活带来极大的便利,成为人们传递和交流信息的重要平台。但是与此同时,造成了网页重复率高、知识产权侵占以及信息的泄密等问题。如何快速、准确的检测...
- 王利鑫
- 关键词:自然语言处理WEB信息抽取
- 文献传递
- 基于自然语言处理的文本泄密自动检测技术被引量:2
- 2011年
- 因文本信息泄密导致的危害越来越严重,但传统的泄密检测还停留在人工查看,效率低且易造成二次泄密。针对以上问题,采用文本相似度自动比较和数据加密方法,提出了一种基于自然语言处理的文本泄密自动检测技术。在实际应用中,因检测粒度过粗可能导致漏检,采用基于自然段落和语句的相似度检测方法,方便疑似段落和语句的自动定位,最后设计并实现了一个文本泄密检测系统。实验结果表明,该技术能很好地应用于涉密文本泄密的检测,具有保密、人工干预少、效率高、疑似段落定位等特点。
- 王利鑫耿焕同孙凯张茜
- 关键词:自然语言处理加密相似度检测信息抽取