北京拓尔思信息技术股份有限公司
- 作品数:180 被引量:332H指数:10
- 相关作者:都云程王弘蔚房祥林春雨付成睿更多>>
- 相关机构:北京信息科技大学北京大学中国电子技术标准化研究院更多>>
- 发文基金:国家自然科学基金北京市教委科技发展计划国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学经济管理哲学宗教更多>>
- 图像处理方法、装置、电子设备和存储介质
- 本公开实施例提供一种图像处理方法、装置、电子设备和存储介质。图像处理方法包括:获取含有非空白图像区域的待处理图像;对所述待处理图像执行二值化处理,获得二值化图像;自所述二值化图像的一个顶点像素点开始,分别沿相互垂直的两个...
- 程涛肖诗斌李渝勤
- 文献传递
- 基于特征补偿的视频字幕识别研究被引量:2
- 2010年
- 视频中的字幕对多媒体检索技术提供了重要的信息,主要介绍视频字幕识别技术中的特征提取方法。根据字幕不同于印刷体和手写体中常出现的问题,提出了字符位置特征和字符区域笔画分布特征、字符笔画密度特征两种修改过的特征提取方法与传统的字符外围特征结合使用,并进行了实验测试,结果表明这些方法对字幕识别是可行的。
- 梁松涛吕学强施水才王涛
- 关键词:视频字幕特征相似度
- 中文专利文献术语抽取被引量:10
- 2013年
- 为了有效解决专利文献中术语抽取问题,提出采用字符串之间的结合强度融合词性过滤法抽取术语的方法。根据专利文献中术语出现的特点,提出了字符串之间的边界结合度方法和字符串之间的串边结合度方法,度量了字符串间的结合强度。在此基础之上,根据术语内部结构中词性的组成特点,提出了术语双字词性过滤的方法,并与结合强度的计算方法进行融合。实验结果表明,该方法对中文专利术语抽取有很好的效果,平均正确率为80.24%,平均召回率为80.61%。
- 徐川施水才房祥吕学强
- 基于多尺度条件随机场的文本图像二值化
- 2009年
- 提出一种基于多尺度条件随机场(简称mCRF)的图像二值化算法。该算法将对图像的二值化看作一个标注过程,利用mCRF模型对图像中每个像素点进行标记,从而实现对整幅图像的二值化。mCRF模型属于判别式模型,可以容纳任意的非独立特征,从而充分利用图像本身信息。实验结果表明,本算法比常用的阈值法效果有很大提高。
- 刘坤吕学强王涛施水才
- 关键词:文本图像二值化特征函数
- 基于特征分选策略的中文共指消解方法被引量:2
- 2011年
- 针对基于机器学习的中文共指消解中不同类别名词短语特征向量的使用差异,提出一种基于特征分选策略的方法。该方法在选择特征向量时对人称代词和普通名词短语分别处理,充分利用不同名词短语的已有特征进行共指消解,并减少部分无效特征在共指消解过程中产生的"噪声"。实验结果表明,该中文共指消解方法能提高共指消解的性能,F值达到80.72%。
- 李渝勤甘润生杨永红施水才
- 关键词:共指消解自然语言处理支撑向量机数据词典
- 基于融合词性的BiLSTM-CRF的期刊关键词抽取方法被引量:10
- 2021年
- 【目的】利用CRF模型处理序列标注问题的优势,通过将词性信息和CRF模型融入BiLSTM网络,实现期刊关键词的自动抽取。【方法】将关键词抽取问题视为一个序列标注问题。对期刊文本进行分词和词性标注的预处理;对预处理后的文本使用Word2Vec模型进行Word Embedding向量化,获取字词的向量表达式;使用BiLSTM-CRF模型进行关键词的自动抽取。【结果】使用融合词性的BiLSTM-CRF网络,在采集的知网期刊文本上进行实验,在简单关键词方面,准确率较原始的BiLSTM模型提升3%;在复杂关键词方面,准确率较原始的BiLSTM模型提升12%。【局限】期刊关键词抽取模型无法准确抽取复杂关键词,需要针对复杂关键词层面进一步提升模型性能。【结论】融合词性的BiLSTM-CRF模型与传统方法相比,具有较高的识别准确率,是一种有效的关键词抽取方法。
- 成彬施水才都云程肖诗斌
- 关键词:抽取条件随机场
- 一种音视频在线虚拟剪辑方法和系统
- 本发明提供一种精准的音视频在线虚拟剪辑方法,其包括:步骤S10,音视频对象获取;步骤S20,音视频对象转码;步骤S30,用户在线剪辑;步骤S40,音视频对象准确定位;步骤S50,剪辑关联。将剪辑工具嵌入浏览器,采用流媒体...
- 肖诗斌刘珅
- 文献传递
- 揭示“信息冰山”的真面目——内容管理的核心技术被引量:1
- 2004年
- 小A是一家咨询公司的业务骨干,面对繁忙的咨询工作,平均每天至少要花2小时来搜索所需信息。而且随着信息格式的多样化,小A发现结构化的数据越来越难以满足工作的需要。相反,大量诸如文档、邮件、声频、视频等类型的信息却越来越重要,而公司对这些信息的管理始终不得章法。 其实,小A的困惑在“信息爆炸”年代是一种普遍现象,人们在惊诧信息增长速度的同时,发现除关系型数据之外的大量非结构化数据,没有得到妥善管理。小A在咨询关于非结构化数据管理措施时,专家向他介绍了内容管理。至此,小A明白,他日常所能自如应用的数据只是“信息冰山”的一角。
- 韩啸
- 关键词:内容管理关系型非结构化数据邮件
- 企业竞争情报系统功能架构剖析
- 本文从竞争情报系统的特性和应用价值出发,分析了竞争情报系统应具备的功能架构,并在此基础上简单介绍了建立在内容管理平台上的TRSCIS的架构,最后总结了竞争情报工作处于不同阶段的企业,对功能架构的关注点.
- 贺兆辉
- 关键词:竞争情报系统情报加工情报服务企业管理
- 文献传递
- 基于内容的文档图像检索的特征抽取研究
- 随着多媒体资源的飞速增长,多媒体检索技术成为当前检索技术的一个热点,该文将介绍文档图像这类特殊的多媒体资源检索技术中的特征提取方法。根据汉字特点,从几个角度,介绍了几种汉字图像块的特征提取方法及相应的相似度算法,并进行了...
- 马永成肖诗斌林春雨施水才
- 关键词:文档图像特征提取方法相似度计算
- 文献传递