2025年4月18日
星期五
|
欢迎来到南京江宁区图书馆•公共文化服务平台
登录
|
注册
|
进入后台
[
APP下载]
[
APP下载]
扫一扫,既下载
全民阅读
职业技能
专家智库
参考咨询
您的位置:
专家智库
>
>
李艳梅
作品数:
4
被引量:112
H指数:2
供职机构:
华北电力大学
更多>>
发文基金:
国家自然科学基金
更多>>
相关领域:
自动化与计算机技术
更多>>
合作作者
郭庆琳
华北电力大学计算机科学与技术学...
唐琦
华北电力大学计算机科学与技术学...
毛鑫
华北电力大学计算机科学与技术学...
作品列表
供职机构
相关作者
所获基金
研究领域
题名
作者
机构
关键词
文摘
任意字段
作者
题名
机构
关键词
文摘
任意字段
在结果中检索
文献类型
1篇
期刊文章
1篇
学位论文
1篇
会议论文
领域
3篇
自动化与计算...
主题
3篇
文本相似度
3篇
相似度
2篇
文本相似度计...
2篇
相似度计算
2篇
VSM
1篇
登录
1篇
多文档
1篇
多文档文摘
1篇
信息处理
1篇
语义WEB
1篇
中文
1篇
中文文本
1篇
中文文本聚类
1篇
未登录词
1篇
未登录词识别
1篇
文本
1篇
文本聚类
1篇
文档
1篇
文摘
1篇
向量
机构
3篇
华北电力大学
1篇
北京大学
作者
3篇
李艳梅
2篇
郭庆琳
1篇
唐琦
传媒
1篇
计算机应用研...
1篇
华北电力大学...
年份
1篇
2009
1篇
2008
1篇
2007
共
4
条 记 录,以下是 1-3
全选
清除
导出
排序方式:
相关度排序
被引量排序
时效排序
基于VSM的文本相似度计算的研究
被引量:110
2008年
文本相似度的计算作为其他文本信息处理的基础和关键,其计算准确率和效率直接影响其他文本信息处理的结果。提出改进的DF算法和TD-IDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,并通过适当增加关键词的方法,弥补了其对个别有用信息错误过滤的不足;另一方面,利用特征项在特征选择阶段的权重对TD-IDF方法进行加权处理,在不增加开销的情况下扩大了文档集的规模,还提高了相似度计算的精确度。
郭庆琳
李艳梅
唐琦
关键词:
文本相似度
向量空间模型
基于文本相似度的中文文本聚类的研究
文本聚类是文本挖掘和信息检索领域的重要研究课题,而中文自动分词、特征选择和相似度计算等是中文文本聚类研究的关键技术。本文详细综述了文本聚类技术的相关研究;研究了中文未登录词识别和歧义消解;研究和分析比较了常用的特征选择方...
李艳梅
关键词:
文本聚类
未登录词识别
文本相似度
多文档文摘
文献传递
网络资源链接
基于VSM的文本相似度计算的研究
文本相似度的计算作为其它文本信息处理的基础和关键,其计算准确率和效率直接影响其它文本信息处理的结果。本文提出改进的DF算法和TD-IDF算法,一方面利用了DF算法具有线性的时间复杂度,比较适合大规模文本处理的特点,另一方...
李艳梅
郭庆琳
唐琦
关键词:
文本相似度
语义WEB
信息处理
文献传递
全选
清除
导出
共1页
<
1
>
聚类工具
0
执行
隐藏
清空
用户登录
用户反馈
标题:
*标题长度不超过50
邮箱:
*
反馈意见:
反馈意见字数长度不超过255
验证码:
看不清楚?点击换一张