程葳
- 作品数:24 被引量:89H指数:6
- 供职机构:北京城市学院更多>>
- 发文基金:国家高技术研究发展计划北京市教育委员会科技发展计划面上项目国家242信息安全计划更多>>
- 相关领域:自动化与计算机技术文化科学语言文字经济管理更多>>
- 网络论坛中发帖行为复杂性研究被引量:12
- 2009年
- 网络论坛是我国互联网舆论形成的重要力量之一,正引起社会各方的广泛关注.通过对大量实际数据的统计分析,发现网络论坛发帖量满足:幂次定律、自相似性、1/f噪声和捷夫定律.说明网络论坛是一个复杂的自组织临界态系统.应用自组织临界理论可以分析网络突发事件和舆论形成中的诸多现象.最后提出一种评价网络论坛舆论的定量指标.实验表明,该指标能有效发现网络论坛突发事件.
- 程葳钟华孙娇华
- 关键词:自相似性网络论坛
- 面向BBS的话题挖掘初探
- 本文提出一种在BBS环境下进行热门话题挖掘的算法.BBS以讨论为主的文体决定了同一话题的文章在词语向量上并不一定相似,单纯采用基于向量空间模型的聚类算法难以有效地完成话题挖掘的任务.因此,本文的话题挖掘在一般文本聚类算法...
- 邱立坤程葳龙志祎孙娇华
- 关键词:BBS文本聚类数据挖掘
- 文献传递
- 限定领域内汉英口语的统计翻译方法研究
- 机器翻译是自然语言处理的重要应用领域.口语翻译作为机器翻译的一个新兴分支,具有重要的理论意义和实用价值,正受到越来越多的关注.该文以基于统计的翻译方法为研究主线,提出和建立了一整套限定领域内汉英口语的统计翻译框架,并就其...
- 程葳
- 关键词:口语翻译统计机器翻译语块
- 文献传递
- 网络论坛虚拟社会的无尺度特性初探
- 本文从无尺度网络特性出发,在真实网络论坛数据库下,对互联网虚拟社会的行为进行定量分析,实验发现网络虚拟社会也是一种无尺度网络,具有幂率分布、偏好连接和鲁棒性与脆弱性兼备等特点.
- 程葳孙娇华孙承意
- 关键词:虚拟社会无尺度网络数据库
- 文献传递
- 面向互联网新闻的在线话题检测算法被引量:9
- 2009年
- 针对互联网新闻报道冗余多、议题发散、易漂移等特点,提出一种面向互联网的在线话题检测算法。该算法针对冗余问题提出子话题概念,针对议题发散问题建立双层检测结构,针对话题漂移问题提出基于滑动窗口的跟踪策略。应用该算法建立网上话题检测系统,通过来源于互联网的真实数据进行测试。结果表明,算法性能优于传统的单路径聚类算法,其最小错误代价率低于0.14。
- 程葳龙志祎
- 关键词:话题检测与跟踪文本聚类
- 面向互联网的话题发现技术研究
- 话题发现与跟踪(Topic Detection and Tracking,TDT)是一项由国际公开评测驱动的研究,旨在依据事件对语音和文本信息进行分析和组织。自1996年启动以来,该研究受到普遍关注,取得巨大进步, 也遇...
- 邱立坤陶然龙志祎程葳
- 关键词:文本聚类
- 文献传递
- 社区微博互动水平的影响因素研究——以北京市为例
- 2014年
- 社会管理创新离不开虚拟社会管理创新。本文对新浪微博网站中的北京地区社区微博进行动态跟踪,总结提取了提升社区微博受互动水平的关键影响因素,并根据数据挖掘结果对如何加强社区微博互动能力提出了建议。
- 程葳易红梅王强刘承水
- 关键词:数据挖掘
- 一种面向口语的译文质量自动评价方法被引量:6
- 2002年
- 译文质量的自动评价对机器翻译研究具有十分重要的意义。但现有方法主要是针对书面语翻译 ,没有考虑到口语翻译的特征。因此 ,本文提出了一种面向口语的新型的自动评价方法 ,通过定义信息段、标注权重和设计多种匹配策略等方法 ,使自动评价结果与人工打分更为接近 ,同时也提高了评价过程对不同输出译文的适应能力。各项实验表明 ,该算法对译文质量变化具有较高的敏感度 。
- 程葳徐波
- 关键词:机器翻译评测口语翻译译文质量信息段
- TDT中新发现话题的分类研究与实现被引量:3
- 2009年
- 根据数据源为新闻网站的TDT(topic detection and tracking)系统的话题特点,首先提出了话题分类思想,然后将KNN(k-nearest neighbor)算法与网站频道信息相融合对话题进行分类。实验表明,话题分类的正确率达到98%,具有较高的实用性。
- 龙志祎程葳沈俊辉
- 关键词:TDTKNN
- 利用Hurst指数预测网络话题热度被引量:1
- 2012年
- 面向大规模真实数据,应用聚合方差法、周期图和重标极差法对互联网信息发布数据进行研究,发现网民发布信息具有自相似和长相关特性。通过对各序列的Hurst指数估计,揭示了网络论坛日发帖量未来变化与历史的变化趋势一致;网民发帖量低发帖量网民与高发帖量网民的变化趋势一致;以及每日网民发帖量后发帖网民与先发帖网民的变化趋势一致等特性。这些性质对深入认识网络论坛规律、预测网络突发事件等具有一定参考价值。提出一种评价网络论坛舆论的定量指标。实验表明,该指标能有效发现网络突发事件。
- 程葳
- 关键词:分形HURST指数长相关性自相似性