邱武松
- 作品数:3 被引量:8H指数:2
- 供职机构:中国科学院重庆绿色智能技术研究院更多>>
- 发文基金:国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于K-means和TF-IDF的中文药名聚类分析被引量:2
- 2014年
- 针对药名聚类中药物命名特殊性导致的命名准确率低的问题,提出了基于TF-IDF和K-means的药名聚类方法。药物命名具有一定的规律性且中西药名命名形式不同等特点,基于字词共现频率的方法难以取得较好的聚类效果,因此,使用TF-IDF方法计算药名相似的方法并采用K-means聚类算法进行药名的聚类。实验结果表明,TFIDF的聚类准确率高于TF的聚类方法,按字切分的聚类准确率高于分词后的聚类准确率,基于字和TF-IDF的聚类准确率最高且稳定,准确率达到96.77%。
- 黄运高王妍邱武松向林泓赵学良
- 关键词:TF-IDFK-MEANS
- 基于序列标注算法比较的医学文献风险事件抽取研究被引量:6
- 2017年
- 医学文献快速增长,如何从医学文献文本大数据中挖掘出有价值的知识是一种巨大挑战。聚焦医学文献中定量风险语句的风险事件抽取,构建智能临床决策支持系统医学风险知识库。运用序列标注算法中重要的隐马尔可夫模型、最大熵马尔可夫模型和条件随机场三种模型分别对医学文献非结构化全文文本中风险事件信息进行抽取,并对算法进行比较。从三个模型平均F1测度值来看,条件随机场效果最好,其次为最大熵马尔可夫模型,然后是隐马尔可夫模型,但是每个模型都有自己对某些风险事件抽取的准确率或者召回率的优势。
- 喻鑫张矩张矩邱武松
- 关键词:隐马尔可夫模型条件随机场
- 一种无线通信设备的自适应参数配置方法
- 本发明涉及一种无线通信设备的自适应参数配置方法,属于无线通信技术领域。该方法通过实时监控用户业务传输信息,动态调整设备配置参数,使系能能力达到最优化,具体包括以下步骤:应用层自适应参数配置模块实时监控用户业务传输信息;在...
- 杨涌张矩黄东王湘林小光邱武松
- 文献传递