国家教育部博士点基金(20020610007)
- 作品数:59 被引量:544H指数:16
- 相关作者:唐常杰于中华元昌安左劼段磊更多>>
- 相关机构:四川大学成都中医药大学中国人民解放军炮兵学院更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术自然科学总论更多>>
- M-GEP:基于多层染色体基因表达式编程的遗传进化算法被引量:43
- 2005年
- 该文提出了一种新的基于多层染色体基因表达式编程的遗传进化算法MGEP,新算法引入了多层染色体的概念,利用染色体构建的层次调用模型对个体进行表达,在解决实际函数发现、电路进化等实际问题中取得了良好效果.该文主要贡献包括:(1)提出了基于多染色体的基因表达式编程算法(MGEP);(2)建立了不同染色体的层次调用模型及存储结构;(3)提出并实现了基于染色体的重组算子和基因随机重组算子.对多基因GEP和单基因GEP的对比实验结果表明,平均进化辈数仅为后者的29%~81%.
- 彭京唐常杰李川胡建军
- 关键词:遗传进化基因表达式编程
- 基于基因表达式编程的知识发现的三项新技术——转基因,重叠基因表达和回溯进化被引量:21
- 2005年
- 介绍了在研发基于基因表达式编程(GEP)的知识发现的三项新技术,包括:(a)转基因技术,通过注入转基因,引导进化方向,控制知识发现过程;(b)重叠基因表达,借鉴生物基因片段重叠表达,引入重叠基因概念,节约了表达空间;(c)回溯进化,借鉴生物“返祖现象”,引入回溯检查点概念和可回溯GEP算法、设计了等比递增检查点序列和加速递增检查点序列,约束回溯过程。实验表明,三项技术在一定的场合下分别提高了知识发现的性能1至2个数量级。
- 唐常杰彭京张欢钟义啸
- 关键词:知识发现基因表达式编程转基因
- 基于基因表达式编程的递归函数挖掘被引量:3
- 2007年
- 传统基因表达式编程(GEP)无法发现递归函数。为此,分析了传统GEP算法在函数挖掘方面不足的深层次原因,提出了基于递归染色体的基因表达式编程算法GEP-RecurMiner和动态进化策略(DSCMS)。理论分析和实验证明了GEP-RecurMiner极大地扩充了传统GEP函数挖掘方法的求解空间,能精确地发现传统GEP无法发现的递归函数,同时实验表明动态进化策略有效地提高了GEP-RecurMiner函数挖掘算法的效率,挖掘成功率提高20%,平均进化代数下降10%。
- 吴江唐常杰姜玥叶尚玉段磊李太勇
- 关键词:基因表达式编程递归函数函数挖掘
- 基于前后文词形特征的生物医学文献句子边界识别被引量:1
- 2006年
- 针对生物医学文献的特点及信息抽取的特殊要求,提出了基于前后文词形特征和有教师学习的句子边界识别算法.与针对一般英语书面语设计的句子边界识别算法不同,本文提出的算法不使用特殊的辅助词表和语法层面的特征信息,只使用前后文单词的词形信息作为句子边界识别和消歧的依据.利用这些特征设计了最大信息熵识别器和支持向量机识别器,并在Medline摘要上进行了实验,达到了超过99%的正确率.实验结果表明,最大信息熵法和支持向量机法在句子边界消歧问题上具有相近的性能,同时还表明,对生物医学文献句子边界识别,只使用词法层面的特征,不使用辅助词表和词性等语法层面的信息,仍可达到其它算法在一般英语书面语上利用辅助词表和词性信息所达到的性能.
- 于中华张容唐常杰左劼张天庆
- 关键词:自然语言处理句子边界识别
- 一种基于频度路径树的XML缓存模型被引量:1
- 2006年
- 提出并实现了一种新的称为频度路径树的XML缓存模型,FTree Cache.新模型根据频繁查询路径模式对源XML文件进行投影,生成相应的缓存文件.对用户提交的查询进行判断,提取相应的缓存文件来响应.通过对XML的投影缓存,可以有效降低查询的响应时间和大大减少内存的占用量.实验表明了方法的有效性,对内存的占用大约是原来的20%,响应时间约为原来的43%.
- 金朋纬唐常杰胡明耀孙茜陈宇
- 提高基因表达式编程发现知识效率的回溯策略被引量:13
- 2006年
- 传统基因表达式编程(GEP)编码简单,适应性强,但可能陷入局部最优的“早熟”陷阱.因此,作者借鉴生物界的“返祖现象”,提出了基于回溯的基因表达式编程方法.主要工作包括:(1)在传统GEP算法中引入回溯机制,提出基于回溯策略的GEP算法GEPBS(GEP withBacktracking Strategy);(2)提出回溯检查点概念,设计等比递增检查点序列和加速递增检查点序列,约束回溯过程;(3)扩充基于回溯的GEP算法,设计了退化因子(RF),提出了按比例回溯策略GEPPBS(GEP with Proportional Backtracking Strategy);(4)通过两个实验验证了新算法的有效性,在相同条件下较传统算法的适应度最大提高了49.2%,成功率最高提高了4倍.
- 钟义啸唐常杰陈宇段磊魏大刚
- 一种松耦合的生物医学命名实体识别算法被引量:3
- 2007年
- 生物医学命名实体识别(Bio-NER)是生物医学文献挖掘利用的基础工作。针对目前Bio-NER存在的困难和问题,提出了松耦合的Bio-NER算法LCA,该算法利用启发规则过滤器、词性模板匹配及改良的隐马尔科夫模型(HMM)识别生物医学命名实体。在GENIA corpus3.02语料库上进行的实验表明,LCA可以达到80%的准确率和89%的召回率,优于相关工作中的结果。
- 胡俊锋陈蓉陈源陈浩于中华
- 关键词:隐马尔科夫模型
- MAuct:一个基于Web服务技术的移动拍卖系统被引量:1
- 2006年
- Web服务是移动电子商务的有效解决方案.作者开发实现了一个基于Web服务技术的移动拍卖系统MAuct.主要工作包括:(1)分析了系统实现过程中的特殊困难和采用的特殊技术;(2)将MAuct系统成功地移植到无线移动设备中;(3)实验证明,作者提出的对移动拍卖系统应用程序进行优化的新方法可使系统整体性能提高约30%.
- 乔少杰唐常杰彭京彭舰朱明放曾涛韩楠
- 关键词:WEB服务
- 基于基因表达式编程的属性融合分类算法
- 提出的GAM属性融合算法解决了传统符号分类算法的不足,提高了分类的精度;设计保留最优基因的策略提高GAM算法的收敛速度;提出的SubsmallAttSet算法弥补了GAM和IGAM需要预先指定属性个数的缺点.
- 赵波唐常杰朱明放魏大刚左劼
- 关键词:基因表达式编程
- RT-Rank:基于RSS标签排名相关性的文档聚类被引量:2
- 2007年
- RSS文档聚合是Web 2.0的特色技术,目前RSS相关性阅读还仅限于简单的相同标签聚合.为解决此问题,提出了基于RSS标签聚类的新方法,主要工作包括:1)分析传统RSS聚合方法的不足之处;2)提出了RSS标签排名的概念和计算方法,将标签计数转化为了标签排名,消除了部分噪音;3)提出标签比重积累的RSS标签排名的Hash聚类方法;4)做了详实的实验.实验表明,新的RSS相关性文档聚类方法准确度提高了7%.
- 王波唐常杰段磊尹佳左劼李川
- 关键词:数据挖掘聚类RSS