陈海光
- 作品数:15 被引量:47H指数:5
- 供职机构:上海师范大学信息与机电工程学院更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划上海市科技人才计划项目更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于贝叶斯分类的主题爬虫被引量:1
- 2013年
- 随着网络的高速发展,其信息资源越来越庞大,面对巨量的信息库,搜索引擎起着重要的作用.主题爬虫技术作为搜索引擎的主要核心部分,计算搜索结果与搜索主题的关系,该关系被称为相关性.一般主题爬虫方法只计算网页内容与搜索主题的相关性,作者所提主题爬虫,通过链接内容和锚文本内容计算链接的重要性,然后利用贝叶斯分类器对链接进行分类,最后利用余弦相似函数计算网页的相关性,如果相关值大于阀值,则认为该网页与预定主题相关,否则不相关.实验结果证明:所提出主题爬虫方法可以获得很高的精确度.
- 贾海军陈海光
- 关键词:主题爬虫贝叶斯分类器
- 无线传感器网络中基于多向量的拥塞控制
- 2007年
- 由于无线传感器网络结点分发信息非常方便,因此它在军事和智能居家领域有着广泛的应用前景。如何在这些网络中建立公平、高效、节能的传轮机制将数据汇集到基站是该网络中的一个重要问题。本文提出了一种分布式动态的对不同的路由路径建立多向量信号控制的算法。该算法同时考虑了不同结点的流量,子结点的数目以及子结点的层数等,并将信息快速反馈到检测到的拥塞中,从而迅速缓解拥塞。模拟实验结果和分析表明该机制具有公平性、有效性、稳定性和节能性。
- 陈海光韩鹏吴华峰高传善
- 关键词:传感器网络分布式算法拥塞控制
- 基于指针网络生成抽象式新闻摘要被引量:6
- 2020年
- 基于指针网络与引入注意力机制的编码器解码器神经网络模型,构建混合网络模型生成抽象式新闻摘要。实验采用搜狐新闻语料库作为数据集,先对数据集进行数据清洗,包括去除空格、特殊字符、停用词等,利用中文分词系统ICTCLAS[1]对清洗过的语料库分词,再把数据集划分为训练集、验证集、测试集。模型的搭建是在加入注意力机制的编码器解码器模型的基础上引入了指针网络,该网络会生成一个权衡概率,用来分配从词典中生成新词与从原文中复制词语的权重。生成的抽象新闻摘要采用ROUGE评分机制进行评测,评测结果比单独采用加入注意力机制的编码器解码器模型平均高出2分。
- 郭倩黄继风宋俊典陈海光
- 关键词:中文分词新闻摘要
- 组件技术在离散动态系统仿真软件体系结构中的应用研究被引量:8
- 2001年
- 文章针对仿真系统软件可重用性差的特点,提出了基于二进制COM(Component Object Model)标准组件技术的离散动态系统仿真工具的设计方法。并利用组件技术开发了离散动态系统计算机仿真工具,实现了类似Matlab拖放式创建模型,通过联线方式建立模型间逻辑联系。该仿真工具已经在某一炼钢连铸离散动态系统中得到了运用。
- 戴晓明孙翀邵惠鹤陈海光张洪渊
- 关键词:仿真软件组件技术体系结构计算机仿真
- 分布式存储系统中改进的一致性哈希算法被引量:12
- 2016年
- 随着网络存储系统的发展,分布式存储中的数据均匀分布和高效定位的问题越来越备受关注。现存的关于分布式系统的数据分布的可靠性和可用性等方面并不能得到有效的保证。文中提出了一种改进的一致性哈希算法,通过对Redis存储节点进行逻辑划分成一个组,组内采用主从的模式提高了分布式存储的一致性和可靠性,并分析了同一个组内不同读写策略的数据一致性。经过实验比较,该算法能有效地降低系统平均响应时间,提高系统吞吐量,使分布式存储系统负载更为均衡。当组内主节点宕机时,利用从节点的备份数据以及主从切换可以及时对外提供集群服务,这一点有助于实际的研发分布式存储。
- 王康李东静陈海光
- 关键词:分布式存储REDIS
- Rabbit FLEX硬件应用新思路被引量:1
- 2006年
- 现代科技快速发展,嵌入式系统的硬件设计呈现多样化。本文首先简单阐述了硬件设计的发展变化,然后分析了RabbitFLEX的结构和制造过程。
- 陈志宇陈海光
- 关键词:RABBITFLEX硬件设计嵌入式系统
- 基于Transformer融合词性特征的中文语法纠错模型被引量:2
- 2022年
- 针对中文同一个词的不同词性在句子中所代表的关系不同的问题,提出基于Transformer融合词性特征的中文语法纠错(CGEC)模型,所提模型将语言学知识作为辅助信息融入中文语法纠错任务。首先,在不改变句子序列长度的基础上,在原始词嵌入层中以不同方式拼接词性向量,得到全差异词嵌入、词差异词嵌入和词性差异词嵌入三种不同的词嵌入方式;然后,将新的词嵌入方式与Transformer模型相结合,对错误语句进行语法纠错。实验结果表明,三种词嵌入方式均不同程度地提高了F0.5值,且全差异词嵌入方式的效果最好:与Transformer模型相比,F0.5提升了2.73个百分点,BLEU提升了6.27个百分点;与基于Transformer增强架构的中文语法纠错模型相比,F0.5提升了1.88个百分点。所提模型在对词性特征提取时可以侧重源语句与目标语句的语法差异,更好地捕捉句子的语法特征。
- 尚海怡黄继风陈海光
- 关键词:语言学知识解码器
- web日志挖掘中会话识别方法被引量:1
- 2016年
- 通过对传统web会话识别方法分析和比较,改进了目前最常用的基于时间阈值会话识别方法,提出了一种基于动态阈值会话识别方法,该算法采用动态计算会话中请求记录间的平均时间间隔和动态计算会话中页面的平均大小相结合的方法,根据用户和网页的特点动态调整阈值,相对于传统单一的先验阈值,该方法可以根据不同的用户访问不同的页面生成动态的阈值,充分运用用户和网页信息.经过实验验证,该方法可以识别出更多的用户会话,且识别会话的准确率和查全率也比传统算法更高.
- 袁艺陈海光
- 关键词:WEB挖掘会话识别时间阈值数据预处理
- 基于用户行为特征的手机端身份识别研究被引量:2
- 2019年
- 基于智能手机用户在输入身份验证密码和滑动触摸屏过程中的个人独特行为特征,提出了两种身份验证方案,将单类支持向量机(OCSVM)算法应用到身份验证模型中,采用网格搜索算法获取模型的最优参数.实验结果显示两种身份验证方案都具有较好的泛化能力和验证精度,身份的验证过程不会干扰正常的用户操作.
- 向东东陈海光熊俊杰
- 关键词:隐私数据身份验证
- PDT在无线在盘库中的应用
- 本文提出了基于蓝牙技术的无线出库系统解决方案,同时对库存盘点中存在的问题讨论了目前的几种解决方案,并进行比较。论述了基于socket技术的无线实时数据采集系统在客户/服务器模式下的解决方案。
- 陈海光金辉
- 关键词:无线局域网SOCKETAPPDT
- 文献传递