唐明伟 作品数:35 被引量:236 H指数:11 供职机构: 南京审计大学 更多>> 发文基金: 国家自然科学基金 江苏省社会科学基金 国家社会科学基金 更多>> 相关领域: 文化科学 自动化与计算机技术 政治法律 经济管理 更多>>
大语言模型中文问答正确性对比实验研究——以ChatGPT 3.5、Claude 1.0和文心一言2.1为例 2024年 [目的/意义]对大语言模型中文问答正确性进行实验测评研究,为中文用户使用大语言模型提供一定的指导作用。[方法/过程]针对科技、教育、医学、生活、旅游美食和哲学文化6个领域,分别设计常识性、专业性和开放性三类问题,每类20个问题,共计360个问题。分别向ChatGPT 3.5、Claude 1.0和文心一言2.1提问,再针对回答进行正确性的人工评价。最后汇总评价结果,进行正确性的多方面对比分析。[结果/结论]实验分析表明中文语料数据的规模与质量,以及大语言模型的参数规模是影响大语言模型中文问答正确性的重要因素。 唐明伟 陈宙 丁晗萱 朱翼 顾明辉 陈羽关键词:中文问答 基于MD5分组变序的远程教育系统动态身份认证 被引量:1 2010年 针对现代远程教育系统采用的基于MD5的用户名/密码的静态身份认证技术在应用中的不足,提出了一种基于MD5分组变序的动态身份认证技术,并用概率统计的方法对该技术的安全性进行了验证,最后给出了实验分析。 唐明伟 卞艺杰 蒋勋 曹辉关键词:身份认证 MD5算法 碰撞 RESTful架构下图书管理系统的研究与实现 被引量:19 2010年 针对目前图书管理系统架构在实现信息共享方面的技术瓶颈,引入REST概念,介绍并分析RESTfulWeb服务架构,以图书管理工作中的入库、修改、报废、查询和借还业务为例,设计并实现基于RESTfulWeb服务的图书管理系统,为构建适合轻量级信息共享的图书管理系统提供参考,并通过测试证实该系统在实现轻量级图书信息共享方面的优越性和可行性。 唐明伟 卞艺杰 陶飞飞关键词:REST RESTFUL WEB服务 图书馆管理系统 面向资源 基于词性和语序分析的法律知识图谱自动构建方法 2024年 文章挖掘法律文本中的实体和关系,构建法律知识图谱,为实现智能判案提供支持,完善法律知识图谱的构建方法。应用基于LexNLP的自然语言处理方法,分析法律文本,以句子为单位进行词性分析,标注出名词且为主语或宾语时作为实体,动词且为谓语时标注为关系。在这一基础上,将同一个句子中的实体和关系按照<实体1,关系,实体2>进行排列组合,生成不重复的知识三元组,以生成高质量的法律知识图谱。提出了一种基于词性和语序分析的法律知识图谱自动构建方法,并基于美国Caselaw Access Project项目所含的法律判例为原始数据,并对生成三元组进行质量评估,最后生成了关于法律的知识图谱。 唐明伟 赵煌涛 李文雯关键词:关系抽取 自然语言处理 苏州创新驿站运行中的激励机制——基于委托代理理论视角的研究 被引量:4 2011年 创新驿站是科技中介组织在以网络经济为代表的新经济中一种创新型的组织发展形式,其功能是将技术创新和技术合作等科技资源及服务在中小企业间进行跨区域的配置,以提高中小企业转型和升级的效率。创新驿站在我国正处于发展初期,但是,对于创新驿站如何高效运行的经济学、管理学理论研究却相对滞后。创新驿站的运行效率与工作人员的工作密切相关,文章在文献[9]的基础上,运用委托代理理论,针对苏州创新驿站运行的不同时期,给出激励机制的分析,以促使代理人(创新驿站工作人员)更努力、高效地工作,进而促进创新驿站技术转化率的提高,更好地为中小企业的技术创新和技术合作提供支持性服务。 曹辉 卞艺杰 晏自翔 唐明伟关键词:创新驿站 激励机制 委托代理理论 中小企业 双边市场 高校二级学院教学质量保障体系的构建 被引量:2 2018年 高校二级学院教学质量保障体系是高校内部教学质量保障体系的有机组成部分。目前我国高校二级学院教学质量保障存在质量文化尚未形成、校院两级分工不清、制度规范有待完善、动力机制匮乏等问题。文章建议构建高校二级学院教学质量保障体系应坚持指向性、协同性、差异性原则,从制度和文化两个维度入手,以发展质量保障模式和保障手段为抓手,刚性约束和柔性激励并重,形成多样化的二级学院教学质量保障体系。 冯春贵 唐明伟 杨峥关键词:高校 质量保障体系 教学质量 基于领域本体的语义向量空间模型 被引量:15 2011年 经典向量空间模型中关键词相互独立的基本假设,造成了检索性能的限制。针对这一问题,本文介绍并分析了国内外学者对经典向量空间模型提出的改进研究。针对其研究的不足,通过分析经典向量空间模型的特点,构建领域本体以建立向量空间模型中关键词之间的语义联系,通过计算关键词之间的语义相似度,提出语义增量的概念,对关键词之间的语义联系进行量化分析。结合语义增量,对TF-IDF算法进行了改进,提出了STF-IDF算法,据此建立了语义向量空间模型,以期待提高经典向量空间模型在语义检索方面的性能。最后用实例验证了该模型在查全率和查准率方面均要优于原模型。 唐明伟 卞艺杰 陶飞飞关键词:领域本体 语义相似度 向量空间模型 TF-IDF RESTful Web服务和知识库协同驱动的突发事件网络舆情实时追踪 被引量:4 2017年 突发事件网络舆情可在第一时间反应突发事件的演变过程可为应急管理及时提供事态进展。通过分析目前突发事件网络舆情常见信息来源的种类和结构,研究了不同舆情源之间的异构性,并探讨了使用舆情源专用API和网络爬虫采集网络舆情的方法。在此基础上,协同RESTful Web服务和知识库,构建了突发事件网络舆情实时追踪平台,并针对其舆情库的构建和访问、舆情数据的实时采集以及舆情识别3个关键问题进行了研究,最终实现从互联网中自动识别并实时追踪突发事件的目标。 唐明伟 苏新宁 蒋勋关键词:RESTFUL WEB服务 知识库 突发事件 基于网格的电子政务集成应用研究 被引量:3 2008年 网格技术作为一门新兴的信息技术,应该为人们所关注。文章在对我国当前电子政务中存在的问题分析的基础上,论述了网格的基本概念、特点及其在电子政务中的应用,进而提出了一种基于网格技术的电子政务框架,并对其实现的关键问题作了进一步的阐述。 柳巧玲 卞艺杰 唐明伟关键词:网格 电子政务 资源共享 基于VSM与HITS融合的扩展主题型爬虫 2024年 目前主流开源爬虫框架在分析页面与主题领域关联性上,常采用基于关键词的量化和向量空间模型算法相融合,但融合疏忽了界面语义与特定主题间的关联,导致爬取内容与主题产生偏差。为了给金融等领域的舆情分析提供准确的数据支撑,提出一种面向领域扩展主题库的爬虫及系统,通过扩展主题特征库,融合向量空间模型(Vector Space Model,VSM)与超链接主题搜索算法(Hyperlink-Induced Topic Search,HITS),优化了主题页面相关度计算,并针对股票舆情信息爬取进行仿真。结果表明,上述扩展主题型爬虫在爬取准确率和效率等方面有较好地提升,能够有效地完成领域主题信息的爬取任务。 陶飞飞 徐佳 徐松阳 唐明伟