吴晓燕
- 作品数:4 被引量:5H指数:1
- 供职机构:中山大学更多>>
- 发文基金:广州市科技计划项目更多>>
- 相关领域:文化科学自动化与计算机技术语言文字更多>>
- 结合梯度提升树算法与可解释机器学习模型SHAP的抑郁症影响因素研究
- 2024年
- 【目的】本研究旨在探讨构建抑郁严重度预测模型及其解释性问题,通过分析互联网用户生成的内容,进一步发展抑郁症风险预测研究,从而提高抑郁症自动检测模型的可靠性和实用性。【方法】通过收集“好大夫在线”平台上的抑郁症医疗咨询文本记录,构建了一个语料库。利用心理学词典,从中提取了患者的心理特征,并采用梯度提升树算法预测患者的病情,同时引入可解释机器学习方法SHAP解读模型,借助SHAP独特的可视化图表剖析患者年龄、性别、认知、情感、感知、社会家庭及个人得失与抑郁症发生之间的复杂关系。【结果】抑郁症患者心理状态能反馈患者病况,利用从患者问诊记录中提取的心理特征能够有效检测重度抑郁,准确率达到86%。可解释机器学习模型SHAP解释了模型的预测结果,揭示出患者各层面心理特征对抑郁症发生产生的多重效应。【局限】受语料集所限,仅利用单次问诊记录对抑郁程度做预测;而模型特征基于心理学词典,更多与抑郁症发生风险有关的要素可纳入建模考虑中。【结论】影响抑郁症产生及发展的因素复杂。个体差异致使各项特征对于疾病预测产生不同效应。构建抑郁症的自动诊断模型,不仅要关注模型的精准度,更需增强对模型预测的理解。
- 聂卉吴晓燕
- 中文学术期刊摘要及其英文译文的词汇衔接手段对比研究
- 学术论文最重要的交际目的是其信息功能,即向同行展示自己的最新研究成果。要达到这一目的,作为学术论文缩影的学术论文摘要就起到了至关重要的作用。而语篇的衔接手段特别是词汇衔接手段就是实现学术论文摘要信息功能的重要工具之一。 ...
- 吴晓燕
- 文献传递
- 基于在线问诊记录的抑郁症病患群组划分与特征分析被引量:5
- 2022年
- 【目的】通过挖掘抑郁症患者的在线问诊记录来深入了解该病患群体。【方法】采集“好大夫在线”的抑郁症问诊记录,利用词向量构建病患模型,通过K-means算法实现病症群组划分,运用t-SNE、热图、词云等技术可视化各群组的结构及相互关系,分析其情绪心理、社交和行为上的差异,并通过LDA主题建模法凝练各群组诊疗需求。【结果】研究汇聚了6个抑郁症群组,不同群组在情绪心理、社交关系、行为表现上各具特点。同时提炼出抑郁症病患的三种诊疗需求模式:迫切希望了解是否应线下就医、多方位咨询以及询问药物治疗。【局限】对群组进行特征差异分析时,每个维度下的关键词选择基于词性分析和人工梳理,存在一定偏差。【结论】对用户在线问诊记录的挖掘是了解抑郁症患者的有效途径。研究采用的策略与方法可推广至其他疾病领域,为在线医疗平台建设提供全方位支持。
- 聂卉吴晓燕林芸
- 关键词:抑郁症聚类可视化
- 基于在线医疗咨询文本的抑郁症症状短语的自动识别
- 2023年
- [目的/意义]利用在线医疗咨询文本探索抑郁症症状的自动抽取方法,推进健康大数据的深层次应用。[方法/过程]以在线问诊平台“好大夫在线”的患者问诊记录为语料,选择无监督机器学习法,运用短语识别和深度学习语义建模技术实现抑郁症症状的快速提取。算法通过了测试语料的评估,并在抑郁症典型症状分析和抑郁症人群预测两个任务中得以检验。[结果/结论]运用本文算法识别抑郁症症状短语的准确率为73.85%,模型表现优良。用该方法分析抑郁症患者的典型表现,结论与心理学临床检验结果一致,抑郁症人群预测的精准度则可以达到78.81%。对于3个症状短语的分布表示模型,具备深层次语义表达能力Sentence-BERT表现最好,说明强化短语的语义表达,运用无监督机器学习方法能够实现疾病症状的快速提取,有效提升大规模文本信息的处理能力。
- 聂卉吴晓燕
- 关键词:抑郁症语义建模短语识别