大数据 (Sep 2024)
面向抑郁症行为特征的领域词典构建
Abstract
抑郁症患者的行为表征反映其临床特征及病情状况,有利于病情诊断。当前抑郁症领域词典在构建时忽略了抑郁症文本中的行为特征与患者病况的关联性,导致词典领域信息不足。为此,提出面向抑郁症行为特征的领域词典构建方法,拓展了领域词典涵盖的情感表示。首先,采用TF-IDF算法构建情感类和行为类种子词集,通过PMI计算现有词典与情感类种子词的相似度获得情感类词集;其次,基于行为特征与患者病况的对应关系,设置行为类种子词标签,再将种子词与抑郁症文本输入WoBERT生成动态词向量,计算二者的相似度得到候选词集;然后,基于词间相似度构建语义图,并使用标签传播算法获得行为特征词集;最后,收集微博负面情感表情符号构建表情符号词集,合并情感类词集、行为特征词集与表情符号词集,得到中文抑郁症领域词典。实验结果表明,构建的词典可以提升抑郁症文本分类效果。
Keywords