智能科学与技术学报
(Dec 2021)
基于多级注意力融合机制的藏文实体关系抽取
Affiliations
- 王丽客
- 中央民族大学信息工程学院; 中央民族大学国家语言资源监测与研究少数民族语言中心
- 孙媛
- 中央民族大学信息工程学院; 中央民族大学国家语言资源监测与研究少数民族语言中心
- 刘思思
- 中央民族大学信息工程学院; 中央民族大学国家语言资源监测与研究少数民族语言中心
- Journal volume & issue
-
Vol. 3,
no. 4
pp.
466
– 473
Abstract
Read online
与中英文相比,藏文实体关系训练语料规模较小,传统有监督的学习方法难以获得较高的准确率。针对基于远程监督的实体关系抽取存在错误标记的问题,利用远程监督方法将知识库与文本对齐,构建藏文实体关系抽取的数据集,提出一个基于多级注意力融合机制的藏文实体关系抽取模型。在词级别引入自注意力机制来提取单词的内部特征,在句子级别引入注意力机制为每个实例分配权重,从而充分利用包含信息的句子,减少噪声实例的权重。同时引入联合评分函数,修正远程监督的错误标签,并将神经网络与支持向量机结合,实现藏文实体关系分类。实验结果表明,提出的模型有效提高了藏文实体关系抽取的准确率,且优于基线模型效果。
Keywords
WeChat QR code