共 17 条
基于信息熵的半监督领域实体关系抽取研究
被引:3
作者:
郭剑毅
[1
,2
]
雷春雅
[1
]
余正涛
[1
,2
]
苏磊
[1
,2
]
赵君
[1
]
田维
[1
]
机构:
[1] 昆明理工大学信息工程与自动化学院
[2] 昆明理工大学智能信息处理重点实验室
来源:
关键词:
信息熵;
半监督;
最大熵分类器;
未标记;
可信度;
D O I:
暂无
中图分类号:
TP181 [自动推理、机器学习];
学科分类号:
081104 ;
0812 ;
0835 ;
1405 ;
摘要:
针对监督机器学习方法抽取实体关系受限于标注语料的规模问题,提出采用信息熵方法来不断扩展小规模训练数据的半监督领域实体关系抽取。结合领域词汇选取小规模训练数据,构建了一定准确率的初始最大熵分类器,用来从未标记数据中预测出候选新实例。采用信息熵方法,通过设定不同熵值,多次循环以选取可信度较高的新实例来扩展训练数据。使用扩展后的训练数据重新迭代训练分类器,分类器性能趋于稳定迭代终止,实现了半监督学习的领域实体关系抽取。实验表明,和已有方法相比,本文提出的半监督领域实体关系抽取通过结合信息熵方法,在小规模标注样本环境中取得了较好的学习效果。
引用
收藏
页码:7 / 12
页数:6
相关论文