基于半监督CRF的缩略词扩展解释识别

被引:2
作者
陈季梦 [1 ]
刘杰 [1 ]
黄亚楼 [1 ,2 ]
刘天笔 [2 ]
刘才华 [1 ]
机构
[1] 南开大学信息技术科学学院
[2] 南开大学软件学院
基金
高等学校博士学科点专项科研基金;
关键词
扩展解释; 半监督; 条件随机场; 序列熵; 序列标注;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; TP18 [人工智能理论];
学科分类号
081203 ; 0835 ; 081104 ; 0812 ; 1405 ;
摘要
缩略词拓展解释识别任务中标注样本较少,无法从中总结出全面的规则或采用有监督的学习方法来学习。为此,提出一种基于半监督条件随机场(CRF)的缩略词扩展解释识别模型,利用广泛的未标注样本和较少的标注样本寻找序列文本中恰当的语句,以解释给定的缩略词。使用较少的标注序列样本训练一个全监督CRF模型,针对未标注序列样本,采用最小序列熵学习样本之间的联系,结合标注样本和未标注样本,利用半监督自学习方法学习两者的关系。实验结果表明,该模型的序列F1值达到84.73%,高于支持向量机和全监督CRF基准算法。
引用
收藏
页码:203 / 209
页数:7
相关论文
共 4 条
[1]   基于排序支持向量机的缩略词自动提取方法 [J].
高永梅 ;
黄亚楼 ;
倪维健 ;
徐君 .
模式识别与人工智能, 2008, 21 (02) :186-192
[2]   Using SVM to extract acronyms from text [J].
Xu, Jun ;
Huang, Yalou .
SOFT COMPUTING, 2007, 11 (04) :369-373
[3]   Recognizing acronyms and their definitions [J].
Taghva K. ;
Gilbreth J. .
International Journal on Document Analysis and Recognition, 1999, 1 (4) :191-198
[4]  
Automatic Extraction of Acronyms fromText .2 Stuart Y. Proc.of New Zealand Computer ScienceResearch Students’’Conference . 1999