基于条件随机场的网络评论与事件中命名实体匹配研究

被引:7
作者
徐元子 [1 ]
张迎新 [2 ]
刘登第 [1 ]
机构
[1] 空军指挥学院
[2] 中国人民解放军部队
关键词
条件随机场; 命名实体; 变体形式; 综合相似度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
为发现针对新闻事件中实体展开的网络评论,提出一种基于条件随机场的网络评论与新闻事件中命名实体匹配方法,使用semi-Markov CRFs从评论语句中识别出片段粒度的命名实体;针对评论描述随意的特点,结合命名实体的模式特征、符号特征等识别出评论中实体的简称、缩写、昵称等变体形式。使用linear-chain CRFs结合多种匹配方法计算评论中命名实体与事件中命名实体的综合相似度,完成匹配。实验证明,提出的基于条件随机场的网络评论与事件中命名实体匹配方法能够准确地根据命名实体匹配评论与事件。
引用
收藏
页码:1642 / 1647
页数:6
相关论文
共 5 条
[1]
Learning multilingual named entity recognition from Wikipedia.[J].Joel Nothman;Nicky Ringland;Will Radford;Tara Murphy;James R. Curran.Artificial Intelligence.2013,
[2]
Sentence-level event classification in unstructured texts [J].
Naughton, M. ;
Stokes, N. ;
Carthy, J. .
INFORMATION RETRIEVAL, 2010, 13 (02) :132-156
[3]
基于SVM和扩展条件随机场的Web实体活动抽取 [J].
张传岩 ;
洪晓光 ;
彭朝晖 ;
李庆忠 .
软件学报, 2012, 23 (10) :2612-2627
[4]
基于Markov逻辑网的两阶段数据冲突解决方法 [J].
张永新 ;
李庆忠 ;
彭朝晖 .
计算机学报, 2012, 35 (01) :101-111
[5]
计算机识别汉语同义词的两种算法比较和测评 [J].
朱毅华 ;
侯汉清 ;
沙印亭 .
中国图书馆学报, 2002, (04)