基于SVM的中文报道关系识别方法研究

被引:3
作者
王强 [1 ]
张永奎 [2 ]
机构
[1] 山西大学计算机与信息技术学院
[2] 计算智能与中文信息处理省部共建教育部重点实验室
关键词
报道关系识别; 话题检测与跟踪; 多向量表示模型;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
针对网络新闻的特点,从人名、时间名、地点名、组织机构名、内容五个方面抽取特征词形成特征向量。在此基础上,分别进行了相似度计算,其中,人名、组织机构名、内容采用余弦夹角的方法,时间和地点向量,相似度计算采用了引入报道时间和关联度计算。最后,使用这5个相似度作为特征,使用SVM进行训练,并在测试集上进行了测试。测试结果表明,这种方法可以有效地改善系统的性能。
引用
收藏
页码:141 / 143
页数:3
相关论文
共 3 条
[1]   基于多向量和实体模糊匹配的话题关联识别 [J].
张晓艳 ;
王挺 ;
陈火旺 .
中文信息学报, 2008, (01) :9-14
[2]   基于改进向量空间模型的话题识别与跟踪 [J].
宋丹 ;
王卫东 ;
陈英 .
计算机技术与发展, 2006, (09) :62-64+67
[3]   话题识别与跟踪研究 [J].
李保利 ;
俞士汶 .
计算机工程与应用, 2003, (17) :7-10+109