共 3 条
基于SVM的中文报道关系识别方法研究
被引:3
作者:
王强
[1
]
张永奎
[2
]
机构:
[1] 山西大学计算机与信息技术学院
[2] 计算智能与中文信息处理省部共建教育部重点实验室
来源:
关键词:
报道关系识别;
话题检测与跟踪;
多向量表示模型;
D O I:
暂无
中图分类号:
TP391.41 [];
学科分类号:
080203 ;
摘要:
针对网络新闻的特点,从人名、时间名、地点名、组织机构名、内容五个方面抽取特征词形成特征向量。在此基础上,分别进行了相似度计算,其中,人名、组织机构名、内容采用余弦夹角的方法,时间和地点向量,相似度计算采用了引入报道时间和关联度计算。最后,使用这5个相似度作为特征,使用SVM进行训练,并在测试集上进行了测试。测试结果表明,这种方法可以有效地改善系统的性能。
引用
收藏
页码:141 / 143
页数:3
相关论文