基于图的微博广告文本识别

被引:1
作者
罗斌 [1 ]
唐红艳 [1 ,2 ]
王志豪 [3 ]
秦悦 [1 ]
苏劲松 [1 ]
机构
[1] 厦门大学软件学院
[2] 北京大学软件与微电子学院
[3] 厦门大学航空航天学院
关键词
微博广告文本; 识别; 半监督; 标签传播算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
大量的微博广告影响了微博数据分析模型的使用.针对微博广告文本识别问题,利用基于图的半监督的标签传播算法,指导计算机从大量的非结构化的微博文本中自动识别出微博广告.通过对实验数据的评测,结果显示,当已有标签样本较少时,基于图的半监督的标签传播算法能够获得比有监督的支持向量机和朴素贝叶斯算法更好的性能.
引用
收藏
页码:724 / 728
页数:5
相关论文
共 7 条
[1]   标签传播算法理论及其应用研究综述 [J].
张俊丽 ;
常艳丽 ;
师文 .
计算机应用研究, 2013, 30 (01) :21-25
[2]   基于图的半监督关系抽取 [J].
陈锦秀 ;
姬东鸿 .
软件学报, 2008, (11) :2843-2852
[3]  
文本分类中的关键技术研究[D]. 张俊丽.华中师范大学. 2008
[4]  
Web文本分类研究及应用[D]. 柯慧燕.武汉理工大学. 2006
[5]  
数据挖掘[M]. 中国科学技术大学出版社 , 朱明编著, 2002
[6]  
LIBSVM[J] . Chih-Chung Chang,Chih-Jen Lin. ACM Transactions on Intelligent Systems and Technology (TIST) . 2011 (3)
[7]  
On the construction of effective vocabularies for information retrieval[J] . G. Salton,Clement T. Yu. ACM SIGIR Forum . 1973 (3)