面向网络论坛的高质量主题发现

被引:23
作者
陈友 [1 ,2 ]
程学旗 [1 ]
杨森 [1 ,2 ]
机构
[1] 中国科学院计算技术研究所
[2] 中国科学院研究生院
关键词
网络论坛; 高质量; 特征选择; 特征抽取; 分类;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP393.092 [];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
提出了一种通用的高质量主题发现框架.在该框架下,利用特征抽取技术提取内容特征,利用结构特征去发现高质量主题.提出了一种基于遗传算法、禁忌搜索与机器学习的特征选择算法,用来评价被抽取特征的重要性.在腾讯论坛数据集上进行了大量的实验.实验结果表明,该框架能够很好地发现高质量主题.提出的特征抽取算法、特征选择算法以及高质量主题发现框架能够在很多Web2.0领域得到应用,例如,博客、社会网络平台等.
引用
收藏
页码:1785 / 1804
页数:20
相关论文
共 10 条
[1]   一种基于小波特征提取的低速率DoS检测方法 [J].
何炎祥 ;
曹强 ;
刘陶 ;
韩奕 ;
熊琦 .
软件学报, 2009, 20 (04) :930-941
[2]   基于特征选择的轻量级入侵检测系统 [J].
陈友 ;
程学旗 ;
李洋 ;
戴磊 .
软件学报, 2007, (07) :1639-1651
[3]   高维类别属性数据流离群点快速检测算法 [J].
周晓云 ;
孙志挥 ;
张柏礼 ;
杨宜东 .
软件学报, 2007, (04) :933-942
[4]   数字高程模型数据整数小波水印算法 [J].
罗永 ;
成礼智 ;
陈波 ;
吴翊 .
软件学报, 2005, (06) :1096-1103
[5]   高维空间中的离群点发现 [J].
魏藜 ;
宫学庆 ;
钱卫宁 ;
周傲英 .
软件学报, 2002, (02) :280-290
[6]   利用小波变换由明暗度恢复表面形状 [J].
钟声,石青云,程民德 .
软件学报, 1995, (11) :686-693
[7]  
A Survey of Outlier Detection Methodologies[J] . Victoria J. Hodge,Jim Austin.Artificial Intelligence Review . 2004 (2)
[8]   Authoritative sources in a hyperlinked environment [J].
Kleinberg, JM .
JOURNAL OF THE ACM, 1999, 46 (05) :604-632
[9]  
Tencent Web forums. http://bbs.qq.com .
[10]  
http://www.nable.com .