复杂网络理论在中文文本特征选择中的应用研究

被引:17
作者
赵辉
刘怀亮
范云杰
机构
[1] 西安电子科技大学经济管理学院
关键词
复杂网络; 语义相关关系; 节点综合特性; 特征选择;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
提出一种基于复杂网络的特征选择方法,通过构建文本加权复杂网络来表示词语间的语义关系及结构信息,综合考虑节点加权度、加权聚集系数、节点介数计算节点特性,利用节点综合特性提取反映文本主题的关键词作为文本的特征词。给出基于复杂网络的中文文本特征选择算法,并对其进行实验验证。结果表明,该特征选择方法较传统方法在文本分类性能上有所提高。
引用
收藏
页码:23 / 28
页数:6
相关论文
共 11 条
[1]  
基于维基百科构建语义知识库及其在文本分类领域的应用研究.[D].苏小康.华中师范大学.2010, 10
[2]  
基于统计的中文文本关键短语自动抽取方法研究.[D].韩艳.苏州大学.2009, 10
[3]  
Web数据挖掘中的文本分类研究.[D].郑碎潘.南京航空航天大学.2007, 06
[4]  
复杂网络理论与应用研究.[D].李勇.华南理工大学.2005, 06
[5]  
语义网、社会网络计算与Web资源共享.[M].王莉; 著.电子工业出版社.2011,
[6]   Machine learning in automated text categorization [J].
Sebastiani, F .
ACM COMPUTING SURVEYS, 2002, 34 (01) :1-47
[7]  
Induction of decision trees.[J].J. R. Quinlan.Machine Learning.1986, 1
[8]   基于加权复杂网络的文本关键词提取 [J].
谢凤宏 ;
张大为 ;
黄丹 ;
谢福鼎 .
系统科学与数学, 2010, 30 (11) :1592-1596
[9]   一种基于复杂网络特征的中文文档关键词抽取算法 [J].
赵鹏 ;
蔡庆生 ;
王清毅 ;
耿焕同 .
模式识别与人工智能, 2007, 20 (06) :827-831
[10]   一种基于加权复杂网络特征的K-means聚类算法 [J].
赵鹏 ;
耿焕同 ;
蔡庆生 ;
王清毅 .
计算机技术与发展, 2007, (09) :35-37+40