基于云模型的文本特征自动提取算法

被引:4
作者
代劲 [1 ,2 ]
何中市 [1 ]
胡峰 [2 ,3 ]
机构
[1] 重庆大学计算机科学与技术学院
[2] 重庆邮电大学计算机科学与技术研究所
[3] 西南交通大学信息科学与技术学院
关键词
文本分类; 特征提取; 云模型; 隶属度; 动态聚类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
在综合考虑特征整体与局部分布基础上,提出一种高性能的文本特征自动提取算法。算法引入云隶属度概念对特征分布进行修正,不需任何先验知识,能根据特征分布特点自动获取云隶属度高的特征集。实验结果表明:该特征集具有特征个数少、分类精度高的特点,性能明显比当前主要的特征选择方法的性能优。
引用
收藏
页码:714 / 720
页数:7
相关论文
共 8 条
[1]  
不确定性人工智能.[M].李德毅;杜鹢著;.国防工业出版社.2005,
[2]   文本分类中特征选择的约束研究 [J].
徐燕 ;
李锦涛 ;
王斌 ;
孙春明 ;
张森 .
计算机研究与发展 , 2008, (04) :596-602
[3]   基于云模型的协同过滤推荐算法 [J].
张光卫 ;
李德毅 ;
李鹏 ;
康建初 ;
陈桂生 .
软件学报, 2007, (10) :2403-2411
[4]   基于云模型的全局最优化算法 [J].
张光卫 ;
康建初 ;
李鹤松 ;
李德毅 .
北京航空航天大学学报, 2007, (04) :486-490
[5]   基于机器学习的文本分类技术研究进展 [J].
苏金树 ;
张博锋 ;
徐昕 .
软件学报, 2006, (09) :1848-1859
[6]   中文文本分类中的特征选择算法研究 [J].
胡佳妮 ;
徐蔚然 ;
郭军 ;
邓伟洪 .
光通信研究, 2005, (03) :44-46
[7]   不确定性人工智能 [J].
李德毅 ;
刘常昱 ;
杜鹢 ;
韩旭 .
软件学报, 2004, (11) :1583-1594
[8]   论正态云模型的普适性 [J].
李德毅 ;
刘常昱 .
中国工程科学, 2004, (08) :28-34