文本挖掘技术研究进展

被引:59
作者
袁军鹏 [1 ]
朱东华 [2 ]
李毅 [3 ]
李连宏 [2 ]
黄进 [2 ]
机构
[1] 清华大学公共管理学院
[2] 北京理工大学管理与经济学院
[3] 空军济南四站厂
关键词
文本挖掘; 中文分词; 特征选取; 文本摘要; 文本分类; 文本聚类; 关联分析; 数据可视化;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
文本挖掘是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程,已经成为数据挖掘中一个日益流行而重要的研究领域。首先给出了文本挖掘的定义和框架,对文本挖掘中预处理、文本摘要、文本分类、聚类、关联分析及可视化技术进行了详尽的分析,并归纳了最新的研究进展。最后指出了文本挖掘在知识发现中的重要意义,展望了文本挖掘在信息技术中的发展前景。
引用
收藏
页码:1 / 4
页数:4
相关论文
共 19 条
[1]   基于概念层次的英文文本自动分类研究 [J].
厉宇航 ;
罗振声 ;
程慕胜 .
计算机工程与应用, 2004, (11) :75-77
[2]   面向Web的文本挖掘技术研究 [J].
徐妙君 ;
顾沈明 .
控制工程, 2003, (S1) :44-46+50
[3]   自动标引中基于概念层次树的主题词轮排选择的算法实现 [J].
马颖华 ;
王永成 ;
苏贵洋 ;
韩客松 ;
赵海 .
高技术通讯, 2003, (06) :18-21
[4]   基于概念统计和语义层次分析的英文自动文摘研究 [J].
季姮 ;
罗振声 ;
万敏 ;
高小云 .
中文信息学报, 2003, (02) :14-20
[5]   基于概念统计的英文自动文摘研究 [J].
万敏 ;
罗振声 ;
季姮 ;
高小云 ;
不详 .
计算机工程与应用 , 2002, (24) :7-9+16
[6]   向量空间法中单词权重函数的分析和构造 [J].
陆玉昌 ;
鲁明羽 ;
李凡 ;
周立柱 .
计算机研究与发展, 2002, (10) :1205-1210
[7]   中文文本挖掘中的无词典分词的算法及其应用 [J].
胥桂仙 ;
苏筱蔚 ;
陈淑艳 .
吉林工学院学报(自然科学版), 2002, (01) :16-18
[8]   一种文本分类数据挖掘的技术 [J].
杨斌 ;
孟志青 .
湘潭大学自然科学学报, 2001, (04) :34-37
[9]   关于文本特征抽取新方法的研究 [J].
李凡 ;
鲁明羽 ;
陆玉昌 .
清华大学学报(自然科学版), 2001, (07) :98-101
[10]   Web文本挖掘技术研究 [J].
王继成 ;
潘金贵 ;
张福炎 .
计算机研究与发展, 2000, (05) :513-520