Web文本挖掘技术研究

被引:14
作者
邹腊梅
肖基毅
龚向坚
机构
[1] 不详
[2] 南华大学计算机学院
[3] 不详
基金
湖南省自然科学基金;
关键词
数据挖掘; Web文本; 文本特征; 分类; 聚类;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
WWW上的信息量迅猛增长,Internet成为一个拥有大量Web文本资源的巨型数据库。大量异构、非结构化的Web文本对数据挖掘技术提出新的挑战。分析了Web文本的特点、Web文本挖掘的一般流程以及Web文本挖掘中的关键技术。
引用
收藏
页码:53 / 55
页数:3
相关论文
共 6 条
[1]   中文Web文本的特征获取与分类 [J].
许建潮 ;
胡明 .
计算机工程, 2005, (08) :24-25+39
[2]   自动文摘技术及应用 [J].
金博 ;
史彦军 ;
滕弘飞 ;
艾景波 .
计算机应用研究, 2004, (12) :13-15
[3]   数据挖掘综述 [J].
王光宏 ;
蒋平 .
同济大学学报(自然科学版), 2004, (02) :246-252
[4]   基于增益的隐马尔科夫模型的文本组块分析 [J].
李珩 ;
杨峰 ;
朱靖波 ;
姚天顺 .
计算机科学, 2004, (02) :152-154+192
[5]   自动文摘的逻辑解释 [J].
杨建林 .
情报理论与实践 , 2002, (02) :112-114
[6]   Web文本挖掘技术研究 [J].
王继成 ;
潘金贵 ;
张福炎 .
计算机研究与发展, 2000, (05) :513-520