Web文本挖掘技术研究

被引：14

作者：

邹腊梅

肖基毅

龚向坚

机构：

[1] 不详

[2] 南华大学计算机学院

[3] 不详

来源：

情报杂志 | 2007年 / 02期

基金：

湖南省自然科学基金;

关键词：

数据挖掘; Web文本; 文本特征; 分类; 聚类;

D O I：

暂无

中图分类号：

TP311.13 [];

学科分类号：

1201 ;

摘要：

WWW上的信息量迅猛增长,Internet成为一个拥有大量Web文本资源的巨型数据库。大量异构、非结构化的Web文本对数据挖掘技术提出新的挑战。分析了Web文本的特点、Web文本挖掘的一般流程以及Web文本挖掘中的关键技术。

引用

页码：53 / 55

页数：3

共 6 条

[1] 中文Web文本的特征获取与分类 [J].

许建潮 ;

胡明 .

计算机工程, 2005, (08) :24-25+39

[2] 自动文摘技术及应用 [J].

金博 ;

史彦军 ;

滕弘飞 ;

艾景波 .

计算机应用研究, 2004, (12) :13-15

[3] 数据挖掘综述 [J].

王光宏 ;

蒋平 .

同济大学学报(自然科学版), 2004, (02) :246-252

[4] 基于增益的隐马尔科夫模型的文本组块分析 [J].

李珩 ;

杨峰 ;

朱靖波 ;

姚天顺 .

计算机科学, 2004, (02) :152-154+192

[5] 自动文摘的逻辑解释 [J].

杨建林 .

情报理论与实践 , 2002, (02) :112-114

[6] Web文本挖掘技术研究 [J].

王继成 ;

潘金贵 ;

张福炎 .

计算机研究与发展, 2000, (05) :513-520

← 1 →