Web使用挖掘的数据预处理

被引:24
作者
刘立军
周军
梅红岩
机构
[1] 辽宁工学院计算机科学与工程学院
关键词
Web使用挖掘; 数据预处理; 剪枝算法; 最大向前引用; 事务识别;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
Web使用挖掘的基本思想是将数据挖掘技术应用于Web使用数据源。在数据挖掘研究领域中,数据预处理起着至关重要的作用。Web使用挖掘的数据源最主要的是Web日志,介绍了Web日志的具体内容,针对Web日志的特点,介绍预处理过程中一些特殊情况的处理方法,并在事务的识别阶段给出了一种新的最大向前引用序列挖掘算法——剪枝算法。
引用
收藏
页码:200 / 201+204 +204
页数:3
相关论文
共 1 条
[1]   Discovery of Web robot sessions based on their navigational patterns [J].
Tan, PN ;
Kumar, V .
DATA MINING AND KNOWLEDGE DISCOVERY, 2002, 6 (01) :9-35