基于网格的TCP网络日志二次聚类算法

被引:2
作者
张珠玉 [1 ]
刘培玉 [1 ,2 ]
迟学芝 [3 ]
机构
[1] 山东师范大学信息科学与工程学院
[2] 山东省分布式计算机软件新技术重点实验室
[3] 山东警察学院公共基础部
关键词
TCP; 网络日志; 网格聚类;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
为了处理网络日志规模过大及其相关问题,根据TCP传输协议的特征,提出一种基于网格的TCP网络日志二次聚类算法(Grid-based TCP Two-step Clustering,GTTC)。通过分析TCP连接过程,采用划分网格的方式把每一条TCP报文日志进行网格内初次聚类,再把初次聚类簇进行网格间二次聚类,最后生成表达整个TCP连接的唯一的日志记录。该算法结合数据库技术,不需预设类簇个数k,可以自主决定生成的类簇。另外,该算法还可以处理实际的动态数据,实现增量式聚类,删除已聚类数据,处理新来网络日志。真实的网络环境测试证明,该算法既大大压缩了TCP日志记录存储量,又保证了日志记录的完整性和准确性,并且不影响用户的正常网络通信。
引用
收藏
页码:196 / 201
页数:6
相关论文
共 9 条
[1]  
数据挖掘.[M].(加)JiaweiHan;(加)MichelineKamber著;范明;孟小峰等译;.机械工业出版社.2001,
[2]   支持审计与取证联动的日志系统设计 [J].
宁兴旺 ;
刘培玉 .
计算机工程与设计, 2009, 30 (24) :5580-5583
[3]   基于集群的多源日志综合审计系统 [J].
刘必雄 ;
杨泽明 ;
吴焕 ;
许榕生 .
计算机应用, 2008, (02) :541-544
[4]   聚类算法研究 [J].
孙吉贵 ;
刘杰 ;
赵连宇 .
软件学报, 2008, (01) :48-61
[5]   防火墙通信日志处理技术研究 [J].
陈麟 ;
李焕洲 ;
吴贞东 .
微计算机信息, 2007, (30) :116-117+177
[6]   TCP数据流的非对称性分析 [J].
戴宣 ;
丁伟 ;
程光 .
计算机工程, 2007, (14) :118-120
[7]   基于事件关联的电子取证实时入侵重构 [J].
张基温 ;
朱剑 .
计算机工程与设计, 2006, (22) :4325-4327
[8]   基于Clark-Wilson完整性策略的安全监视模型 [J].
斯汉 ;
温红子 ;
雷浩 ;
王建 .
软件学报, 2004, (08) :1124-1132
[9]  
基于Web日志的网络用户聚类研究与实现.[D].付志涛.南京理工大学.2007, 01