基于机器学习的日志函数自动识别方法

被引:7
作者
贾周阳
廖湘科
刘晓东
李姗姗
周书林
谢欣伟
机构
[1] 国防科学技术大学计算机学院
关键词
日志函数; 机器学习; 静态分析; 代码质量; 故障检测;
D O I
暂无
中图分类号
TP311.53 []; TP181 [自动推理、机器学习];
学科分类号
140502 [人工智能];
摘要
随着软件规模的不断增长,日志在故障检测中发挥着愈加重要的作用。然而,目前软件日志缺乏统一标准,常受开发人员个人习惯影响,为大规模系统中日志的自动化分析带来了挑战。其中,日志函数的识别作为日志分析的前提条件,对分析结果有着直接影响。提出了一种基于机器学习的方法以支持日志自动识别。通过系统分析广泛使用的大规模开源软件,总结出日志函数编写的主要形式,并提取不同形式间的共性特征,进而基于机器学习实现了自动日志识别工具iLog。实验显示,使用iLog识别的日志函数能力平均为使用特定关键字的76倍,十折交叉验证得到iLog的分析结果的F-Score为0.93。
引用
收藏
页码:111 / 117
页数:7
相关论文
共 7 条
[1]
基于Hadoop的Web日志挖掘 [J].
程苗 ;
陈华平 .
计算机工程, 2011, 37 (11) :37-39
[2]
Web日志挖掘中的用户识别算法 [J].
肖慧 ;
王立华 .
计算机系统应用, 2011, 20 (05) :223-226
[3]
Web日志的高效多能挖掘算法 [J].
宋擒豹 ;
沈钧毅 .
计算机研究与发展, 2001, (03) :328-333
[4]
Event Logs for the Analysis of Software Failures: A Rule-Based Approach [J].
Cinque, Marcello ;
Cotroneo, Domenico ;
Pecchia, Antonio .
IEEE TRANSACTIONS ON SOFTWARE ENGINEERING, 2013, 39 (06) :806-821
[5]
Improving Software Diagnosability via Log Enhancement [J].
Yuan, Ding ;
Zheng, Jing ;
Park, Soyeon ;
Zhou, Yuanyuan ;
Savage, Stefan .
ACM TRANSACTIONS ON COMPUTER SYSTEMS, 2012, 30 (01)
[6]
SherLog.[J].Ding Yuan;Haohui Mai;Weiwei Xiong;Lin Tan;Yuanyuan Zhou;Shankar Pasupathy.ACM SIGARCH Computer Architecture News.2010, 1
[7]
A graphical representation for identifier structure in logs..Ariel Rabkin;Wei Xu;Avani Wildani;et al;.SLAML''10 Proceedings of the 2010 workshop on Managing systems via log analysis and machine learning techniques.2010,