Drain: An Online Log Parsing Approach with Fixed Depth Tree

最新推荐文章于 2026-02-15 00:16:12 发布

原创

最新推荐文章于 2026-02-15 00:16:12 发布 · 1.2k 阅读

·

11

·

标签

#Drain #日志解析 #解析树 #论文阅读 #BGL

Drain论文概述

Drain: An Online Log Parsing Approach with Fixed Depth Tree

Drain: An Online Log Parsing Approach with Fixed Depth Tree

摘要

论文提出了一种名为 Drain 的在线日志解析方法，旨在解决由于日志量快速增长而导致的离线日志解析方法的效率问题。Drain 通过使用固定深度的解析树，并在树节点中编码特殊设计的规则，实现了日志的流式解析，并大大提高了解析效率和准确性。

介绍

现代云计算和服务导向架构（SOA）的普及使得日志分析在服务管理中变得至关重要。日志通常是唯一记录系统运行时信息的数据资源，然而，原始日志信息是非结构化的，需要解析成结构化事件以便进一步分析。现有大多数日志解析方法集中于离线批处理，而随着日志量的增加，这种方法变得越来越耗时。

方法

Drain 提出了一个固定深度的解析树，用于在线解析日志信息。具体步骤包括：

预处理：使用简单的正则表达式去除日志信息中的常见变量。
通过日志长度搜索：根据日志信息的长度选择解析树的路径。
通过前缀搜索：根据日志信息的前几个标记选择下一层节点。
相似性搜索：计算日志信息与日志事件模板的相似性，并选择最适合的日志组。
更新解析树：如果找到合适的日志组，则更新其信息；如果没有，则创建新的日志组并更新解析树。

实验

日志数据集：

BGL：来自 BlueGene/L 超级计算机系统的日志数据集。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

江小皮不皮 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。