LogTAD:无监督跨系统日志异常域检测

news2025/7/29 0:27:06

摘要

日志异常检测,其对开发稳定、可持续的系统具有重要意义。但当系统刚上线时,收集足够的数据训练一个无监督模型是不现实的。为此本文提出了一个可转移的日志异常检测(LogTAD)框架,该框架利用对抗域适应技术使来自不同系统的日志数据具有相似的分布,从而使检测模型能够检测来自多个系统的异常。实验表明,LogTAD在使用少量新系统日志的情况下,可以实现较高的跨系统异常检测精度。

介绍

在实践中,系统日志被广泛用于记录在线系统的状态,在检测网络安全中起着至关重要的作用。近年来,许多基于机器学习的日志异常检测方法被提出以检测异常日志序列。由于异常有限,提出了许多无监督机器学习方法来识别异常日志序列,如主成分分析(PCA)、DeepLog和LogBERT。

关键思想是从大量正常日志中捕获正常模式,模型根据正常模式对异常日志序列检测。当被部署到新系统时,需要一些时间来收集足够的日志来训练一个无监督异常检测模型。而新部署的系统通常有自动识别异常状态的紧急需求。

为解决冷启动问题,提出了几种基于迁移学习的方法来检测不同系统中的异常,如LogTransfer。基本假设是,不同在线系统中的异常日志序列通常具有相似的模式。例如,来自不同系统的日志消息中的单词通常有一些重叠。同时,不同系统的正常工作流程也有一些相似之处。这样构建一个跨系统分类器来检测源系统和目标系统中的异常。

现有模型的主要缺点是,需要来自源系统和目标系统的正常和异常日志数据来构建分类器。但实际中从目标系统中收集到足够的异常数据往往不可行。

本文提出了一种可转移的日志异常检测方法,LogTAD,不需要源系统和目标系统的标记异常数据。受到DeepSVDD方法的启发(该方法使正常数据接近超球体的中心),核心思想是基于源系统和目标系统中的正常数据派生系统不变中心表示。利用领域对抗技术将源和目标日志序列映射到具有相似分布的同一个超球体中,并为两个系统派生出共享中心,通过距离中心较远的距离,检测到两个系统的异常序列。

本文方法建立了一个只使用正常样本的跨系统异常检测模型。该模型只需要来自目标系统的少量样本,就可以解决异常检测的冷启动问题。

框架

假设源系统 S 和目标系统 T,数据集 D,由S系统的正常日志序列和少量T系统的正常日志序列组成。由此建立一个无监督的跨异常检测模型,其可以检测S和T系统中的异常序列。模型有两个部分组成,一个是编码器,将日志序列映射到低维空间,另一个是将日志序列表征映射到一个超球面,两个系统日志共享一个球心,正常日志序列应更靠近球心,使用领域对抗框架使序列表征更靠近球心;这样距离球心越远的则越可能异常。

日志序列表征

使用原始日志,通常不同系统的描述性词汇应该有一些相似之处,在S系统和T系统的词汇方面存在一些重叠。先使用word2vec将每个日志消息中的单词表示为嵌入向量,使用日志消息中的单词嵌入均值作为日志表征。日志序列表征为,使用LSTM模型,

日志被表征为hn,lstm模型的参数是共享的,可减少对T系统日志的需求。

正常日志序列应该在一个超球体中且靠近球心,开始使用所有样本向量的均值代表球形,目标函数:

本文提出一种对抗训练方法,使不同系统的正常日志互相靠近;

鉴别器D用于区分日志序列的表示是来自S系统还是T系统。用logistic函数进行预测,目的使不同系统的日志不被分开,

 通过minmax优化,LSTM生成的不同系统的日志序列表征无法被鉴别器区分。

总的目标函数:,这样训练后,编码器可将不同系统正常日志映射到超球体中靠近中心处。

设置阈值半径γ,作为正常和异常的判断标准,样本到球心距离大于阈值的则为异常序列。

结论

本文提出了一个跨系统的日志异常检测框架,LogTAD,使超球中的正常日志数据接近一个中心,并利用域对抗自适应使来自不同系统的日志数据遵循相似的分布,通过距离球心距离判断是否异常。本文方法的一个局限性是,假设S系统和T系统在词汇方面共享类似的模式。

参考:

GitHub - hanxiao0607/LogTAD: LogTAD: Unsupervised Cross-system Log Anomaly Detection via Domain Adaptation

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/16340.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

小程序最新获取用户头像昵称

目录 一、前言 二、遇到的问题 三、效果页面 四、代码实现 记录: 一、前言 昨天打开编辑器后,发现小程序用户的头像与昵称都给变默认了,就去网上搜了一下: 小程序用户头像昵称获取规则调整公告 | 微信开放社区 我去&…

Spring6整合JUnit5

十七、Spring6整合JUnit5 17.1 Spring对JUnit4的支持 准备工作&#xff1a; <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instanc…

[附源码]java毕业设计暖暖猫窝系统

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

Linux之软连接和硬连接的用法和区别【详细!!!】

目录软连接创建一个软连接删除软连接硬链接创建硬链接删除硬链接硬链接和软连接之间的区别软连接 创建一个软连接 ln -s [源文件或目录] [软连接名称] 例子&#xff1a; 在/home目录下创建一个软连接linkToRoot 链接到/root目录 删除软连接 rm -f /linkToRoot例子&#x…

供应CAS:73342-16-2,N3-PEG-OH,Azide-PEG-Hydroxy,叠氮-聚乙二醇-羟基

一&#xff1a;产品描述 1、名称 英文&#xff1a;N3-PEG-OH&#xff0c;Azide-PEG-Hydroxy 中文&#xff1a;叠氮-聚乙二醇-羟基 2、CAS编号&#xff1a;73342-16-2 3、所属分类&#xff1a;Azide PEG Hydroxyl PEG 4、分子量&#xff1a;可定制&#xff0c;叠氮-PEG 34…

[附源码]java毕业设计某公司酬薪管理系统

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

无需重启应用,动态采集任意点位日志

作者&#xff1a; 屿山 现实系统往往有着较高的复杂度&#xff0c;我们借助 Trace、Log、Metric 三驾马车使我们的系统具备了一定的可观测性&#xff0c;但观测位置和信息往往是固定的&#xff0c;而我们所遇到的问题常常是意料之外的&#xff0c;这就导致我们能够定位问题的范…

BLE学习(1):蓝牙协议栈的介绍

蓝牙官方(The Bluetooth Special Interest Group)定义了低功耗蓝牙(Bluetooth low energy,即LE)和基础/增强速率蓝牙(Bluetooth basic rate/enhanced data rate ,即BR/EDR)两种技术的协议栈。这两种协议栈可以单独使用&#xff0c;也可以同时使用&#xff0c;如下图所示&#x…

泛型「generic」讲解

标题1. 泛型语法1.1 泛型的引出1.2 泛型介绍1.3 泛型语法1.4 泛型使用细节1.5 练习题2.自定义泛型2.1自定义泛型-类2.2自定义泛型-接口2.3自定义泛型-方法2.4练习题3.范型继承和通配符3.1JUnit单元测试框架3.2练习题1. 泛型语法 1.1 泛型的引出 传统方法不能对加入到集合中的…

Docker部署ELK

Docker部署ELK安装包下载1、安装docker2、安装docker compose3、使用docker加载离线镜像4、上传yml文件并初始化密码5、造数据&#xff0c;看采集结果安装包下载 链接:https://pan.baidu.com/s/1LOHyhTHm3-30v6wAfYLTAg 提取码:5uno 1、安装docker &#xff08;1&#xff09…

Python新手的福音,涵盖20+种初学者必练项目!

前言 对学Python的新手同学来说&#xff0c;最最最想要的干货是什么&#xff1f;是大量可以练手的项目啊。俗话说&#xff0c;三天不练手生&#xff0c;三天不念口生。#技术派的书架# &#xff08;文末送读者福利&#xff09; 在某乎上有一个关于"Python的练手项目”的问…

【线程】线程同步

目录 一、信号量 1.函数 2.使用 二、读写锁 1.函数 2.使用 三、互斥锁 1.函数 2.使用 四、条件变量 1.函数 2.使用 前言 线程同步的实现方法&#xff1a;信号量、互斥锁、条件变量、读写锁。 下面就对着四种方法进行展开描述 一、信号量 与进程间通信的信号量类似&a…

JNPF3.4.5大版本正式上线啦!

千呼万唤始出来&#xff0c;时隔近四个月&#xff0c;引迈信息终于再度推出新版本与大家见面了&#xff0c;此次推出的3.4.5大版本&#xff0c;可谓是吊足了大家的胃口。 本次大更新为用户带来的是高效率、高可用性、低成本、快速部署、易于扩展的快速开发平台的使用体验。本次…

【ASM】字节码操作 工具类与常用类 TraceClassVisitor 介绍

文章目录 1.概述2. TraceClassVisitor2.1 class info2.2 字段信息2.3 constructors2.4 methods3.如何使用TraceClassVisitor3.1 生成新的类3.2 修改已有的类3.3 打印ASM信息4.总结感谢第一个订阅字节码的人,感谢老铁支持 adminhjy 1.概述 在上一篇文章:

拓展卡尔曼滤波(Kalman)附Matlab代码

✅作者简介&#xff1a;热爱科研的Matlab仿真开发者&#xff0c;修心和技术同步精进&#xff0c;matlab项目合作可私信。 &#x1f34e;个人主页&#xff1a;Matlab科研工作室 &#x1f34a;个人信条&#xff1a;格物致知。 更多Matlab仿真内容点击&#x1f447; 智能优化算法 …

分享5个良心好用的PC软件,免费无广告

今天再次推荐5个良心好用的Windows神级软件&#xff0c;每一个都是完全免费&#xff0c;堪称神器&#xff0c;让你打开新世界的大门。 1.数据恢复工具——EaseUS Data EaseUS Data Recovery Wizard是一款简单易用的数据恢复工具&#xff0c;给用户提供了三种恢复模式&#xf…

docker部署ES及kibana整个流程

对于ES小白&#xff0c;第一次安装ES走了很多弯路&#xff0c;下面记录自己本地安装elasticsearch的整个过程&#xff0c;我觉得小白如果按照我的流程走&#xff0c;大部分应该可以安装并运行成功。下面是整个步骤&#xff1a; 一、部署ES 拉取镜像 docker pull docker.elast…

胞外囊泡代谢组学—前列腺癌代谢变化研究的新策略

小小身体蕴含大大能量&#xff01;前列腺癌非侵入性的诊断和监测的新方式——胞外囊泡&#xff08;外泌体&#xff09;代谢组学&#xff01;目前&#xff0c;胞外囊泡/外泌体作为非侵入性的癌生物标志物已成为新的研究热点。百趣代谢组学文献分享&#xff0c;芬兰赫尔辛基大学学…

避免项目资源管理陷阱,8Manage帮你支招!

项目资源管理主要是对项目所需的人力、材料、机械、技术、资源等资源进行计划、组织、指挥、协调和控制。众所周知&#xff0c;项目推进需要资源支撑&#xff0c;一旦资源不足&#xff0c;项目的进度和质量都会受到影响。而在项目管理活动中&#xff0c;做好资源管理并不容易&a…

SORT追踪

卡尔曼滤波 卡尔曼滤波用当前时刻运动变量去预测下一时刻的运动变量&#xff0c;检测器第一次的检测结果用来初始化卡尔曼滤波的运动变量&#xff0c;后续的结果作为更新。在信号处理中卡尔曼滤波是去除噪声的一个算法&#xff0c;作用是使用信号更加的准确。在SORT中的&#x…