NSL-KDD数据集字段介绍

发布时间 2023-11-07 22:36:25作者: 碳碳单键

起因:

在看论文,百度搜了一下NSL-KDD数据集的介绍(各种CSDN的网站),里面大部分内容还是可以的,从中找到了对数据集的字段但是没有具体解释(数据集原网站也看过没找到解释数据集中列名的文档)。

偶然找到一篇CSDN上的NSL-KDD数据集字段介绍,竟然要求订阅(四五十块钱才能开通),一气之下去问了chat3.5(NSL-KDD数据集挺早的,应该有被收录),回答如下。

NSL-KDD数据集字段介绍:

NSL-KDD数据集中的字段代表了网络连接的各种属性和特征,用于描述网络流量和入侵活动。以下是NSL-KDD数据集中一些常见字段的含义:

1.duration: 这是网络连接的持续时间,以秒为单位。它表示连接建立和关闭之间的时间。
2.protocol_type: 这个字段表示网络连接使用的协议类型,如TCP、UDP或ICMP。
3.service: 表示连接所提供的网络服务或应用程序的类型,例如http、ftp、telnet等。
4.flag: 表示网络连接的状态标志,如SYN、FIN、ACK等。它用于描述TCP连接的状态。
5.src_bytes: 这是从源主机到目标主机传输的字节数。
6.dst_bytes: 这是从目标主机到源主机传输的字节数。
7.land: 这个字段是一个二进制标志,表示连接是否来自同一个源和目标IP地址。
8.wrong_fragment: 表示“错误分段”的数量,这些分段不符合协议规范。
9.urgent: 这是TCP紧急标志的数量。
10.hot: 这个字段表示与主机级别相关的连接数量。
11.numfailedlogins: 表示登录尝试失败的次数。
12.logged_in: 这是一个二进制标志,表示用户是否已登录。
13.num_compromised: 表示已经被入侵的主机数量。
14.root_shell: 这是一个二进制标志,表示是否存在具有root权限的shell会话。
15.su_attempted: 表示是否尝试超级用户(root)访问。
16.num_root: 表示已获得root权限的次数。
17.numfilecreations: 表示创建新文件的次数。
18.num_shells: 表示shell会话的数量。
19.numaccessfiles: 表示访问文件的数量。
20.numoutboundcmds: 表示出站命令的数量。
21.ishotlogin: 这是一个二进制标志,表示是否存在“热门”登录。
22.isguestlogin: 这是一个二进制标志,表示是否存在“访客”登录。
23.count: 表示与相同目标主机的连接数量。
24.srv_count: 表示与相同服务的连接数量。
25.serror_rate: 表示出现套接字错误的连接比率。
26.srvserrorrate: 表示出现套接字错误的连接比率,针对特定服务。
27.rerror_rate: 表示出现连接错误的比率。
28.srvrerrorrate: 表示出现连接错误的比率,针对特定服务。
29.samesrvrate: 表示与相同服务的连接比率。
30.diffsrvrate: 表示与不同服务的连接比率。
31.srvdiffhost_rate: 表示与不同主机的连接比率,针对特定服务。
32.dsthostcount: 表示目标主机数量。
33.dsthostsrv_count: 表示目标主机上运行的服务数量。
34.dsthostsamesrvrate: 表示目标主机上与相同服务的连接比率。
35.dsthostdiffsrvrate: 表示目标主机上与不同服务的连接比率。
36.dsthostsamesrcport_rate: 表示目标主机上与相同源端口的连接比率。
37.dsthostsrvdiffhost_rate: 表示目标主机上与不同主机的连接比率,针对特定服务。
38.dsthostserror_rate: 表示目标主机上出现套接字错误的连接比率。
39.dsthostsrvserrorrate: 表示目标主机上出现套接字错误的连接比率,针对特定服务。
40.dsthostrerror_rate: 表示目标主机上出现连接错误的比率。
41.dsthostsrvrerrorrate: 表示目标主机上出现连接错误的比率,针对特定服务。
42.class: 这是网络连接的分类标签,表示连接是正常连接还是入侵。通常包括正常、DoS攻击、Probe侦察、R2L远程到本地攻击和U2R用户到根攻击等类别。

这些字段的含义是用于描述NSL-KDD数据集中的网络连接属性和特征,这些特征可以用于训练入侵检测模型。不同的字段包含不同类型的信息,用于识别和分类不同类型的网络活动。