第12单元　内核加固

12.1　知识讲解

12.1.1　拒绝服务攻击

拒绝服务(Denial of Service, DoS)攻击是一种简单有效的攻击方式。它通过大量消耗服务器主机的系统资源，阻碍其提供正常的网络服务，达到攻击目的。

TCP SYN泛洪攻击是一种典型的拒绝服务攻击，其攻击发起者利用TCP协议漏洞，模拟众多服务请求，使服务器主机疲于奔命，以至无法响应正常的服务请求。

TCP连接的建立需要一个三路握手过程，如下图所示：

sequenceDiagram participant Client participant Server Client->>Server: SYN(N) Server->>Client: SYN+ACK(N+1,M) Client->>Server: ACK(M+1)

连接建立之前，服务器打开特定的端口并监听
客户端向该端口发送一个TCP数据包，其包头中带有SYN标志位，发送序列号为N
服务器收到该数据包后，向客户端返回一个TCP数据包，其包头中带有SYN和ACK两个标志位，接收序列号为N+1，发送序列号为M
客户端收到该数据包后，再次向服务器发送一个TCP数据包，其包头中带有ACK标志位，接收序列号为M+1
至此三路握手完成，TCP连接建立

如果服务器在向客户端发出SYN+ACK(N+1,M)数据包后，未能在给定时间窗口内收到对方返回的ACK(M+1)应答，就会认为所发送数据包已丢失，进而重发该数据包。如果重发多次，始终未能收到客户端的应答，服务器才会最终放弃尝试。如下图所示：

sequenceDiagram participant Client participant Server Client->>Server: SYN(N) Server->>Client: SYN+ACK(N+1,M) Server->>Client: SYN+ACK(N+1,M) Server->>Client: SYN+ACK(N+1,M) Server->>Client: SYN+ACK(N+1,M)

在这个过程中，服务器需要记录客户端所发送数据包的相关信息，需要维护重发定时器，需要对是否超时做出逻辑判断，等等，这一系列动作所消耗的系统资源远远大于服务器正常发送数据时的消耗。

如果攻击者不停地向服务器发送大量的孤立SYN数据包，服务器资源将很快消耗殆尽，无法继续提供正常的网络服务。这就是TCP SYN泛洪拒绝服务攻击的基本原理。

12.1.2　僵尸网络

与早期由单台主机发起的单兵作战式的拒绝服务攻击不同，近年来渐渐流行起来的分布式拒绝服务(Distributed Denial of Service, DDoS)攻击借助多台被植入攻击木马的傀儡主机，同时向一个目标主机发起集团作战式的拒绝服务攻击，致使被攻击主机遭受巨大的压力，即使是高带宽、高配置的网络服务器也难以幸免。

目前大部分分布式拒绝服务攻击都是通过僵尸网络(Botnet)实现的。攻击者先将攻击程序部署在僵尸网络的各个被控主机上，在选定攻击目标后，通过僵尸网络向所有被控主机上的攻击程序发送指令，使其同时向攻击目标发起进攻，剧烈消耗目标主机的网络带宽和运算资源，以致其瞬间瘫痪。如下图所示：

graph LR attacker((Attacker)) subgraph Botnet master_1(Master) master_2(Master) bot_1(Bot) bot_2(Bot) bot_3(Bot) bot_4(Bot) bot_5(Bot) bot_6(Bot) master_1-->bot_1 master_1-->bot_2 master_1-->bot_3 master_2-->bot_4 master_2-->bot_5 master_2-->bot_6 end attacktarget{Attacktarget} attacker-->master_1 attacker-->master_2 bot_1--DoS-->attacktarget bot_2--DoS-->attacktarget bot_3--DoS-->attacktarget bot_4--DoS-->attacktarget bot_5--DoS-->attacktarget bot_6--DoS-->attacktarget

事实上，只要僵尸网络的规模足够大，即便每个攻击程序只是发出普通的服务请求，也能大量消耗被攻击主机的系统资源，阻塞其网络带宽，达到拒绝服务的目的。

12.1.3　内核强化

1. 获取内核源码

执行如下命令查看内核版本：

$ uname -r

4.15.0-47-generic

执行如下命令下载特定版本的内核源码包并解压缩：

$ cd /usr/src
$ sudo apt-get install linux-source-4.15.0
$ sudo tar -jxvf linux-source-4.15.0.tar.bz2

内核源码放在/usr/src/linux-source-4.15.0目录下。

或执行如下命令下载特定版本的内核源码包并解压缩：

$ cd /usr/src
$ sudo wget https://www.kernel.org/pub/linux/kernel/v4.x/linux-4.15.1.tar.gz
$ sudo tar -zxvf linux-4.15.1.tar.gz

内核源码放在/usr/src/linux-4.15.1目录下。

2. 分析内核源码

1) 正常建立TCP连接

/usr/src/linux-source-4.15.0/net/ipv4/af_inet.c:1612

static struct net_protocol tcp_protocol = {
    ...
    .handler = tcp_v4_rcv,
    ...
};

Linux内核通过定义静态全局变量tcp_protocol注册对TCP协议的处理函数tcp_v4_rcv。

/usr/src/linux-source-4.15.0/net/ipv4/tcp_ipv4.c:1627

int tcp_v4_rcv(...) {
    ...
    if (sk->sk_state == TCP_LISTEN) {
        ret = tcp_v4_do_rcv(...);
        ...
    }
    ...
}

对于侦听套接字(sk->sk_state == TCP_LISTEN)，tcp_v4_rcv函数调用tcp_v4_do_rcv函数。

/usr/src/linux-source-4.15.0/net/ipv4/tcp_ipv4.c:1453

int tcp_v4_do_rcv(...) {
    ...
    if (sk->sk_state == TCP_LISTEN) {
        struct sock* nsk = tcp_v4_cookie_check(...);
        ...
    }
    ...
    if (tcp_rcv_state_process(...)) {
        ...
    }
    ...
}

对于侦听套接字(sk->sk_state == TCP_LISTEN)，tcp_v4_do_rcv函数先调用tcp_v4_cookie_check函数，处理客户端为建立连接发来的包头中带有SYN标志位的TCP数据包，而后调用tcp_rcv_state_process函数。

/usr/src/linux-source-4.15.0/net/ipv4/tcp_input.c:5850

int tcp_rcv_state_process(...) {
    ...
    switch (sk->sk_state) {
        ...
        case TCP_LISTEN:
            ...
            if (th->syn) {
                ...
                acceptable = icsk_af_ops->conn_request(...);
                ...
            }
            ...
        ...
    }
    ...
}

对于侦听套接字(case TCP_LISTEN)收到的包头中带有SYN标志位(th->syn)的TCP数据包，tcp_rcv_state_process函数通过conn_request函数指针调用tcp_v4_conn_request函数。

/usr/src/linux-source-4.15.0/net/ipv4/tcp_ipv4.c:1313

int tcp_v4_conn_request(...) {
    ...
    return tcp_conn_request(...);
    ...
}

tcp_v4_conn_request函数调用tcp_conn_request函数。

/usr/src/linux-source-4.15.0/net/ipv4/tcp_input.c:6252

int tcp_conn_request(...) {
    ...
    if (want_cookie) {
        isn = cookie_init_sequence(...);
        ...
    }
    ...
    if (fastopen_sk) {
        af_ops->send_synack(...);
        ...
    } else {
        ...
        if (!want_cookie)
            inet_csk_reqsk_queue_hash_add(..., tcp_timeout_init(...));
        af_ops->send_synack(...);
        ...
    }
    ...
}

tcp_conn_request函数通过send_synack函数指针调用tcp_v4_send_synack函数。

/usr/src/linux-source-4.15.0/net/ipv4/tcp_ipv4.c:863

static int tcp_v4_send_synack(...) {
    ...
    skb = tcp_make_synack(...);
    if (skb) {
        ...
        err = ip_build_and_send_pkt(...);
        ...
    }
    ...
}

tcp_v4_send_synack函数负责构建并向客户端返回包头中带有SYN和ACK两个标志位的TCP数据包。客户端收到该数据包后，再次向服务器发送一个包头中带有ACK标志位的TCP数据包。服务器的tcp_v4_rcv函数再次被调用，该函数调用tcp_v4_do_rcv函数。

/usr/src/linux-source-4.15.0/net/ipv4/tcp_ipv4.c:1453

int tcp_v4_do_rcv(...) {
    ...
    if (sk->sk_state == TCP_LISTEN) {
        struct sock* nsk = tcp_v4_cookie_check(...);
        ...
        if (nsk != sk) {
            if (tcp_child_process(...)) {
                ...
            }
            ...
        }
    }
    ...
}

对于侦听套接字(sk->sk_state == TCP_LISTEN)，tcp_v4_do_rcv函数先调用tcp_v4_cookie_check函数，处理客户端发来的包头中带有ACK标志位的TCP数据包，在此过程中套接字状态(sk->sk_state)会被更新为TCP_SYN_RECV，同时创建并返回一个不同于侦听套接字(sk)的，可用于后续通信的新套接字(nsk, nsk != sk)，然后调用tcp_child_process函数。

/usr/src/linux-source-4.15.0/net/ipv4/tcp_minisocks.c:827

int tcp_child_process(...) {
    ...
    if (!sock_owned_by_user(child)) {
        ret = tcp_rcv_state_process(...);
        ...
    }
    ...
}

tcp_child_process函数调用tcp_rcv_state_process函数。

/usr/src/linux-source-4.15.0/net/ipv4/tcp_input.c:5850

int tcp_rcv_state_process(...) {
    ...
    if (req) {
        ...
        if (!tcp_check_req(...))
            ...
    }
    ...
    switch (sk->sk_state) {
        case TCP_SYN_RECV:
            ...
            tcp_set_state(sk, TCP_ESTABLISHED);
            ...
        ...
    }
    ...
}

tcp_rcv_state_process函数通过tcp_set_state函数将套接字状态设置为TCP_ESTABLISHED，至此TCP连接建立完成。

2) 遭受TCP SYN攻击

如前所述，服务器在收到客户端为建立连接发来的包头中带有SYN标志位的TCP数据包后，在tcp_conn_request函数中，通过send_synack函数指针调用tcp_v4_send_synack函数，向客户端返回包头中带有SYN和ACK两个标志位的TCP数据包。

/usr/src/linux-source-4.15.0/net/ipv4/tcp_input.c:6252

int tcp_conn_request(...) {
    ...
    if (want_cookie) {
        isn = cookie_init_sequence(...);
        ...
    }
    ...
    if (fastopen_sk) {
        af_ops->send_synack(...);
        ...
    } else {
        ...
        if (!want_cookie)
            inet_csk_reqsk_queue_hash_add(..., tcp_timeout_init(...));
        af_ops->send_synack(...);
        ...
    }
    ...
}

tcp_conn_request函数还会调用inet_csk_reqsk_queue_hash_add函数，其参数中包含超时。

/usr/src/linux-source-4.15.0/net/ipv4/inet_connection_sock.c:760

void inet_csk_reqsk_queue_hash_add(..., unsigned long timeout) {
    reqsk_queue_hash_req(..., timeout);
    ...
}

inet_csk_reqsk_queue_hash_add函数调用reqsk_queue_hash_req函数，其参数中包含超时。

/usr/src/linux-source-4.15.0/net/ipv4/inet_connection_sock.c:742

static void reqsk_queue_hash_req(..., unsigned long timeout) {
    ...
    timer_setup(..., reqsk_timer_handler, ...);
    mod_timer(..., jiffies + timeout);
    inet_ehash_insert(...);
    ...
}

reqsk_queue_hash_req函数先调用timer_setup函数开启定时器，再调用mod_timer函数设置超时，最后通过inet_ehash_insert函数将半连接套接字加入哈希队列。定时器处理函数reqsk_timer_handler将被周期性地调用。

/usr/src/linux-source-4.15.0/net/ipv4/inet_connection_sock.c:676

static void reqsk_timer_handler(...) {
    ...
    if (!expire && (... !inet_rtx_syn_ack(...) ...)) {
        ...
    }
    ...
}

reqsk_timer_handler函数在超时到期之前(!expire)通过inet_rtx_syn_ack函数向客户端发送包头中带有SYN和ACK两个标志位的TCP数据包。

当服务器收到来自客户端包头中带有ACK标志位的TCP数据包后，在tcp_rcv_state_process函数中通过tcp_set_state函数将套接字状态设置为TCP_ESTABLISHED，表示TCP连接建立完成。

/usr/src/linux-source-4.15.0/net/ipv4/tcp_input.c:5850

int tcp_rcv_state_process(...) {
    ...
    if (req) {
        ...
        if (!tcp_check_req(...))
            ...
    }
    ...
    switch (sk->sk_state) {
        case TCP_SYN_RECV:
            ...
            tcp_set_state(sk, TCP_ESTABLISHED);
            ...
        ...
    }
    ...
}

在tcp_rcv_state_process函数调用tcp_set_state函数之前会先调用tcp_check_req函数。

/usr/src/linux-source-4.15.0/net/ipv4/tcp_minisocks.c:578

struct sock* tcp_check_req(...) {
    ...
    return inet_csk_complete_hashdance(...);
    ...
}

tcp_check_req函数调用inet_csk_complete_hashdance函数。

/usr/src/linux-source-4.15.0/net/ipv4/inet_connection_sock.c:944

struct sock* inet_csk_complete_hashdance(...) {
    if (own_req) {
        inet_csk_reqsk_queue_drop(...);
        ...
    }
    ...
}

inet_csk_complete_hashdance函数调用inet_csk_reqsk_queue_drop函数。

/usr/src/linux-source-4.15.0/net/ipv4/inet_connection_sock.c:660

void inet_csk_reqsk_queue_drop(...) {
    if (reqsk_queue_unlink(...)) {
        ...
    }
}

inet_csk_reqsk_queue_drop函数调用reqsk_queue_unlink函数。

/usr/src/linux-source-4.15.0/net/ipv4/inet_connection_sock.c:642

static bool reqsk_queue_unlink(...) {
    ...
    if (sk_hashed(req_to_sk(...))) {
        ...
        found = __sk_nulls_del_node_init_rcu(req_to_sk(...));
        ...
    }
    if (timer_pending(...) && del_timer_sync(...))
        ...        
}

reqsk_queue_unlink函数先通过__sk_nulls_del_node_init_rcu函数将半连接套接字从哈希队列中删除，再通过timer_pending和del_timer_sync函数销毁未到期的定时器。

利用TCP协议的这种特点，攻击者向服务器的某个开发端口发送大量孤立的SYN请求包，并伪造不同的源IP地址。系统为每个这样的请求包都要维护一个独立的超时定时器，并将相应的半连接套接字加入重发队列，每隔一段时间就要为每个这样的套接字重发SYN+ACK响应包，系统资源将很快耗尽。可见，TCP SYN攻击对Linux系统的危害十分严重。

3. 修改内核源码

当以太网卡接收到一个数据包时，其DMA控制器会触发一个硬件中断，通知系统内核该设备已然读就绪，即可被轮询(Poll)。针对该中断的处理函数在网卡驱动中实现。Intel 8255x系列网卡的中断处理函数如下所示：

/usr/src/linux-source-4.15.0/drivers/net/ethernet/intel/e100.c:2217

static irqreturn_t e100_intr(...) {
    ...
    if (likely(napi_schedule_prep(...))) {
        e100_disable_irq(...);
        __napi_schedule(...);
    }
    ...
}

e100_intr函数先通过napi_schedule_prep函数检查该设备是否已在读就绪设备队列中，如果不在，则通过e100_disable_irq函数关闭当前中断，然后调用__napi_schedule函数。

/usr/src/linux-source-4.15.0/net/core/dev.c:5282

void __napi_schedule(...) {
    ...
    ____napi_schedule(...);
    ...
}

__napi_schedule函数调用____napi_schedule函数。

/usr/src/linux-source-4.15.0/net/core/dev.c:3587

static inline void ____napi_schedule(...) {
    list_add_tail(...);
    __raise_softirq_irqoff(NET_RX_SOFTIRQ);
}

____napi_schedule函数先通过list_add_tail函数将该网卡追加到读就绪设备队列的尾部，然后通过__raise_softirq_irqoff函数触发一个名为NET_RX_SOFTIRQ的软中断。

/usr/src/linux-source-4.15.0/net/core/dev.c:8817

static int __init net_dev_init(void) {
    ...
    open_softirq(NET_RX_SOFTIRQ, net_rx_action);
    ...
}

从net_dev_init函数可以看出，针对NET_RX_SOFTIRQ软中断的中断处理函数是net_rx_action。

/usr/src/linux-source-4.15.0/net/core/dev.c:5684

static __latent_entropy void net_rx_action(...) {
    ...
    for (;;) {
        ...
        n = list_first_entry(...);
        budget -= napi_poll(n, ...);
        ...
    }
    ...
}

net_rx_action函数在循环中轮询读就绪设备队列，对其中的每一个读就绪设备(n)调用napi_poll函数。

/usr/src/linux-source-4.15.0/net/core/dev.c:5622

static int napi_poll(...) {
    ...
    if (test_bit(...)) {
        work = n->poll(...);
        ...
    }
    ...
}

napi_poll函数通过poll函数指针调用由网卡驱动提供的e100_poll函数。

/usr/src/linux-source-4.15.0/drivers/net/ethernet/intel/e100.c:2245

static int e100_poll(...) {
    ...
    e100_rx_clean(..., &work_done, budget);
    ...
    if (work_done < budget) {
        ...
        e100_enable_irq(...);
    }
    ...
}

e100_poll函数通过e100_rx_clean函数从设备中读取数据。如果实际读到的字节数比期望读取的字节数少(work_done < budget)，则说明设备中的数据已经读完，这时通过e100_enable_irq函数恢复当前中断。

/usr/src/linux-source-4.15.0/drivers/net/ethernet/intel/e100.c:2078

static void e100_rx_clean(...) {
    ...
    for (...) {
        err = e100_rx_indicate(...);
        ...
    }
    ...
}

e100_rx_clean函数调用e100_rx_indicate函数。

/usr/src/linux-source-4.15.0/drivers/net/ethernet/intel/e100.c:1979

static int e100_rx_indicate(...) {
    ...
    if (...) {
        ...
    } else if (...) {
        ...
    } else {
        ...
        netif_receive_skb(...);
        ...
    }
    ...
}

e100_rx_indicate函数通过netif_receive_skb函数，将从设备中读到的数据交给上层协议栈处理。

/usr/src/linux-source-4.15.0/net/core/dev.c:4657

int netif_receive_skb(...) {
    ...
    return netif_receive_skb_internal(...);
}

netif_receive_skb函数调用netif_receive_skb_internal函数。

/usr/src/linux-source-4.15.0/net/core/dev.c:4602

static int netif_receive_skb_internal(...) {
    ...
    ret = __netif_receive_skb(...);
    ...
}

netif_receive_skb_internal函数调用__netif_receive_skb函数。

/usr/src/linux-source-4.15.0/net/core/dev.c:4544

static int __netif_receive_skb(...) {
    ...
    if (...) {
        ...
        ret = __netif_receive_skb_core(...);
        ...
    }
    else
        ret = __netif_receive_skb_core(...);
    ...
}

__netif_receive_skb函数调用__netif_receive_skb_core函数。

/usr/src/linux-source-4.15.0/net/core/dev.c:4368

static int __netif_receive_skb_core(...) {
    ...
    list_for_each_entry_rcu(..., &ptype_all, ...) {
        ...
    }
    list_for_each_entry_rcu(..., &skb->dev->ptype_all,...) {
        ...
    }
    ...
}

__netif_receive_skb_core函数先遍历ptype_all链表，将数据包传给系统中注册的相关原始套接字，然后遍历skb->dev->ptype_all链表，将数据包传给与其协议类型相应的上层协议处理，如将IP包传给IP层处理。至此，数据链路层的处理宣告结束。

为了抵御TCP SYN攻击，可以在__netif_receive_skb_core函数中添加必要代码，在数据包进入上层协议栈处理之前，对其进行拦截，若确系TCP SYN攻击包，则通知协议栈予以丢弃，以此达到加固系统内核的目的。如下所示：

/usr/src/linux-source-4.15.0/net/core/dev.c:4368

/******************************************
 * Added by MW for Anti-DoS at 26 Apr 2019
 */
int (*pfn_anti_dos_hook)(struct sk_buff* skb) = NULL;
EXPORT_SYMBOL(pfn_anti_dos_hook);
/*
 * End of Addition
 *****************************************/

static int __netif_receive_skb_core(struct sk_buff* skb, ...) {
    ...
    skb_reset_network_header(skb);
    if (!skb_transport_header_was_set(skb))
        skb_reset_transport_header(skb);
    skb_reset_mac_len(skb);

    /******************************************
     * Added by MW for Anti-DoS at 26 Apr 2019
     */
    if (pfn_anti_dos_hook && pfn_anti_dos_hook(skb))
        goto drop;
    /*
     * End of addition
     *****************************************/

    pt_prev = NULL;

another_round:
    skb->skb_iif = skb->dev->ifindex;

    __this_cpu_inc(softnet_data.processed);
    ...
}

4. 编译内核源码

1) 安装工具

$ sudo apt-get install build-essential
$ sudo apt-get install libncurses-dev
$ sudo apt-get install kernel-package
$ sudo apt-get install initramfs-tools
$ sudo apt-get install module-init-tools
$ sudo apt-get install libelf-dev

2) 准备环境

$ cd /usr/src/linux-source-4.15.0
$ sudo cp /boot/config-`uname -r` .config
$ sudo make mrproper
$ sudo make clean
$ sudo make menuconfig

3) 编译安装

$ sudo make -j8
$ sudo make install
$ sudo make modules
$ sudo make modules_install

12.2　实训案例

12.2.1　提升系统内核抵御TCP SYN攻击的能力

通过编程增强Linux系统内核对TCP SYN攻击的抵抗能力。

程序在不影响已存在的TCP连接的前提下，过滤TCP SYN数据包。

SYN攻击是以大量消耗目标系统资源的方式实现攻击的，因此要求程序实现上述功能占用尽量少的系统资源。

不需要实现交互界面等，只需实现基本的数据包过滤功能即可。

12.2.2　程序清单

1. 拒绝服务攻击防御模块

// antidos.c
// 拒绝服务攻击防御模块

#include <linux/skbuff.h>
#include </usr/src/linux-source-4.15.0/net/bridge/br_private.h>
#include <linux/kernel.h>
#include <linux/module.h>

#define DROP_PACKET 1 // 丢弃
#define PASS_PACKET 0 // 放行

// 拒绝服务攻击防御钩子指针
extern int (*pfn_anti_dos_hook)(struct sk_buff* skb);

// 拒绝服务攻击防御钩子
static int anti_dos_hook(struct sk_buff* skb) {
    struct ethhdr          * eh;   // 以太网包头
    struct net_bridge_port * nbp;  // 网桥端口
    struct iphdr           * iph;  // IP包头
    struct tcphdr          * tcph; // TCP包头

    // 无法共享套接字缓存
    if (! (skb = skb_share_check(skb, GFP_ATOMIC)))
        return PASS_PACKET; // 放行

    // 目的地址非接收地址，即转发包
    eh = eth_hdr(skb);
    nbp = br_port_get_rcu(skb->dev);
    if (memcmp(eh->h_dest, nbp ? nbp->dev->dev_addr :
        skb->dev->dev_addr, ETH_ALEN))
        return PASS_PACKET; // 放行

    // 非IP包
    if (eh->h_proto != __constant_htons(ETH_P_IP))
        return PASS_PACKET; // 放行

    // 非法IP包头
    if (! pskb_may_pull(skb, sizeof(struct iphdr)))
        return PASS_PACKET; // 放行

    // 非法IP包头或非IPv4协议
    iph = ip_hdr(skb);
    if (iph->ihl < sizeof(struct iphdr) / 4 || iph->version != 4)
        return PASS_PACKET; // 放行

    // 非法IP包头
    if (! pskb_may_pull(skb, iph->ihl * 4))
        return PASS_PACKET; // 放行

    // 非TCP包
    if(iph->protocol != IPPROTO_TCP)
        return PASS_PACKET; // 放行

    // 非法TCP包头
    if (! pskb_may_pull(skb, iph->ihl * 4 + sizeof(struct tcphdr)))
        return PASS_PACKET; // 放行

    // 非法TCP包头
    tcph = tcp_hdr(skb);
    if (tcph->doff < sizeof(struct tcphdr) / 4)
        return PASS_PACKET; // 放行

    // 非法TCP包头
    if (! pskb_may_pull(skb, iph->ihl * 4 + tcph->doff * 4))
        return PASS_PACKET; // 放行

    // 非SYN包
    if (! tcph->syn)
        return PASS_PACKET; // 放行

    printk("Drop suspected DoS packet\n");
    return DROP_PACKET; // 丢弃
}

// 加载模块
int init_module(void) {
    // sudo cat /proc/kmsg
    printk("Initializing module ...\n");

    pfn_anti_dos_hook = anti_dos_hook;

    return 0;
}

// 卸载模块
void cleanup_module(void) {
    pfn_anti_dos_hook = NULL;

    printk("Exiting module OK!\n");
}

MODULE_LICENSE("GPL");

2. 拒绝服务攻击防御模块构建脚本

# Makefile
# 拒绝服务攻击防御模块构建脚本

obj-m  := antidos.o
KBUILD := /lib/modules/$(shell uname -r)/build
CURDIR := $(shell pwd)

default:
    make -C $(KBUILD) SUBDIRS=$(CURDIR) modules

clean:
    make -C $(KBUILD) SUBDIRS=$(CURDIR) clean

12.3　扩展提高

12.3.1　其它拒绝服务攻击

随着技术的不断进步，攻击手段和防御策略在相互斗争中不断地发展进步。目前阶段的拒绝服务攻击存在以下几个发展趋势：

1. IP碎片攻击

网络协议栈的数据链路层对所能传输的数据包大小设定了上限，即最大传输单元(Maximum Transfer Unit, MTU)。以太网的最大传输单元是1500字节。该值可通过如下命令查看：

$ netstat -i

Kernel Interface table
Iface MTU  Met RX-OK  RX-ERR RX-DRP RX-OVR TX-OK TX-ERR TX-DRP TX-OVR Flg
ens33 1500 0   161818 0      0      0      77637 0      0      0      BMRU

以UDP传输为例，一个最大以太网包的结构如下图所示：

                  |<----------------1500----------------->|
+-----------------+-----------+------------+--------------+
| Ethernet Header | IP Header | UDP Header | Payload Data |
+-----------------+-----------+------------+--------------+
                  |<---20---->|<----8----->|<----1472---->|

如果所要发送的有效载荷多于1472个字节，IP层就会对其分片，以使每个以太网包都满足最大传输单元的限制。

IP包头的结构如下所示：

#include <netinet/ip.h>

struct iphdr {
    unsigned int version:4; // 版本(4位)
    unsigned int ihl:4;     // 包头长度(4位)
    uint8_t      tos;       // 服务类型
    uint16_t     tot_len;   // 包长度
    uint16_t     id;        // 标识符
    uint16_t     frag_off;  // 标志(3位)和偏移(13位)
    uint8_t      ttl;       // 生存时间
    uint8_t      protocol;  // 上层协议
    uint16_t     check;     // 校验和
    uint32_t     saddr;     // 源IP地址
    uint32_t     daddr;     // 目的IP地址
};

其中，frag_off字段由3位标志和13位偏移组成，如下图所示：

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|A|B|C|            D            |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|<-3->|<----------13----------->|

A：保留未用
B：0允许分片，1不能分片
C：0最后一片，1后面还有
D：该分片在完整有效载荷中的偏移位置

接收方的IP层根据每个IP包头部frag_off字段中的C和D，将若干分片重新组合成完整的有效载荷。

攻击者可利用IP分片协议的实现缺陷对服务器发起拒绝服务攻击。

1) Tear Drop攻击

正常IP分片的偏移位置，即IP包头frag_off字段中的D，应该保证所有分片无间隔、无重叠、无包含地连续分布。

某些操作系统存在漏洞，一旦某个IP分片的偏移位置发生错误，使其刚好被包含于另一个IP分片的内部，就会发生崩溃或重启现象。

另一些操作系统遇到这种情况虽然不会崩溃或重启，但也会在试图根据错误的偏移位置重组分片的过程中浪费大量时间。

攻击者利用了这一点，故意向服务器发送大量伪造的，包含错误偏移位置的IP分片，导致服务器系统异常甚至崩溃，无法继续提供服务，这就是Tear Drop攻击。

2) Pingo Death攻击

Pingo Death攻击是利用ICMP协议的一种碎片攻击。某些操作系统在进行ICMP分片重组时预分配的缓冲区大小为65535字节，攻击者通过分片重组发送一个长度超过65535字节的ICMP应答请求数据包，目的主机在重组分片时会因为缓冲区溢出而崩溃或挂起。

2. 分布式反弹拒绝服务攻击(Distributed Reflection Denial of Servic, DRDOS)

互联网上有很多服务器，比如DNS服务器、Web服务器、FTP服务器等，它们在收到一个来自客户端的请求报文后，通常会产生一个特定的响应报文返回给客户端，这样的服务器被称为反弹服务器。

攻击者向由多台反弹服务器组成的反弹服务集群发送大量请求报文，但这些请求报文的源IP地址均被伪造为被攻击主机的IP地址。反弹服务器上开放的服务通常为匿名服务，或者存在身份认证漏洞，因此不会对请求报文的数据源做太多验证，就直接向其源IP地址，即被攻击主机，发送响应报文。只要反弹服务集群的规模足够大，数量庞大而时间集中的响应报文足以令被攻击主机陷入瘫痪状态。这就是基于反弹技术的拒绝服务攻击。如下图所示：

graph LR attacker((Attacker)) subgraph Server Cluster master_1(Master) master_2(Master) master_3(Master) dns_1(DNS) dns_2(DNS) web_1(Web) web_2(Web) ftp_1(FTP) ftp_2(FTP) master_1--Request-->dns_1 master_1--Request-->dns_2 master_2--Request-->web_1 master_2--Request-->web_2 master_3--Request-->ftp_1 master_3--Request-->ftp_2 end attacktarget{Attacktarget} attacker--Attack Order-->master_1 attacker--Attack Order-->master_2 attacker--Attack Order-->master_3 dns_1--Response-->attacktarget dns_2--Response-->attacktarget web_1--Response-->attacktarget web_2--Response-->attacktarget ftp_1--Response-->attacktarget ftp_2--Response-->attacktarget

3. 基于应用层协议漏洞的拒绝服务攻击

各种应用层协议的漏洞也可能被攻击者利用，发起拒绝服务攻击。

在IIS中，用户通过POST指令上传数据，系统先将用户上传的数据缓存在内存中，直到用户上传完毕后，再将这块内存中的数据保存到文件里，或交给特定的CGI程序处理。如果用户通过POST指令分多次上传非常大量的数据，其Content-Length字段的值可能高达0xFFFFFFFF字节。在传送完成之前，服务器上的缓存是不会被释放的。攻击者利用这一点，伪造POST传输大数据指令，致使IIS服务器分配大量数据缓冲区，直至内存耗尽，陷入瘫痪。

这种攻击的优势在于：

不留痕迹：IIS服务器只在为客户端提供的服务完成之后才会记录日志，而这种伪造大量数据上传的服务请求根本不可能完成，因此不会留下任何日志记录
难辨真伪：伪造的POST指令很难被防火墙发现，其Content-Length字段的值究竟是真是假无从得知
成本低廉：对攻击主机的性能要求不高，只需快速构造POST请求即可

TCP SYN Cookie是截至目前能够有效防御TCP SYN泛洪拒绝服务攻击的各种方法中最著名的一种。该方法最早由D. J. Bernstain和Eric Schenk发明。其在很多操作系统上都有实现，也包括Linux系统。

TCP SYN Cookie对建立TCP连接的三路握手过程进行了优化。

传统的TCP服务器，在收到客户端为建立连接发来的包头中带有SYN标志位的TCP数据包后，会立即为其创建连接资源。一旦遭遇TCP SYN泛洪攻击，这些为连接而创建的资源会急剧增加，以至拖垮整个系统。

应用了TCP SYN Cookie技术的TCP服务器，在收到客户端为建立连接发来的包头中带有SYN标志位的TCP数据包后，并不立即为其创建连接资源，而是直接返回包头中带有SYN和ACK两个标志位的TCP数据包。该数据包的发送序列号是由SYN包的源IP地址、源端口号、目的IP地址和目的端口号组合在一起的哈希摘要，即Cookie。在收到客户端返回的包头中带有ACK标志位的TCP数据包后，服务器再将该数据包的接收序列号减一得到Cookie，结合其源IP地址、源端口号、目的IP地址和目的端口号，验证其合法性。只有通过合法性验证的客户端才能得到服务器为其创建的连接资源。如下图所示：

sequenceDiagram participant Client participant Server Client->>Server: SYN(N) Server->>Client: SYN+ACK(N+1,COOKIE) Client->>Server: ACK(COOKIE+1)

/usr/src/linux-source-4.15.0/net/ipv4/tcp_input.c:6252

int tcp_conn_request(...) {
    ...
    if (want_cookie) {
        isn = cookie_init_sequence(...);
        ...
    }
    ...
    if (fastopen_sk) {
        af_ops->send_synack(...);
        ...
    } else {
        ...
        if (!want_cookie)
            inet_csk_reqsk_queue_hash_add(..., tcp_timeout_init(...));
        af_ops->send_synack(...);
        ...
    }
    ...
}

对于应用了TCP SYN Cookie技术的TCP服务器，其want_cookie的值为1，在收到客户端为建立连接发来的包头中带有SYN标志位的TCP数据包后：

调用cookie_init_sequence函数，根据该数据包的源IP地址、源端口号、目的IP地址和目的端口号计算哈希摘要，作为响应数据包的发送序列号，即Cookie
因为want_cookie的值为1，所以不会调用inet_csk_reqsk_queue_hash_add函数，也就不会将半连接套接字加入哈希队列并开启定时器

当服务器收到客户端发来的包头中带有ACK标志位的TCP数据包时，服务器的tcp_v4_rcv函数再次被调用，该函数调用tcp_v4_do_rcv函数。

/usr/src/linux-source-4.15.0/net/ipv4/tcp_ipv4.c:1453

int tcp_v4_do_rcv(...) {
    ...
    if (sk->sk_state == TCP_LISTEN) {
        struct sock* nsk = tcp_v4_cookie_check(...);
        ...
        if (nsk != sk) {
            if (tcp_child_process(...)) {
                ...
            }
            ...
        }
    }
    ...
}

tcp_v4_do_rcv函数调用tcp_v4_cookie_check函数。

/usr/src/linux-source-4.15.0/net/ipv4/tcp_ipv4.c:1434

static struct sock* tcp_v4_cookie_check(...) {
    ...
    if (!th->syn)
        sk = cookie_v4_check(...);
    ...
}

tcp_v4_cookie_check函数调用cookie_v4_check函数。

/usr/src/linux-source-4.15.0/net/ipv4/syncookies.c:283

struct sock* cookie_v4_check(...) {
    ...
    const struct tcphdr* th = tcp_hdr(skb);
    __u32 cookie = ntohl(th->ack_seq) - 1;
    ...
    mss = __cookie_v4_check(ip_hdr(skb), th, cookie);
    if (mss == 0) {
        ...
        goto out;
    }
    ...
    ret = tcp_get_cookie_sock(...);
    ...
}

cookie_v4_check函数先通过__cookie_v4_check函数，根据IP包头(ip_hdr(skb))中的源IP地址、目的IP地址和TCP包头(th)中的源端口号、目的端口号，计算其哈希摘要，与接收序列号减一(ntohl(th->ack_seq) - 1)，即Cookie (cookie)，做相等性比较，二者一致则通过验证，然后通过tcp_get_cookie_sock函数为通过验证的客户端创建连接资源，该函数返回用于后续通信的套接字。

基于TCP SYN Cookie原理的防火墙如下图所示：

sequenceDiagram participant Client participant Firewall participant Server Client->>Firewall: SYN(N) Firewall->>Client: SYN+ACK(N+1,COOKIE1) Client->>Firewall: ACK(COOKIE1+1) Firewall->>Server: SYN(N) Server->>Firewall: SYN_ACK(N+1,COOKIE2) Firewall->>Server: ACK(COOKIE2+1)

外网客户端和内网服务器建立TCP连接的过程如下：

当防火墙收到来自外网客户端的SYN数据包时，并不直接向内网服务器转发，而是缓存在本地，同时按照前述TCP SYN Cookie原理向外网客户端返回带有Cookie的SYN+ACK数据包，该包的源IP地址被改写为内网服务器的IP地址
外网客户端收到该SYN+ACK数据包后，发送ACK数据包，并认为与服务器的TCP连接已建立起来
防火墙依据Cookie验证该ACK数据包的合法性，若通过验证则将之前缓存在本地的，来自外网客户端的SYN数据包发送给内网服务器
内网服务器对防火墙响应以SYN+ACK数据包，该数据包中同样带有Cookie
防火墙伪造一个来自外网客户端的ACK数据包发送给内网服务器
至此，外网客户端和内网服务器的TCP连接建立完毕，双方开始数据传输

需要注意的是，防火墙为外网客户端生成的发送序列号(COOKIE1)与内网服务器为防火墙生成的发送序列号(COOKIE2)未必是一样的，因此防火墙在每次转发外网客户端和内网服务器之间的数据包时需要对其中的序列号进行修改，以确保TCP通信正常。

达内集团◇C++教研部◇闵卫

第12单元 内核加固

12.1 知识讲解

12.1.1 拒绝服务攻击

12.1.2 僵尸网络

12.1.3 内核强化

1. 获取内核源码

2. 分析内核源码

1) 正常建立TCP连接

2) 遭受TCP SYN攻击

3. 修改内核源码

4. 编译内核源码

1) 安装工具

2) 准备环境

3) 编译安装

12.2 实训案例

12.2.1 提升系统内核抵御TCP SYN攻击的能力

12.2.2 程序清单

1. 拒绝服务攻击防御模块

2. 拒绝服务攻击防御模块构建脚本

12.3 扩展提高

12.3.1 其它拒绝服务攻击

1. IP碎片攻击

1) Tear Drop攻击

2) Pingo Death攻击

2. 分布式反弹拒绝服务攻击(Distributed Reflection Denial of Servic, DRDOS)

3. 基于应用层协议漏洞的拒绝服务攻击

12.3.2 基于TCP SYN Cookie的防御策略

1. TCP SYN Cookie原理

2. TCP SYN Cookie防火墙

第12单元　内核加固

12.1　知识讲解

12.1.1　拒绝服务攻击

12.1.2　僵尸网络

12.1.3　内核强化

12.2　实训案例

12.2.1　提升系统内核抵御TCP SYN攻击的能力

12.2.2　程序清单

12.3　扩展提高

12.3.1　其它拒绝服务攻击

12.3.2　基于TCP SYN Cookie的防御策略