如何使用 tcpdump 抓包?如何用 tcpdump 和 wireshark 分析網絡流量?

本文將展示如何使用 tcpdump 抓包,以及如何用 tcpdump 和 wireshark 分析網絡流量。文中的例子比較簡單,適合作爲入門參考。

1 基礎環境準備

爲方便大家跟着上手練習,本文將搭建一個容器環境。

1.1 Pull Docker 鏡像

$ sudo docker pull alpine:3.8

1.2 運行容器

$ sudo docker run -d --name ctn-1 alpine:3.8 sleep 3600d
$ sudo docker ps
CONTAINER ID    IMAGE        COMMAND         CREATED        STATUS          PORTS  NAMES
233bc36bde4b    alpine:3.8   "sleep 3600d"   1 minutes ago  Up 14 minutes           ctn-1

進入容器:

$ sudo docker exec -it ctn-1 sh

查看容器網絡信息:

/ # ifconfig
eth0      Link encap:Ethernet  HWaddr 02:42:AC:11:00:09
          inet addr:172.17.0.9  Bcast:0.0.0.0  Mask:255.255.0.0

1.3 安裝 tcpdump

/ # apk update
/ # apk add tcpdump

2 HTTP/TCP 抓包

接下來我們用 wget 獲取一個網站的首頁文件(index.html),同時 tcpdump 抓包,對抓 到的網絡流量進行分析。

2.1 HTTP 請求:下載測試頁面

example.com 是一個測試網站,wget 是一個 linux 命令行工 具,可以下載網絡文件。

如下命令可以下載一個 example.com 網站的首頁文件 index.html:

/ # wget http://example.com
Connecting to example.com (93.184.216.34:80)
index.html           100% |*****************************|  1270   0:00:00 ETA

雖然這看起來極其簡單,但背後卻涵蓋了很多複雜的過程,例如:

  1. 域名查找:通過訪問 DNS 服務查找 example.com 服務器對應的 IP 地址

  2. TCP 連接參數初始化:臨時端口、初始序列號的選擇等等

  3. 客戶端(容器)通過 TCP 三次握手協議和服務器 IP 建立 TCP 連接

  4. 客戶端發起 HTTP GET 請求

  5. 服務器返回 HTTP 響應,包含頁面數據傳輸

  6. 如果頁面超過一個 MTU,會分爲多個 packet 進行傳輸(後面會看到,確實超過 MTU 了)

  7. TCP 斷開連接的四次揮手

2.2 抓包:打到標準輸出

用下面的 tcpdump 命令抓包,另一窗口執行 wget http://example.com,能看到如下類 似的輸出。爲了方便後面的討論,這裏將一些字段去掉了,並做了適當的對齊:

/ # tcpdump -n -S -i eth0 host example.com
1  02:52:44.513700 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [S] , seq 3310420140,                            length 0
2  02:52:44.692890 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [S.], seq 1353235534,            ack 3310420141, length 0
3  02:52:44.692953 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                            ack 1353235535, length 0
4  02:52:44.693009 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [P.], seq 3310420141:3310420215, ack 1353235535, length 74: HTTP: GET / HTTP/1.1
5  02:52:44.872266 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [.] ,                            ack 3310420215, length 0
6  02:52:44.873342 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [.] , seq 1353235535:1353236983, ack 3310420215, length 1448: HTTP: HTTP/1.1 200 OK
7  02:52:44.873405 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                            ack 1353236983, length 0
8  02:52:44.874533 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [P.], seq 1353236983:1353237162, ack 3310420215, length 179: HTTP
9  02:52:44.874560 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                            ack 1353237162, length 0
10 02:52:44.874705 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [F.], seq 3310420215,            ack 1353237162, length 0
11 02:52:45.053732 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [.] ,                            ack 3310420216, length 0
12 02:52:45.607825 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [F.], seq 1353237162,            ack 3310420216, length 0
13 02:52:45.607869 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                            ack 1353237163, length 0

參數說明:

更多 tcpdump 的常用命令,可以參考 tcpdump: An Incomplete Guide。

2.3 抓包:存文件

-w 命令可以將抓到的包寫到文件,注意這和用重定向方式將輸出寫到文件是不同的。後者寫的只是標準輸出打印的 LOG,而 -w 寫的是原始包。

/ # tcpdump -i eth0 host example.com -w example.pcap
^C
13 packets captured
13 packets received by filter
0 packets dropped by kernel

生成的 pcap 文件可以用 tcpdump 或者 wireshark 之類的網絡流量分析工具打開。

3 流量分析:tcpdump

如果不指定輸出的話,tcpdump 會直接將信息打到標準輸出,就是我們上面看到的那樣。從這些輸出裏,我們看到很多信息。

3.1 每列說明

第 1 列是爲了討論方便而加的行號,實際的 tcpdump 輸出並沒有這一列。接下來將用 # 號加數字表示第幾個包,例如 #3 表示第 3 個包。

接下來依次爲:

3.2 三次握手(1~3)

wget 是基於 HTTP 協議,因此它在下載文件之前,必定要和服務端建立一個連接。

而 TCP 建立連接的過程就是著名的三次握手 [4]:

  1. client -> server: SYN

  2. server -> client: SYN+ACK

  3. client -> server: ACK

我們可以看到,這剛好對應於前三個包:

1  02:52:44.513700 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [S] , seq 3310420140,                 length 0
2  02:52:44.692890 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [S.], seq 1353235534, ack 3310420141, length 0
3  02:52:44.692953 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                 ack 1353235535, length 0

第一次握手: SYN

#1 包含以下信息:

  1. 02:52:44.513700 時刻,客戶端主動向 server(93.184.216.34)發起一個 SYN 請求,請求建立連接

  2. 客戶端請求的服務端端口是 80(HTTP 服務默認 80 端口),客戶端使用的是臨時端口(大於 1024)41038

  3. #1 序列號是 3310420140,這是客戶端的初始序列號(客戶端和服務端分別維護自己的序列號,兩者沒有關係;另外,初始序列號是系統選擇的,一般不是 0)

  4. #1 length 爲 0,因爲 SYN 包不帶 TCP payload,所有信息都在 TCP header

第二次握手: SYN+ACK

#2 的 ack 是 3310420140,等於 #1 的 seq 加 1,這就說明,#2 是 #1 的應答包。

這個應答包的特點:

  1. TCP flags 爲 S.,即 SYN+ACK

  2. length 也是 0,說明沒有 payload

  3. seq 爲 1353235534,這是服務端的初始序列號

  4. 到達 eth0 的時間爲 02:52:44.692890,說明時間過了 18ms

第三次握手: ACK

同理,#3 的 ack 等於 #2 的 seq 加 1,說明 #3 是 #2 的應答包。

這個包的特點:

  1. TCP flags 爲 .,即 ACK

  2. 長度爲 0,說明沒有 TCP payload

至此,三次握手完成。

3.3 正常數據傳輸

三次握手完成後,client 和 server 開始 HTTP 通信,客戶端通過 HTTP GET 方法下載 index.html。

4  02:52:44.693009 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [P.], seq 3310420141:3310420215, ack 1353235535, length 74: HTTP: GET / HTTP/1.1
5  02:52:44.872266 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [.] ,                            ack 3310420215, length 0
6  02:52:44.873342 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [.] , seq 1353235535:1353236983, ack 3310420215, length 1448: HTTP: HTTP/1.1 200 OK
7  02:52:44.873405 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                            ack 1353236983, length 0
8  02:52:44.874533 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [P.], seq 1353236983:1353237162, ack 3310420215, length 179: HTTP
9  02:52:44.874560 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                            ack 1353237162, length 0

這裏可以看到:

  1. #4: client 向 server 發起 HTTP GET 請求,請求路徑爲根路徑(/),這個 packet 長度爲 74 字節

  2. #5: 發送了 ACK 包,對 #4 進行確認

  3. #6: 發送了 1448 字節的數據給 client

  4. #7: client 對 server 的 #6 進行應答

  5. #8: server 向 client 端繼續發送 179 字節數據

  6. #9: client 對 server 的 #8 進行應答

3.4 四次揮手

最後是四次揮手 [5]:

  1. client -> server: FIN (我們看到的是 FIN+ACK,這是因爲這個 FIN 包除了正常的關閉連接功能之外,還被用於應答 client 發過來的前一個包)

  2. server -> client: ACK

  3. server -> client: FIN+ACK

  4. client -> server: ACK

10 02:52:44.874705 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [F.], seq 3310420215, ack 1353237162, length 0
11 02:52:45.053732 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [.] ,                 ack 3310420216, length 0
12 02:52:45.607825 IP 93.184.216.34.80 > 172.17.0.9.41038: Flags [F.], seq 1353237162, ack 3310420216, length 0
13 02:52:45.607869 IP 172.17.0.9.41038 > 93.184.216.34.80: Flags [.] ,                 ack 1353237163, length 0

4 流量分析:wireshark

tcpdump 可以指定 -r 讀取 pcap 文件,並以指定的格式輸出包的信息,最後輸出的內容 和上面看到的類似。我們上面的流量非常簡單,所以看 tcpdump 的輸出就夠了。

對於複雜的 pcap,例如,其中包含了上百個 IP 地址、上千個端口、上萬個連接的 pcap, 通過 tcpdump 看輸出可能就比較低效了。

這時,wireshark 這樣帶圖形用戶界面,且功能強大的網 絡流分析工具就派上了用場。

wireshark 支持強大的過濾功能,支持按 IP、端口、協議、連接、TCP flag 以及它們的各 種組合進行過濾,然後進行分析,大大節省網絡排障的時間。

wireshark 官方維護了一個 sample pcap 列表 ,我們拿 iperf-mptcp-0-0.pcap 作爲例子來展示如何使用 wireshark。

4.1 追蹤 TCP 流

下載後雙擊就可以用 wireshark 打開。看到有重傳(TCP Retransmition)的包:

在重傳的包上,右鍵 -> Follow -> TCP Stream,會過濾出只屬於這個連接的包:

我們看到,這個連接只有 3 個包:

  1. #1 在 08:00:05.125 發送出去,請求建立連接

  2. 大約 1s 後,客戶端仍然沒有收到服務端的 ACK 包,觸發客戶端 TCP 超時重傳

  3. 又過了大約 2s,仍然沒有收到 ACK 包,再次觸發超時重傳

  4. 這裏其實還可以看出 TCP 重傳的機制:指數後退,比如第一次等待 1s,第二次等 待 2s,第三次等待 4s,第四次 8s

因此,從這個抓包文件看,這次連接沒有建立起來,而直接原因就是 client 沒有收到 server 的應答包。要跟進這個問題,就需要在 server 端一起抓包,看應答包是否有發出來 。本文不對此展開。

4.2 過濾流

上面的截圖我們看到 wireshark 裏有 tcp.stream eq 1,這其實就是其強大的過濾表達式。

我們可以直接手寫表達式,然後回車,符合條件的包就會顯示出來。而且,在編輯表達式的 時候,wireshark 有自動提示,還是比較方便的。這些表達式和 tcpdump 的 filter 表達 式很類似,如果熟悉 tcpdump,那這裏不會有太大困難。

下面舉一些例子:

  1. ip.addr == 192.168.1.1 過濾 SRC IP 或 DST IP 是 192.168.1.1 的包

  2. ip.src_host == 192.168.1.1 and ip.dst_host == 192.168.1.2 過濾 SRC IP 是 192.168.1.1,並且 DST IP 是 192.168.1.2 的包

  3. tcp.port == 80 源端口或目的端口是 80 的包

  4. tcp.flags.reset == 1 過濾 TCP RST 包。先找到 RST 包,然後右鍵 Follow -> TCP Stream 是常用的排障方式

  5. tcp.analysis.retransmission 過濾所有的重傳包

4.3 導出符合條件的包

有時 pcap 文件太大,導致 wireshark 非常慢,而大部分數據包可能是不需要的。在這種情況 下,可以先用過濾條件篩選出感興趣的包,然後 File -> Export Specified Packets ... ,彈出的對話框裏,可以選擇當前顯示的包,或者某個指定區間的包另存爲新 pcap。

然後就可以關閉原來的 pcap,打開新的 pcap 進行分析。

5 總結

tcpdump 和 wireshark 功能非常強大,組合起來更是網絡排障的首選利器。這裏介紹的內容只是九牛一毛,更多的時候,你需要 tcpdump+wireshark+google。

來源:http://arthurchiao.art/blog/tcpdump-practice-zh

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/hosHr1nEgM0V9FXnuaVNtg