TCP 通信過程詳解以及 tcp 長連接和短連接

  1. TCP 連接

當網絡通信時採用 TCP 協議時,在真正的讀寫操作之前,server 與 client 之間必須建立一個連接,當讀寫操作完成後,雙方不再需要這個連接 時它們可以釋放這個連接,連接的建立是需要三次握手的,而釋放則需要 4 次揮手,所以說每個連接的建立都是需要資源消耗和時間消耗的

經典的三次握手示意圖:

經典的四次揮手圖:

tcp 的十種狀態圖:

注意:

當一端收到一個 FIN,內核讓 read 返回 0 來通知應用層另一端已經終止了向本端的數據傳送;發送 FIN 通常是應用層對 socket 進行關閉的結果。

tcp 的 2MSL 問題

  1. TCP 短連接

我們模擬一下 TCP 短連接的情況,client 向 server 發起連接請求,server 接到請求,然後雙方建立連接。client 向 server 發送消息,server 迴應 client,然後一次讀寫就完成了,這時候雙方任何一個都可以發起 close 操作,不過一般都是 client 先發起 close 操作。爲什麼呢,一般的 server 不會回覆完 client 後立即關閉連接的,當然不排除有特殊的情況。從上面的描述看,短連接一般只會在 client/server 間傳遞一次讀寫操作

短連接的優點是:管理起來比較簡單,存在的連接都是有用的連接,不需要額外的控制手段

3.TCP 長連接

接下來我們再模擬一下長連接的情況,client 向 server 發起連接,server 接受 client 連接,雙方建立連接。Client 與 server 完成一次讀寫之後,它們之間的連接並不會主動關閉,後續的讀寫操作會繼續使用這個連接。

首先說一下 TCP/IP 詳解上講到的 TCP 保活功能,保活功能主要爲服務器應用提供,服務器應用希望知道客戶主機是否崩潰,從而可以代表客戶使用資 源。如果客戶已經消失,使得服務器上保留一個半開放的連接,而服務器又在等待來自客戶端的數據,則服務器將應遠等待客戶端的數據,保活功能就是試圖在服務 器端檢測到這種半開放的連接。

如果一個給定的連接在兩小時內沒有任何的動作,則服務器就向客戶發一個探測報文段,客戶主機必須處於以下 4 個狀態之一:

客戶主機依然正常運行,並從服務器可達。客戶的 TCP 響應正常,而服務器也知道對方是正常的,服務器在兩小時後將保活定時器復位。客戶主機已經崩潰,並且關閉或者正在重新啓動。在任何一種情況下,客戶的 TCP 都沒有響應。服務端將不能收到對探測的響應,並在 75 秒後超時。服務器總共發送 10 個這樣的探測 ,每個間隔 75 秒。如果服務器沒有收到一個響應,它就認爲客戶主機已經關閉並終止連接。客戶主機崩潰並已經重新啓動。服務器將收到一個對其保活探測的響應,這個響應是一個復位,使得服務器終止這個連接。客戶機正常運行,但是服務器不可達,這種情況與 2 類似,TCP 能發現的就是沒有收到探查的響應。從上面可以看出,TCP 保活功能主要爲探測長連接的存活狀況,不過這裏存在一個問題,存活功能的探測週期太長,還有就是它只是探測 TCP 連接的存活,屬於比較斯文的做法,遇到惡意的連接時,保活功能就不夠使了。

在長連接的應用場景下,client 端一般不會主動關閉它們之間的連接,Client 與 server 之間的連接如果一直不關閉的話,會存在一個問 題,隨着客戶端連接越來越多,server 早晚有扛不住的時候,這時候 server 端需要採取一些策略,如關閉一些長時間沒有讀寫事件發生的連接,這樣可 以避免一些惡意連接導致 server 端服務受損;如果條件再允許就可以以客戶端機器爲顆粒度,限制每個客戶端的最大長連接數,這樣可以完全避免某個蛋疼的 客戶端連累後端服務。

長連接和短連接的產生在於 client 和 server 採取的關閉策略,具體的應用場景採用具體的策略,沒有十全十美的選擇,只有合適的選擇。

什麼是 “長連接” 和“短連接”?

解釋 1

所謂長連接指建立 SOCKET 連接後不管是否使用都保持連接,但安全性較差;

所謂短連接指建立 SOCKET 連接後發送後接收完數據後馬上斷開連接,一般銀行都使用短連接

解釋 2

長連接就是指在基於 tcp 的通訊中,一直保持連接,不管當前是否發送或者接收數據。

而短連接就是隻有在有數據傳輸的時候才進行連接,客戶-服務器通信 / 傳輸數據完畢就關閉連接。

解釋 3

長連接和短連接這個概念好像只有移動的 CMPP 協議中提到了,其他的地方沒有看到過。通信方式 各網元之間共有兩種連接方式:長連接和短連接。所謂長連接,指在一個 TCP 連接上可以連續發送多個數據包,在 TCP 連接保持期間,如果沒有數據包發送,需要雙方發檢測包以維持此連接。短連接是指通信雙方有數據交互時,就建立一個 TCP 連接,數據發送完成後,則斷開此 TCP 連接,即每次 TCP 連接只完成一對 CMPP 消息的發送。現階段,要求 ISMG 之間必須採用長連接的通信方式,建議 SP 與 ISMG 之間採用長連接的通信方式。

解釋 4

短連接:比如 http 的,只是連接、請求、關閉,過程時間較短, 服務器若是一段時間內沒有收到請求即可關閉連接。長連接:有些服務需要長時間連接到服務器,比如 CMPP,一般需要自己做在線維持。

HTTP 協議之長、短連接

一、長連接與短連接:

長連接:client 方與 server 方先建立連接,連接建立後不斷開,然後再進行報文發送和接收。這種方式下由於通訊連接一直存在。此種方式常用於 P2P 通信。短連接:Client 方與 server 每進行一次報文收發交易時才進行通訊連接,交易完畢後立即斷開連接。此方式常用於一點對多點通訊。C/S 通信。二、長連接與短連接的操作過程:

短連接的操作步驟是:建立連接——數據傳輸——關閉連接… 建立連接——數據傳輸——關閉連接 長連接的操作步驟是:建立連接——數據傳輸…(保持連接)… 數據傳輸——關閉連接 三、長連接與短連接的使用時機:

長連接:長連接多用於操作頻繁,點對點的通訊,而且連接數不能太多的情況。每個 TCP 連接的建立都需要三次握手,每個 TCP 連接的斷開要四次握手。如果每次操作都要建立連接然後再操作的話處理速度會降低,所以每次操作後,下次操作時直接發送數據就可以了,不用再建立 TCP 連接。例如:數據庫的連接用長連接,如果用短連接頻繁的通信會造成 socket 錯誤,頻繁的 socket 創建也是對資源的浪費。短連接:web 網站的 http 服務一般都用短連接。因爲長連接對於服務器來說要耗費一定的資源。像 web 網站這麼頻繁的成千上萬甚至上億客戶端的連接用短連接更省一些資源。試想如果都用長連接,而且同時用成千上萬的用戶,每個用戶都佔有一個連接的話,可想而知服務器的壓力有多大。所以併發量大,但是每個用戶又不需頻繁操作的情況下需要短連接。總之:長連接和短連接的選擇要根據需求而定。四、發送接收方式:

1、異步:報文發送和接收是分開的,相互獨立,互不影響的。這種方式又分兩種情況:異步雙工:接收和發送在同一個程序中,有兩個不同的子進程分別負責發送和接送。異步單工:接送和發送使用兩個不同的程序來完成。2、同步:報文發送和接收是同步進行,即報文發送後等待接送返回報文。同步方式一般需要考慮超時問題,試想我們發送報文以後也不能無限等待啊,所以我們要設定一個等待 時候。超過等待時間發送方不再等待讀返回報文。直接通知超時返回。五、報文格式:

通信報文格式多樣性更多,相應地就必須設計對應的讀寫報文的接收和發送報文函數。阻塞與非阻塞方式

1、非阻塞方式:讀函數不停的進行讀動作,如果沒有報文接收到,等待一段時間後超時返回,這種情況一般需要指定超時時間。2、阻塞方式:如果沒有接收到報文,則讀函數一直處於等待狀態,知道報文到達。循環讀寫方式

1、一次直接讀寫報文:在一次接收或發送報文動作中一次性不加分別地全部讀取或全部發送報文字節。2、不指定長度循環讀寫:這一版發生在短連接進程中,受網絡路由等限制,一次較長的報文可能在網絡傳輸過程中被分解成很多個包,一次讀取可能不能全部讀完一次報文,這就需要循環讀取報文,直到讀完爲止。3、帶長度報文頭循環讀寫:這種情況一般在長連接中,由於在長連接中沒有條件能夠判斷循環讀寫什麼時候結束。必須要加長度報文頭。讀函數先是讀取報文頭的長度,再根據這個長度去讀報文,實際情況中,報頭碼制格式還經常不一樣,如果是非 ASCII 的報文頭,還必須轉換成 ASCII 常見的報文頭編制有:1、n 個字節的 ASCII 碼。2、n 個字節的 BCD 碼。3、n 個字節的網絡整型碼。以上是幾種比較典型的讀寫報文方式,可以與通信方式模板一起預先提供一些典型的 API 讀寫函數。當然在實際問題中,可能還必須編寫與對方報文格式配套的讀寫 API. 在實際情況中,往往需要把我們自己的系統與別人的系統進行連接, 有了以上模板與 API, 可以說連接任何方式的通信程序都不存在問題。

什麼時候用長連接,短連接?

長連接多用於操作頻繁,點對點的通訊,而且連接數不能太多情況,。每個 TCP 連接都需要三步握手,這需要時間,如果每個操作都是先連接,再操作的話那麼處理速度會降低很多,所以每個操作完後都不斷開,次處理時直接發送數據包就 OK 了,不用建立 TCP 連接。例如:數據庫的連接用長連接, 如果用短連接頻繁的通信會造成 socket 錯誤,而且頻繁的 socket 創建也是對資源的浪費。

而像 WEB 網站的 http 服務一般都用短鏈接,因爲長連接對於服務端來說會耗費一定的資源,而像 WEB 網站這麼頻繁的成千上萬甚至上億客戶端的 連接用短連接會更省一些資源,如果用長連接,而且同時有成千上萬的用戶,如果每個用戶都佔用一個連接的話,那可想而知吧。所以併發量大,但每個用戶無需頻 繁操作情況下需用短連好。總之,長連接和短連接的選擇要視情況而定。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/2sBr_03fDYh3N_A1CYFPag