一萬五千字詳解 HTTP 協議

本篇文章篇幅比較長,先來個思維導圖預覽一下。

**一、概述
**

1. 計算機網絡體系結構分層

2.TCP/IP 通信傳輸流

利用 TCP/IP 協議族進行網絡通信時,會通過分層順序與對方進行通信。發送端從應用層往下走,接收端則從鏈路層往上走。如下:

TCP/IP 通信傳輸流

如下圖所示:

HTTP 請求

在網絡體系結構中,包含了衆多的網絡協議,這篇文章主要圍繞 HTTP 協議(HTTP/1.1 版本)展開。

HTTP 協議(HyperText Transfer Protocol,超文本傳輸協議)是用於從 WWW 服務器傳輸超文本到本地瀏覽器的傳輸協議。它可以使瀏覽器更加高效,使網絡傳輸減少。它不僅保證計算機正確快速地傳輸超文本文檔,還確定傳輸文檔中的哪一部分,以及哪部分內容首先顯示 (如文本先於圖形) 等。
HTTP 是客戶端瀏覽器或其他程序與 Web 服務器之間的應用層通信協議。在 Internet 上的 Web 服務器上存放的都是超文本信息,客戶機需要通過 HTTP 協議傳輸所要訪問的超文本信息。HTTP 包含命令和傳輸信息,不僅可用於 Web 訪問,也可以用於其他因特網 / 內聯網應用系統之間的通信,從而實現各類應用資源超媒體訪問的集成。
我們在瀏覽器的地址欄裏輸入的網站地址叫做 URL (Uniform Resource Locator,統一資源定位符)。就像每家每戶都有一個門牌地址一樣,每個網頁也都有一個 Internet 地址。當你在瀏覽器的地址框中輸入一個 URL 或是單擊一個超級鏈接時,URL 就確定了要瀏覽的地址。瀏覽器通過超文本傳輸協議 (HTTP),將 Web 服務器上站點的網頁代碼提取出來,並翻譯成漂亮的網頁。

二、HTTP 工作過程

HTTP 通信機制是在一次完整的 HTTP 通信過程中,客戶端與服務器之間將完成下列 7 個步驟:

  1. 建立 TCP 連接
    在 HTTP 工作開始之前,客戶端首先要通過網絡與服務器建立連接,該連接是通過 TCP 來完成的,該協議與 IP 協議共同構建 Internet,即著名的 TCP/IP 協議族,因此 Internet 又被稱作是 TCP/IP 網絡。HTTP 是比 TCP 更高層次的應用層協議,根據規則,只有低層協議建立之後,才能進行高層協議的連接,因此,首先要建立 TCP 連接,一般 TCP 連接的端口號是 80;

  2. 客戶端向服務器發送請求命令
    一旦建立了 TCP 連接,客戶端就會向服務器發送請求命令;
    例如:GET/sample/hello.jsp HTTP/1.1

  3. 客戶端發送請求頭信息
    客戶端發送其請求命令之後,還要以頭信息的形式向服務器發送一些別的信息,之後客戶端發送了一空白行來通知服務器,它已經結束了該頭信息的發送;

  4. 服務器應答
    客戶端向服務器發出請求後,服務器會客戶端返回響應;
    例如:HTTP/1.1 200 OK
    響應的第一部分是協議的版本號和響應狀態碼

  5. 服務器返回響應頭信息
    正如客戶端會隨同請求發送關於自身的信息一樣,服務器也會隨同響應向用戶發送關於它自己的數據及被請求的文檔;

  6. 服務器向客戶端發送數據
    服務器向客戶端發送頭信息後,它會發送一個空白行來表示頭信息的發送到此爲結束,接着,它就以 Content-Type 響應頭信息所描述的格式發送用戶所請求的實際數據;

  7. 服務器關閉 TCP 連接
    一般情況下,一旦服務器向客戶端返回了請求數據,它就要關閉 TCP 連接,然後如果客戶端或者服務器在其頭信息加入了這行代碼 Connection:keep-alive ,TCP 連接在發送後將仍然保持打開狀態,於是,客戶端可以繼續通過相同的連接發送請求。保持連接節省了爲每個請求建立新連接所需的時間,還節約了網絡帶寬。

三、HTTP 協議基礎

1. 通過請求和響應的交換達成通信

應用 HTTP 協議時,必定是一端擔任客戶端角色,另一端擔任服務器端角色。僅從一條通信線路來說,服務器端和客服端的角色是確定的。HTTP 協議規定,請求從客戶端發出,最後服務器端響應該請求並返回。換句話說,肯定是先從客戶端開始建立通信的,服務器端在沒有接收到請求之前不會發送響應。

2.HTTP 是不保存狀態的協議

HTTP 是一種無狀態協議。協議自身不對請求和響應之間的通信狀態進行保存。也就是說在 HTTP 這個級別,協議對於發送過的請求或響應都不做持久化處理。這是爲了更快地處理大量事務,確保協議的可伸縮性,而特意把 HTTP 協議設計成如此簡單的。
可是隨着 Web 的不斷髮展,我們的很多業務都需要對通信狀態進行保存。於是我們引入了 Cookie 技術。有了 Cookie 再用 HTTP 協議通信,就可以管理狀態了。

Cookie 技術通過在請求和響應報文中寫入 Cookie 信息來控制客戶端的狀態。Cookie 會根據從服務器端發送的響應報文內的一個叫做 Set-Cookie 的首部字段信息,通知客戶端保存 Cookie。當下次客戶端再往該服務器發送請求時,客戶端會自動在請求報文中加入 Cookie 值後發送出去。服務器端發現客戶端發送過來的 Cookie 後,會去檢查究竟是從哪一個客戶端發來的連接請求,然後對比服務器上的記錄,最後得到之前的狀態信息。

  1. 請求 URI 定位資源

HTTP 協議使用 URI 定位互聯網上的資源。正是因爲 URI 的特定功能,在互聯網上任意位置的資源都能訪問到。

5. 告知服務器意圖的 HTTP 方法(HTTP/1.1)

  1. 持久連接

HTTP 協議的初始版本中,每進行一個 HTTP 通信都要斷開一次 TCP 連接。比如使用瀏覽器瀏覽一個包含多張圖片的 HTML 頁面時,在發送請求訪問 HTML 頁面資源的同時,也會請求該 HTML 頁面裏包含的其他資源。因此,每次的請求都會造成無畏的 TCP 連接建立和斷開,增加通信量的開銷。
爲了解決上述 TCP 連接的問題,HTTP/1.1 和部分 HTTP/1.0 想出了持久連接的方法。**其特點是,只要任意一端沒有明確提出斷開連接,則保持 TCP 連接狀態。旨在建立一次 TCP 連接後進行多次請求和響應的交互。**在 HTTP/1.1 中,所有的連接默認都是持久連接。

7. 管線化

持久連接使得多數請求以管線化方式發送成爲可能。以前發送請求後需等待並接收到響應,才能發送下一個請求。管線化技術出現後,不用等待亦可發送下一個請求。這樣就能做到同時並行發送多個請求,而不需要一個接一個地等待響應了。
比如,當請求一個包含多張圖片的 HTML 頁面時,與挨個連接相比,用持久連接可以讓請求更快結束。而管線化技術要比持久連接速度更快。請求數越多,時間差就越明顯。

四、HTTP 協議報文結構

1.HTTP 報文

用於 HTTP 協議交互的信息被稱爲 HTTP 報文。請求端(客戶端)的 HTTP 報文叫做請求報文;響應端(服務器端)的叫做響應報文。HTTP 報文本身是由多行(用 CR+LF 作換行符)數據構成的字符串文本。

2.HTTP 報文結構

HTTP 報文大致可分爲報文首部和報文主體兩部分。兩者由最初出現的空行(CR+LF)來劃分。通常,並不一定有報文主體。如下:

2.1 請求報文結構

請求報文的首部內容由以下數據組成:

請求報文的示例,如下:

2.2 響應報文結構

響應報文的首部內容由以下數據組成:

響應報文的示例,如下:

**五、HTTP 報文首部之請求行、狀態行
**

1. 請求行

舉個栗子,下面是一個 HTTP 請求的報文:

GET  /index.htm  HTTP/1.1
Host: sample.com

其中,下面的這行就是請求行:

GET  /index.htm  HTTP/1.1

綜合來看,大意是請求訪問某臺 HTTP 服務器上的 /index.htm 頁面資源。

2. 狀態行

同樣舉個栗子,下面是一個 HTTP 響應的報文:

HTTP/1.1  200  OK
Date: Mon, 10 Jul 2017 15:50:06 GMT
Content-Length: 256
Content-Type: text/html
<html>
...

其中,下面的這行就是狀態行,

HTTP/1.1  200  OK

六、HTTP 報文首部之首部字段(重點分析)

1. 首部字段概述

先來回顧一下首部字段在報文的位置,HTTP 報文包含報文首部和報文主體,報文首部包含請求行(或狀態行)和首部字段。
在報文衆多的字段當中,HTTP 首部字段包含的信息最爲豐富。首部字段同時存在於請求和響應報文內,並涵蓋 HTTP 報文相關的內容信息。使用首部字段是爲了給客服端和服務器端提供報文主體大小、所使用的語言、認證信息等內容。

2. 首部字段結構

jDjohQ

3. 首部字段類型

首部字段根據實際用途被分爲以下 4 種類型:

h7y8Xm

4. 通用首部字段(HTTP/1.1)

XdevoV

4.1 Cache-Control

通過指定首部字段 Cache-Control 的指令,就能操作緩存的工作機制。

4.1.1 可用的指令一覽

可用的指令按請求和響應分類如下:
緩存請求指令

4KNrOP

緩存響應指令

in49HA

4.1.2 表示能否緩存的指令

public 指令
Cache-Control: public
當指定使用 public 指令時,則明確表明其他用戶也可利用緩存。

private 指令
Cache-Control: private
當指定 private 指令後,響應只以特定的用戶作爲對象,這與 public 指令的行爲相反。緩存服務器會對該特定用戶提供資源緩存的服務,對於其他用戶發送過來的請求,代理服務器則不會返回緩存。

no-cache 指令
Cache-Control: no-cache

Cache-Control: no-cache=Location
由服務器返回的響應中,若報文首部字段 Cache-Control 中對 no-cache 字段名具體指定參數值,那麼客戶端在接收到這個被指定參數值的首部字段對應的響應報文後,就不能使用緩存。換言之,無參數值的首部字段可以使用緩存。只能在響應指令中指定該參數。

no-store 指令
Cache-Control: no-store
當使用 no-store 指令時,暗示請求(和對應的響應)或響應中包含機密信息。因此,該指令規定緩存不能在本地存儲請求或響應的任一部分。
注意:no-cache 指令代表不緩存過期的指令,緩存會向源服務器進行有效期確認後處理資源;no-store 指令纔是真正的不進行緩存。

4.1.3 指定緩存期限和認證的指令

s-maxage 指令
Cache-Control: s-maxage=604800(單位:秒)

max-age 指令
Cache-Control: max-age=604800(單位:秒)

min-fresh 指令
Cache-Control: min-fresh=60(單位:秒)
min-fresh 指令要求緩存服務器返回至少還未過指定時間的緩存資源。

max-stale 指令
Cache-Control: max-stale=3600(單位:秒)

only-if-cached 指令
Cache-Control: only-if-cached
表示客戶端僅在緩存服務器本地緩存目標資源的情況下才會要求其返回。換言之,該指令要求緩存服務器不重新加載響應,也不會再次確認資源的有效性。

must-revalidate 指令
Cache-Control: must-revalidate
使用 must-revalidate 指令,代理會向源服務器再次驗證即將返回的響應緩存目前是否仍有效。另外,使用 must-revalidate 指令會忽略請求的 max-stale 指令。

proxy-revalidate 指令
Cache-Control: proxy-revalidate
proxy-revalidate 指令要求所有的緩存服務器在接收到客戶端帶有該指令的請求返回響應之前,必須再次驗證緩存的有效性。

no-transform 指令
Cache-Control: no-transform
使用 no-transform 指令規定無論是在請求還是響應中,緩存都不能改變實體主體的媒體類型。這樣做可防止緩存或代理壓縮圖片等類似操作。

4.1.4 Cache-Control 擴展

Cache-Control: private, community="UCI"
通過 cache-extension 標記(token),可以擴展 Cache-Control 首部字段內的指令。上述 community 指令即擴展的指令,如果緩存服務器不能理解這個新指令,就會直接忽略掉。

4.2 Connection

Connection 首部字段具備以下兩個作用:

控制不再轉發的首部字段
Connection: Upgrade
在客戶端發送請求和服務器返回響應中,使用 Connection 首部字段,可控制不再轉發給代理的首部字段,即刪除後再轉發(即 Hop-by-hop 首部)。

管理持久連接
Connection: close
HTTP/1.1 版本的默認連接都是持久連接。當服務器端想明確斷開連接時,則指定 Connection 首部字段的值爲 close。
Connection: Keep-Alive
HTTP/1.1 之前的 HTTP 版本的默認連接都是非持久連接。爲此,如果想在舊版本的 HTTP 協議上維持持續連接,則需要指定 Connection 首部字段的值爲 Keep-Alive。

4.3 Date

表明創建 HTTP 報文的日期和時間。
Date: Mon, 10 Jul 2017 15:50:06 GMT
HTTP/1.1 協議使用在 RFC1123 中規定的日期時間的格式。

4.4 Pragma

Pragma 首部字段是 HTTP/1.1 版本之前的歷史遺留字段,僅作爲與 HTTP/1.0 的向後兼容而定義。
Pragma: no-cache

Cache-Control: no-cache

Pragma: no-cache
4.5 Trailer

Trailer: Expires
首部字段 Trailer 會事先說明在報文主體後記錄了哪些首部字段。可應用在 HTTP/1.1 版本分塊傳輸編碼時。

4.6 Transfer-Encoding

Transfer-Encoding: chunked

4.7 Upgrade

Upgrade: TSL/1.0
用於檢測 HTTP 協議及其他協議是否可使用更高的版本進行通信,其參數值可以用來指定一個完全不同的通信協議。

4.8 Via

Via: 1.1 a1.sample.com(Squid/2.7)

4.9 Warning

該首部字段通常會告知用戶一些與緩存相關的問題的警告。
Warning 首部字段的格式如下:
Warning:[警告碼][警告的主機:端口號] "[警告內容]"([日期時間])
最後的日期時間可省略。
HTTP/1.1 中定義了 7 種警告,警告碼對應的警告內容僅推薦參考,另外,警告碼具備擴展性,今後有可能追加新的警告碼。

xYG27h

5. 請求首部字段(HTTP/1.1)

WX0AKP

5.1 Accept

Accept: text/html, application/xhtml+xml, application/xml; q=0.5

5.2 Accept-Charset

Accept-Charset: iso-8859-5, unicode-1-1; q=0.8
Accept-Charset 首部字段可用來通知服務器用戶代理支持的字符集及字符集的相對優先順序。另外,可一次性指定多種字符集。同樣使用 q=[數值] 來表示相對優先級。

5.3 Accept-Encoding

Accept-Encoding: gzip, deflate
Accept-Encoding 首部字段用來告知服務器用戶代理支持的內容編碼及內容編碼的優先順序,並可一次性指定多種內容編碼。同樣使用 q=[數值] 來表示相對優先級。也可使用星號(*)作爲通配符,指定任意的編碼格式。

5.4 Accept-Language

Accept-Lanuage: zh-cn,zh;q=0.7,en=us,en;q=0.3
告知服務器用戶代理能夠處理的自然語言集(指中文或英文等),以及自然語言集的相對優先級,可一次性指定多種自然語言集。同樣使用 q=[數值] 來表示相對優先級。

5.5 Authorization

Authorization: Basic ldfKDHKfkDdasSAEdasd==
告知服務器用戶代理的認證信息(證書值)。通常,想要通過服務器認證的用戶代理會在接收到返回的 401 狀態碼響應後,把首部字段 Authorization 加入請求中。共用緩存在接收到含有 Authorization 首部字段的請求時的操作處理會略有差異。

5.6 Expect

Expect: 100-continue
告知服務器客戶端期望出現的某種特定行爲。

5.7 From

From: Deeson_Woo@163.com
告知服務器使用用戶代理的電子郵件地址。

5.8 Host

Host: www.jianshu.com

5.9 If-Match

形如 If-xxx 這種樣式的請求首部字段,都可稱爲條件請求。服務器接收到附帶條件的請求後,只有判斷指定條件爲真時,纔會執行請求。

If-Match: "123456"

5.10 If-Modified-Since

If-Modified-Since: Mon, 10 Jul 2017 15:50:06 GMT

5.11 If-None-Match

If-None-Match: "123456"
首部字段 If-None-Match 屬於附帶條件之一。它和首部字段 If-Match 作用相反。用於指定 If-None-Match 字段值的實體標記(ETag)值與請求資源的 ETag 不一致時,它就告知服務器處理該請求。

5.12 If-Range

If-Range: "123456"

5.13 If-Unmodified-Since

If-Unmodified-Since: Mon, 10 Jul 2017 15:50:06 GMT
首部字段 If-Unmodified-Since 和首部字段 If-Modified-Since 的作用相反。它的作用的是告知服務器,指定的請求資源只有在字段值內指定的日期時間之後,未發生更新的情況下,才能處理請求。如果在指定日期時間後發生了更新,則以狀態碼 412 Precondition Failed 作爲響應返回。

5.14 Max-Forwards

Max-Forwards: 10
通過 TRACE 方法或 OPTIONS 方法,發送包含首部字段 Max-Forwards 的請求時,該字段以十進制整數形式指定可經過的服務器最大數目。服務器在往下一個服務器轉發請求之前,Max-Forwards 的值減 1 後重新賦值。當服務器接收到 Max-Forwards 值爲 0 的請求時,則不再進行轉發,而是直接返回響應。

5.15 Proxy-Authorization

Proxy-Authorization: Basic dGlwOjkpNLAGfFY5

5.16 Range

Range: bytes=5001-10000

5.17 Referer

Referer: http://www.sample.com/index.html
首部字段 Referer 會告知服務器請求的原始資源的 URI。

5.18 TE

TE: gzip, deflate; q=0.5

5.19 User-Agent

User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64; rv:13.0) Gecko/20100101

6. 響應首部字段(HTTP/1.1)

M8B35z

6.1 Accept-Ranges

Accept-Ranges: bytes

6.2 Age

Age: 1200

6.3 ETag

ETag: "usagi-1234"

6.4 Location

Location: http://www.sample.com/sample.html

6.5 Proxy-Authenticate

Proxy-Authenticate: Basic realm="Usagidesign Auth"

6.6 Retry-After

Retry-After: 180

6.7 Server

Server: Apache/2.2.6 (Unix) PHP/5.2.5
首部字段 Server 告知客戶端當前服務器上安裝的 HTTP 服務器應用程序的信息。不單單會標出服務器上的軟件應用名稱,還有可能包括版本號和安裝時啓用的可選項。

6.8 Vary

Vary: Accept-Language

6.9 WWW-Authenticate

WWW-Authenticate: Basic realm="Usagidesign Auth"
首部字段 WWW-Authenticate 用於 HTTP 訪問認證。它會告知客戶端適用於訪問請求 URI 所指定資源的認證方案(Basic 或是 Digest)和帶參數提示的質詢(challenge)。

7. 實體首部字段(HTTP/1.1)

LBTir0

7.1 Allow

Allow: GET, HEAD

7.2 Content-Encoding

Content-Encoding: gzip

7.3 Content-Language

Content-Language: zh-CN
首部字段 Content-Language 會告知客戶端,實體主體使用的自然語言(指中文或英文等語言)。

7.4 Content-Length

Content-Length: 15000
首部字段 Content-Length 表明了實體主體部分的大小(單位是字節)。對實體主體進行內容編碼傳輸時,不能再使用 Content-Length 首部字段。

7.5 Content-Location

Content-Location: http://www.sample.com/index.html
首部字段 Content-Location 給出與報文主體部分相對應的 URI。和首部字段 Location 不同,Content-Location 表示的是報文主體返回資源對應的 URI。

7.6 Content-MD5

Content-MD5: OGFkZDUwNGVhNGY3N2MxMDIwZmQ4NTBmY2IyTY==
首部字段 Content-MD5 是一串由 MD5 算法生成的值,其目的在於檢查報文主體在傳輸過程中是否保持完整,以及確認傳輸到達。

7.7 Content-Range

Content-Range: bytes 5001-10000/10000
針對範圍請求,返回響應時使用的首部字段 Content-Range,能告知客戶端作爲響應返回的實體的哪個部分符合範圍請求。字段值以字節爲單位,表示當前發送部分及整個實體大小。

7.8 Content-Type

Content-Type: text/html; charset=UTF-8
首部字段 Content-Type 說明了實體主體內對象的媒體類型。和首部字段 Accept 一樣,字段值用 type/subtype 形式賦值。參數 charset 使用 iso-8859-1 或 euc-jp 等字符集進行賦值。

7.9 Expires

Expires: Mon, 10 Jul 2017 15:50:06 GMT

7.10 Last-Modified

Last-Modified: Mon, 10 Jul 2017 15:50:06 GMT
首部字段 Last-Modified 指明資源最終修改的時間。一般來說,這個值就是 Request-URI 指定資源被修改的時間。但類似使用 CGI 腳本進行動態數據處理時,該值有可能會變成數據最終修改時的時間。

nd82IX

Set-Cookie: status=enable; expires=Mon, 10 Jul 2017 15:50:06 GMT; path=/;

下面的表格列舉了 Set-Cookie 的字段值。

KERMU4

8.1.1 expires 屬性
8.1.2 path 屬性

Cookie 的 path 屬性可用於限制指定 Cookie 的發送範圍的文件目錄。

8.1.3 domain 屬性
8.1.4 secure 屬性

Cookie 的 secure 屬性用於限制 Web 頁面僅在 HTTPS 安全連接時,纔可以發送 Cookie。

8.1.5 HttpOnly 屬性

Cookie: status=enable
首部字段 Cookie 會告知服務器,當客戶端想獲得 HTTP 狀態管理支持時,就會在請求中包含從服務器接收到的 Cookie。接收到多個 Cookie 時,同樣可以以多個 Cookie 形式發送。

9. 其他首部字段

HTTP 首部字段是可以自行擴展的。所以在 Web 服務器和瀏覽器的應用上,會出現各種非標準的首部字段。
以下是最爲常用的首部字段。

9.1 X-Frame-Options

X-Frame-Options: DENY
首部字段 X-Frame-Options 屬於 HTTP 響應首部,用於控制網站內容在其他 Web 網站的 Frame 標籤內的顯示問題。其主要目的是爲了防止點擊劫持(clickjacking)攻擊。首部字段 X-Frame-Options 有以下兩個可指定的字段值:

9.2 X-XSS-Protection

X-XSS-Protection: 1
首部字段 X-XSS-Protection 屬於 HTTP 響應首部,它是針對跨站腳本攻擊(XSS)的一種對策,用於控制瀏覽器 XSS 防護機制的開關。首部字段 X-XSS-Protection 可指定的字段值如下:

9.3 DNT

DNT: 1
首部字段 DNT 屬於 HTTP 請求首部,其中 DNT 是 Do Not Track 的簡稱,意爲拒絕個人信息被收集,是表示拒絕被精準廣告追蹤的一種方法。首部字段 DNT 可指定的字段值如下:

由於首部字段 DNT 的功能具備有效性,所以 Web 服務器需要對 DNT 做對應的支持。

9.4 P3P

P3P: CP="CAO DSP LAW CURa ADMa DEVa TAIa PSAa PSDa IVAa IVDa OUR BUS IND
首部字段 P3P 屬於 HTTP 響應首部,通過利用 P3P(The Platform for Privacy Preferences,在線隱私偏好平臺)技術,可以讓 Web 網站上的個人隱私變成一種僅供程序可理解的形式,以達到保護用戶隱私的目的。
要進行 P3P 的設定,需按以下操作步驟進行:

七、HTTP 響應狀態碼(重點分析)

1. 狀態碼概述

2. 狀態碼類別

dyEreN

我們可以自行改變 RFC2616 中定義的狀態碼或者服務器端自行創建狀態碼,只要遵守狀態碼的類別定義就可以了。

3. 常用狀態碼解析

HTTP 狀態碼種類繁多,數量達幾十種。其中最常用的有以下 14 種,一起來看看。

3.1 200 OK

表示從客戶端發來的請求在服務器端被正常處理了。

3.2 204 No Content
3.3 206 Partial Content

表示客戶端進行了範圍請求,而服務器成功執行了這部分的 GET 請求。響應報文中包含由 Content-Range 首部字段指定範圍的實體內容。

3.4 301 Moved Permanently

永久性重定向。表示請求的資源已被分配了新的 URI。以後應使用資源現在所指的 URI。也就是說,如果已經把資源對應的 URI 保存爲書籤了,這時應該按 Location 首部字段提示的 URI 重新保存。

3.5 302 Found
3.6 303 See Other
3.7 304 Not Modified
3.8 307 Temporary Redirect

臨時重定向。該狀態碼與 302 Found 有着相同的含義。

3.9 400 Bad Request
3.10 401 Unauthorized
3.11 403 Forbidden

表明對請求資源的訪問被服務器拒絕了。服務器端沒有必要給出詳細的拒絕理由,當然也可以在響應報文的實體主體部分對原因進行描述。

3.12 404 Not Found

表明服務器上無法找到請求的資源。除此之外,也可以在服務器端拒絕請求且不想說明理由的時候使用。

3.13 500 Internal Server Error

表明服務器端在執行請求時發生了錯誤。也可能是 Web 應用存在的 bug 或某些臨時的故障。

3.14 503 Service Unavailable

表明服務器暫時處於超負載或正在進行停機維護,現在無法處理請求。如果事先得知解除以上狀況需要的時間,最好寫入 Retry-After 首部字段再返回給客戶端。

八、HTTP 報文實體

1. HTTP 報文實體概述

HTTP 報文結構

大家請仔細看看上面示例中,各個組成部分對應的內容。
接着,我們來看看報文和實體的概念。如果把 HTTP 報文想象成因特網貨運系統中的箱子,那麼 HTTP 實體就是報文中實際的貨物。

我們可以看到,上面示例右圖中深紅色框的內容就是報文的實體部分,而藍色框的兩部分內容分別就是實體首部和實體主體。而左圖中粉紅框內容就是報文主體。
通常,報文主體等於實體主體。只有當傳輸中進行編碼操作時,實體主體的內容發生變化,才導致它和報文主體產生差異。

2. 內容編碼

內容編碼類型:

QKrN2t

3. 傳輸編碼

內容編碼是對報文的主體進行的可逆變換,是和內容的具體格式細節緊密相關的。
傳輸編碼也是作用在實體主體上的可逆變換,但使用它們是由於架構方面的原因,同內容的格式無關。使用傳輸編碼是爲了改變報文中的數據在網絡上傳輸的方式。

內容編碼和傳輸編碼的對比

4. 分塊編碼

分塊編碼把報文分割成若干已知大小的塊。塊之間是緊挨着發送的,這樣就不需要在發送之前知道整個報文的大小了。分塊編碼是一種傳輸編碼,是報文的屬性。

分塊編碼與持久連接
若客戶端與服務器端之間不是持久連接,客戶端就不需要知道它在讀取的主體的長度,而只需要讀取到服務器關閉主體連接爲止。
當使用持久連接時,在服務器寫主體之前,必須知道它的大小並在 Content-Length 首部中發送。如果服務器動態創建內容,就可能在發送之前無法知道主體的長度。
分塊編碼爲這種困難提供瞭解決方案,只要允許服務器把主體分塊發送,說明每塊的大小就可以了。因爲主體是動態創建的,服務器可以緩衝它的一部分,發送其大小和相應的塊,然後在主體發送完之前重複這個過程。服務器可以用大小爲 0 的塊作爲主體結束的信號,這樣就可以繼續保持連接,爲下一個響應做準備。
來看看一個分塊編碼的報文示例:

分塊編碼的報文

5. 多部分媒體類型

MIME 中的 multipart(多部分)電子郵件報文中包含多個報文,它們合在一起作爲單一的複雜報文發送。每一部分都是獨立的,有各自的描述其內容的集,不同部分之間用分界字符串連接在一起。
相應得,HTTP 協議中也採納了多部分對象集合,發送的一份報文主體內可包含多種類型實體。
多部分對象集合包含的對象如下:

6. 範圍請求

假設你正在下載一個很大的文件,已經下了四分之三,忽然網絡中斷了,那下載就必須重頭再來一遍。爲了解決這個問題,需要一種可恢復的機制,即能從之前下載中斷處恢復下載。要實現該功能,這就要用到範圍請求。
有了範圍請求, HTTP 客戶端可以通過請求曾獲取失敗的實體的一個範圍(或者說一部分),來恢復下載該實體。當然這有一個前提,那就是從客戶端上一次請求該實體到這一次發出範圍請求的時間段內,該對象沒有改變過。例如:

GET  /bigfile.html  HTTP/1.1

Host: www.sample.com
Range: bytes=20224-
···

上面示例中,客戶端請求的是文檔開頭 20224 字節之後的部分。

九、與 HTTP 協作的 Web 服務器

HTTP 通信時,除客戶端和服務器外,還有一些用於協助通信的應用程序。如下列出比較重要的幾個:代理、緩存、網關、隧道、Agent 代理

1. 代理

HTTP 代理服務器是 Web 安全、應用集成以及性能優化的重要組成模塊。代理位於客戶端和服務器端之間,接收客戶端所有的 HTTP 請求,並將這些請求轉發給服務器(可能會對請求進行修改之後再進行轉發)。對用戶來說,這些應用程序就是一個代理,代表用戶訪問服務器。
出於安全考慮,通常會將代理作爲轉發所有 Web 流量的可信任中間節點使用。代理還可以對請求和響應進行過濾,安全上網或綠色上網。

2. 緩存

瀏覽器第一次請求:

瀏覽器第一次請求

瀏覽器再次請求:

瀏覽器再次請求

Web 緩存或代理緩存是一種特殊的 HTTP 代理服務器,可以將經過代理傳輸的常用文檔複製保存起來。下一個請求同一文檔的客戶端就可以享受緩存的私有副本所提供的服務了。客戶端從附近的緩存下載文檔會比從遠程 Web 服務器下載快得多。

3. 網關

HTTP / FTP 網關

網關是一種特殊的服務器,作爲其他服務器的中間實體使用。通常用於將 HTTP 流量轉換成其他的協議。網關接收請求時就好像自己是資源的源服務器一樣。客戶端可能並不知道自己正在跟一個網關進行通信。

4. 隧道

HTTP/SSL 隧道

隧道是會在建立起來之後,就會在兩條連接之間對原始數據進行盲轉發的 HTTP 應用程序。HTTP 隧道通常用來在一條或多條 HTTP 連接上轉發非 HTTP 數據,轉發時不會窺探數據。
HTTP 隧道的一種常見用途就是通過 HTTP 連接承載加密的安全套接字層(SSL)流量,這樣 SSL 流量就可以穿過只允許 Web 流量通過的防火牆了。

5. Agent 代理

Agent 代理是代表用戶發起 HTTP 請求的客戶端應用程序。所有發佈 Web 請求的應用程序都是 HTTP Agent 代理。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/RSm5hGY5MfMl8Ni0T7k_yw