如何使用 Nginx 作爲開發代理工具?

簡介

Nginx 是一個高性能的 HTTP 服務器,也可以當作電子郵件代理服務器;其特點是佔有內存少,併發能力強且非常穩定,並且有着豐富的模塊庫,配置靈活簡單;因爲上述特點,現在 Nginx 幾乎已經是互聯網系統中不可或缺的一部分;

性能天花板


Nginx 作爲一個 web 服務器,差不多可以稱爲 “性能天花板” 了,在做一些優化之後,Nginx 甚至能做到 “單機百萬 QPS” 的表現;因爲這逆天的性能表現,國內的互聯網大廠基本都會使用 Nginx 作爲自己的網關,直接承載所有的線上流量;那 Nginx 爲什麼能擁有這麼 🐂🍺 的性能呢?

架構設計

因爲散熱的原因,CPU 的頻率已經十多年沒有增長了(下圖綠色部分),而 CPU 的頻率就決定了它的指令執行速度;

CPU 廠商對這一問題的解決方案是橫向的往多核方向發展,這就意味着所有的單進程、單線程的軟件性能都將無法從 CPU 升級上獲得提升,想提升服務器的 QPS,就必須充分使用 CPU 的多個核,那應該如何有效利用 CPU 多核的特性呢?

線程是 CPU 調度的最小單位,支持多線程的軟件就可以同時使用 CPU 多個核的算力,進程是比線程更大的粒度,所以支持多進程也可以,Nginx 就採用了多進程的架構;Nginx 中主要包含下面幾種進程:

Nginx 服務器啓動後,會生成一個 master 進程,master 線程在完成自己的工作後就開始創建 worker 進程,隨後進入 sleep 的狀態,不佔用過多的計算資源;

worker 進程是實際處理用戶請求的進程,又因爲 Nginx 採用事件驅動的非阻塞 I/O 架構設計,併發數高的時候 worker 進程將會一直保持 running 的狀態,理論上一個 worker 就能喫掉一整個 CPU 核心的算力,所以默認情況下 nginx 會根據系統的 CPU 核心數來創建 worker 進程,有幾個核就創建幾個 worker 進程;

那多個 worker 進程是怎麼監聽同一個端口的?大家本地啓動開發服務器的時候應該遇到過端口被佔用的報錯;master 進程監聽了 80、443 端口,worker 進程屬於 master 的子進程,在 linux 中子進程將默認繼承父進程監聽的端口;

使用 master/worker 除了能充分利用 CPU 多核的算力之外,還帶來了一些其他諸如 “熱升級” 的好處;

榨乾 CPU 算力

雖然說架構設計很重要,但光架構設計還不足以讓 Nginx 有這麼強大的性能;Nginx 還通過其他各種手段榨乾 CPU 的算力,搶佔服務器上其他應用的計算資源;比如:

上面說的高併發時 Nginx 的 worker 進程會一直保持 running 的狀態,搶佔 CPU 的算力,但 Linux 作爲分時操作系統,會將 CPU 的執行時間分爲許多碎片,交由所有進程輪番執行。這些時間片有長有短,從 5 毫秒到 800 毫秒不等,內核分配其長短時,會依據進程的靜態優先級來分配。沒錯,Nginx 爲了讓 worker 進程能分到更長的時間片,會增加 worker 進程的靜態優先級,讓它能夠搶佔到更多的 CPU 計算時間;

想做到高性能,必須同時擁有 “好架構” ➕ “好的細節處理”;

使用入門

Nginx 的配置系統由一個主配置文件和其他一些輔助的配置文件構成。這些配置文件均是純文本文件,全部位於 Nginx 安裝目錄下的 conf 目錄下。

配置文件中以 # 開始的行,或者是前面有若干空格或者 TAB,然後再跟 # 的行,都被認爲是註釋;

配置文件中可以包含若干配置項,每個配置項由 “配置指令” 和 “指令參數” 2 個部分構成,並以 ; 結尾,指令參數也就是配置指令對應的配置值。舉個例子:

# 這一行是註釋,下一行中的 error_page 爲 “配置指令”,其後跟着的是對應的 “指令參數”
error_page   500 502 503 504  /50x.html;

配置指令

配置指令分爲兩種:

指令參數

指令的參數使用一個或者多個空格或者 TAB 字符與指令分開,由一個或者多個 TOKEN 字符串組成,TOKEN 字符串之間由空格或者 TAB 鍵分隔開來;

指令上下文

複雜配置指令中的 httplocationservermail 會產生指令上下文,指令上下文存在嵌套關係,比如:

# main 上下文
user  nginx;
worker_processes  1;
error_log  logs/error.log  info;

events {
    worker_connections  1024;
}

http {
    server {
        listen          80;
        server_name     www.example.com;
        location / {
            index index.html;
        }
    }
}

mail {
    auth_http  127.0.0.1:80/auth.php;
    pop3_capabilities  "TOP"  "USER";
    imap_capabilities  "IMAP4rev1"  "UIDPLUS";

    server {
        listen     110;
        protocol   pop3;
        proxy      on;
    }
}

main 上下文主要用來配置與具體的業務(http 或者郵件)無關的邏輯,比如例子中的:

main 上下文中還包含了 http 指令,http 是 Nginx 服務器配置中最重要的部分,代理、緩存等絕大多數功能和第三方模塊的配置都可以放到這個模塊中來;mail 可用來定義電子郵件代理服務器相關的配置;

常見指令

include

從其他文件引入配置,可用來對複雜的 Nginx 配置做拆分;

# main 上下文
user  nginx;
worker_processes  1;
error_log  logs/error.log  info;

events {
    worker_connections  1024;
}

http {
    server {
        listen          80;
        server_name     www.example.com;
        location / {
            index index.html;
        }
    }
    include /etc/nginx/conf.d/*.conf;
}

server

server 塊用來配置 “虛擬服務器” ,每一個 server 塊都相當於一臺 “虛擬服務器”,“虛擬服務器” 是一個與實體服務器相對應的概念,將一臺實體服務器進行劃分,對外表現爲多個服務器,可以充分利用服務器的硬件資源,並且可以不用爲每一個要運行的網站提供單獨的 Nginx 服務器;

server {
    listen 80;
    server_name a.com;

    location / {
        proxy_pass https://www.baidu.com;
    }
}
server {
    listen 80;
    server_name b.com;

    location / {
        proxy_pass https://www.google.com;
    }
}

server 中最重要的兩條指令爲 listenserver_name ,這兩條指令共同決定了一個請求究竟會打到哪一個 “虛擬服務器中”;

listen

用來配置 “虛擬服務器” 監聽的 ipport,只能配置在 server 塊中,具體語法:

# 只監聽來自 127.0.0.1 這個 IP,請求 8000 端口的請求
listen 127.0.0.1:8000;
# 只監聽來自 127.0.0.1 這個IP,請求 80端 口的請求(不指定端口,默認80)
listen 127.0.0.1;
# 監聽來自所有 IP,請求 8000 端口的請求
listen 8000;
# 監聽 80 端口的請求,且如果沒有其他 server_name 能匹配上的話將會默認匹配該 server
listen 80 default_server;

server_name

用來配置 “虛擬服務器” 的網址,只能配置在 server 塊中,具體語法:

server_name    myserver.com    www.myserver.com;
# 還可以使用通配符 *
server_name    myserver.*    *.myserver.com;
# 還可以使用正則
server_name    ~^(?<www>.+).example.org$;

存在通配符以及正則的話,則存在多個 server_name 被同時匹配上的可能,當有多個匹配上的話,會按照下面的優先級來決定請求打到哪一個 “虛擬服務器”:

  1. 準確匹配的 server_name;

  2. 通配符在開始時匹配的 server_name;

  3. 通配符在結尾時匹配的 server_name;

  4. 正則表達式匹配的 server_name;

  5. locatioin

server 中使用 listen 和 server_name 來區分 “虛擬服務器”,location 指令則讓 server 可以非常靈活的處理請求;

location 的語法結構:

location [ = | ~ | ~* | ^~ ] uri {
    ...
}

location 有五種匹配方式:

| | location 後沒有參數直接跟着 標準 URI,表示前綴匹配,代表跟請求中的 URI 從頭開始匹配; | | --- | --- | | = | 用於標準 URI 前,要求請求字符串與其精準匹配,成功則立即處理,nginx 停止搜索其他匹配。 | | ^~ | 用於標準 URI 前,並要求一旦匹配到就會立即處理,不再去匹配其他的那些個正則 URI,一般用來匹配目錄 | | ~ | 用於正則 URI 前,表示 URI 包含正則表達式,區分大小寫 | | ~* | 用於**正則 URI** 前,表示 URI 包含正則表達式,不區分大小寫 |

Nginx 中不會直接按照 location 出現的先後順序進行匹配,而是按照下面的規則進行匹配:

  1. 先精準匹配 = ,精準匹配成功則會立即停止其他類型匹配;

  2. 沒有精準匹配成功時,進行前綴匹配。先查找帶有 ^~ 的前綴匹配,帶有 ^~ 的前綴匹配成功則立即停止其他類型匹配,普通前綴匹配(不帶參數  ^~  )成功則會暫存,繼續查找正則匹配;

  3. = 和 ^~ 均未匹配成功前提下,查找正則匹配 ~ 和 ~* 。當同時有多個正則匹配時,按其在配置文件中出現的先後順序優先匹配,命中則立即停止其他類型匹配;

  4. 所有正則匹配均未成功時,返回步驟 2 中暫存的普通前綴匹配(不帶參數  ^~  )結果;

  5. 所有匹配都不命中時,默認進入 /

  6. rewrite 和 proxy_pass

rewrite 可以出現在 server、location、if 塊中,用來改寫請求地址,具體的語法如下:

rewrite regex replacement [last|break|redirect|permanent];

proxy_pass 只能出現在 location、if 塊中,用來將請求轉發至對應的服務,具體語法如下:

proxy_pass uri;

舉個例子:

server {
    rewrite /a.html /b.html break;
    return 200 'ok';
    
    location /a.html {
        return 200 'a.html';
    }
    
    location /b.html {
        return 200 'b.html';
    }
    
    location /c.html {
        proxy_pass http://www.google.com;
    }
}

使用場景

域名 -> 域名

將某一個域名的請求在本地攔截之後,轉發到 nginx 中,nginx 將請求轉發到其他域名;

server {
    listen 80;
    server_name www.baidu.com;
    location / {
        proxy_pass http://www.google.com;
    }
}

域名 -> 本地 ip

將某一個域名的請求攔截之後,轉到到 nginx 中,nginx 將對應的請求打到本地的其他 ip;

server {
    listen 80;
    server_name www.baidu.com;
    location / {
        proxy_pass http://127.0.0.1:8001;
    }
}

路徑 -> 域名

根據不同路徑將請求轉發至不同的域名;

server {
    listen 80;
    server_name www.baidu.com;
    
    location ^~ /to_google {
        proxy_http_version 1.1;
        rewrite .* /;
        proxy_pass http://google.com/;
    }
}

接口跨域

解決前端本地開發環境調用線上接口時跨域的問題;

server {
    listen 80;
    
    location ^~ /api {
        proxy_pass http://example.com;
        
        add_header Access-Control-Allow-Methods *;
        add_header Access-Control-Max-Age 3600;
        add_header Access-Control-Allow-Credentials true;
        add_header Access-Control-Allow-Origin $http_origin;

        if ($request_method = OPTIONS){
            return 200;
        }
    }
}

小結

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/TbKsZ9loS93vl5ojKK6N6g