如何使用 Nginx 作爲開發代理工具?
簡介
Nginx 是一個高性能的 HTTP 服務器,也可以當作電子郵件代理服務器;其特點是佔有內存少,併發能力強且非常穩定,並且有着豐富的模塊庫,配置靈活簡單;因爲上述特點,現在 Nginx 幾乎已經是互聯網系統中不可或缺的一部分;
性能天花板
Nginx 作爲一個 web 服務器,差不多可以稱爲 “性能天花板” 了,在做一些優化之後,Nginx 甚至能做到 “單機百萬 QPS” 的表現;因爲這逆天的性能表現,國內的互聯網大廠基本都會使用 Nginx 作爲自己的網關,直接承載所有的線上流量;那 Nginx 爲什麼能擁有這麼 🐂🍺 的性能呢?
架構設計
因爲散熱的原因,CPU 的頻率已經十多年沒有增長了(下圖綠色部分),而 CPU 的頻率就決定了它的指令執行速度;
CPU 廠商對這一問題的解決方案是橫向的往多核方向發展,這就意味着所有的單進程、單線程的軟件性能都將無法從 CPU 升級上獲得提升,想提升服務器的 QPS,就必須充分使用 CPU 的多個核,那應該如何有效利用 CPU 多核的特性呢?
線程是 CPU 調度的最小單位,支持多線程的軟件就可以同時使用 CPU 多個核的算力,進程是比線程更大的粒度,所以支持多進程也可以,Nginx 就採用了多進程的架構;Nginx 中主要包含下面幾種進程:
-
master 進程:負責讀取配置、綁定端口、創建子進程;
-
worker 進程:負責大多數的邏輯,比如,處理網絡請求、讀寫磁盤、和其他服務通信等;
-
cache manager、cache loader:緩存相關邏輯;
Nginx 服務器啓動後,會生成一個 master 進程,master 線程在完成自己的工作後就開始創建 worker 進程,隨後進入 sleep 的狀態,不佔用過多的計算資源;
worker 進程是實際處理用戶請求的進程,又因爲 Nginx 採用事件驅動的非阻塞 I/O 架構設計,併發數高的時候 worker 進程將會一直保持 running 的狀態,理論上一個 worker 就能喫掉一整個 CPU 核心的算力,所以默認情況下 nginx 會根據系統的 CPU 核心數來創建 worker 進程,有幾個核就創建幾個 worker 進程;
那多個 worker 進程是怎麼監聽同一個端口的?大家本地啓動開發服務器的時候應該遇到過端口被佔用的報錯;master 進程監聽了 80、443 端口,worker 進程屬於 master 的子進程,在 linux 中子進程將默認繼承父進程監聽的端口;
使用 master/worker 除了能充分利用 CPU 多核的算力之外,還帶來了一些其他諸如 “熱升級” 的好處;
榨乾 CPU 算力
雖然說架構設計很重要,但光架構設計還不足以讓 Nginx 有這麼強大的性能;Nginx 還通過其他各種手段榨乾 CPU 的算力,搶佔服務器上其他應用的計算資源;比如:
上面說的高併發時 Nginx 的 worker 進程會一直保持 running 的狀態,搶佔 CPU 的算力,但 Linux 作爲分時操作系統,會將 CPU 的執行時間分爲許多碎片,交由所有進程輪番執行。這些時間片有長有短,從 5 毫秒到 800 毫秒不等,內核分配其長短時,會依據進程的靜態優先級來分配。沒錯,Nginx 爲了讓 worker 進程能分到更長的時間片,會增加 worker 進程的靜態優先級,讓它能夠搶佔到更多的 CPU 計算時間;
想做到高性能,必須同時擁有 “好架構” ➕ “好的細節處理”;
使用入門
Nginx 的配置系統由一個主配置文件和其他一些輔助的配置文件構成。這些配置文件均是純文本文件,全部位於 Nginx 安裝目錄下的 conf 目錄下。
配置文件中以 #
開始的行,或者是前面有若干空格或者 TAB
,然後再跟 #
的行,都被認爲是註釋;
配置文件中可以包含若干配置項,每個配置項由 “配置指令” 和 “指令參數” 2 個部分構成,並以 ;
結尾,指令參數也就是配置指令對應的配置值。舉個例子:
# 這一行是註釋,下一行中的 error_page 爲 “配置指令”,其後跟着的是對應的 “指令參數”
error_page 500 502 503 504 /50x.html;
配置指令
配置指令分爲兩種:
-
簡單配置指令:指令的參數全部由簡單字符串構成,不包含複合配置塊,上述的 “error_page” 即爲簡單配置項;
-
複雜配置指令:包含複合配置塊,複合配置塊是由
{}
括起來的一堆指令,其中可能包含一個或多個簡單配置指令和複雜配置指令,例如: -
events { worker_connections 1024; }
指令參數
指令的參數使用一個或者多個空格或者 TAB
字符與指令分開,由一個或者多個 TOKEN 字符串組成,TOKEN 字符串之間由空格或者 TAB 鍵分隔開來;
指令上下文
複雜配置指令中的 http
、location
、server
、mail
會產生指令上下文,指令上下文存在嵌套關係,比如:
# main 上下文
user nginx;
worker_processes 1;
error_log logs/error.log info;
events {
worker_connections 1024;
}
http {
server {
listen 80;
server_name www.example.com;
location / {
index index.html;
}
}
}
mail {
auth_http 127.0.0.1:80/auth.php;
pop3_capabilities "TOP" "USER";
imap_capabilities "IMAP4rev1" "UIDPLUS";
server {
listen 110;
protocol pop3;
proxy on;
}
}
main 上下文主要用來配置與具體的業務(http 或者郵件)無關的邏輯,比如例子中的:
-
error_log
配置錯誤日誌路徑; -
worker_processes
worker 進程數; -
user
指定可以運行 Nginx 服務的用戶和用戶組; -
events
配置 Nginx 服務器與用戶的網絡連接,比如上述worker_connections
用來配置 worker 進程可以同時支持的最大連接數;
main 上下文中還包含了 http 指令,http 是 Nginx 服務器配置中最重要的部分,代理、緩存等絕大多數功能和第三方模塊的配置都可以放到這個模塊中來;mail 可用來定義電子郵件代理服務器相關的配置;
常見指令
include
從其他文件引入配置,可用來對複雜的 Nginx 配置做拆分;
# main 上下文
user nginx;
worker_processes 1;
error_log logs/error.log info;
events {
worker_connections 1024;
}
http {
server {
listen 80;
server_name www.example.com;
location / {
index index.html;
}
}
include /etc/nginx/conf.d/*.conf;
}
server
server 塊用來配置 “虛擬服務器” ,每一個 server 塊都相當於一臺 “虛擬服務器”,“虛擬服務器” 是一個與實體服務器相對應的概念,將一臺實體服務器進行劃分,對外表現爲多個服務器,可以充分利用服務器的硬件資源,並且可以不用爲每一個要運行的網站提供單獨的 Nginx 服務器;
server {
listen 80;
server_name a.com;
location / {
proxy_pass https://www.baidu.com;
}
}
server {
listen 80;
server_name b.com;
location / {
proxy_pass https://www.google.com;
}
}
server 中最重要的兩條指令爲 listen
和 server_name
,這兩條指令共同決定了一個請求究竟會打到哪一個 “虛擬服務器中”;
listen
用來配置 “虛擬服務器” 監聽的 ip
和 port
,只能配置在 server 塊中,具體語法:
# 只監聽來自 127.0.0.1 這個 IP,請求 8000 端口的請求
listen 127.0.0.1:8000;
# 只監聽來自 127.0.0.1 這個IP,請求 80端 口的請求(不指定端口,默認80)
listen 127.0.0.1;
# 監聽來自所有 IP,請求 8000 端口的請求
listen 8000;
# 監聽 80 端口的請求,且如果沒有其他 server_name 能匹配上的話將會默認匹配該 server
listen 80 default_server;
server_name
用來配置 “虛擬服務器” 的網址,只能配置在 server 塊中,具體語法:
server_name myserver.com www.myserver.com;
# 還可以使用通配符 *
server_name myserver.* *.myserver.com;
# 還可以使用正則
server_name ~^(?<www>.+).example.org$;
存在通配符以及正則的話,則存在多個 server_name 被同時匹配上的可能,當有多個匹配上的話,會按照下面的優先級來決定請求打到哪一個 “虛擬服務器”:
-
準確匹配的 server_name;
-
通配符在開始時匹配的 server_name;
-
通配符在結尾時匹配的 server_name;
-
正則表達式匹配的 server_name;
-
locatioin
server 中使用 listen 和 server_name 來區分 “虛擬服務器”,location 指令則讓 server 可以非常靈活的處理請求;
location 的語法結構:
location [ = | ~ | ~* | ^~ ] uri {
...
}
location 有五種匹配方式:
| 空 | location 後沒有參數直接跟着 標準 URI,表示前綴匹配,代表跟請求中的 URI 從頭開始匹配; | | --- | --- | | = | 用於標準 URI 前,要求請求字符串與其精準匹配,成功則立即處理,nginx 停止搜索其他匹配。 | | ^~ | 用於標準 URI 前,並要求一旦匹配到就會立即處理,不再去匹配其他的那些個正則 URI,一般用來匹配目錄 | | ~ | 用於正則 URI 前,表示 URI 包含正則表達式,區分大小寫 | | ~* | 用於**正則 URI** 前,表示 URI 包含正則表達式,不區分大小寫 |
Nginx 中不會直接按照 location 出現的先後順序進行匹配,而是按照下面的規則進行匹配:
-
先精準匹配
=
,精準匹配成功則會立即停止其他類型匹配; -
沒有精準匹配成功時,進行前綴匹配。先查找帶有
^~
的前綴匹配,帶有^~
的前綴匹配成功則立即停止其他類型匹配,普通前綴匹配(不帶參數^~
)成功則會暫存,繼續查找正則匹配; -
=
和^~
均未匹配成功前提下,查找正則匹配~
和~*
。當同時有多個正則匹配時,按其在配置文件中出現的先後順序優先匹配,命中則立即停止其他類型匹配; -
所有正則匹配均未成功時,返回步驟 2 中暫存的普通前綴匹配(不帶參數
^~
)結果; -
所有匹配都不命中時,默認進入
/
; -
rewrite 和 proxy_pass
rewrite 可以出現在 server、location、if 塊中,用來改寫請求地址,具體的語法如下:
rewrite regex replacement [last|break|redirect|permanent];
proxy_pass 只能出現在 location、if 塊中,用來將請求轉發至對應的服務,具體語法如下:
proxy_pass uri;
舉個例子:
server {
rewrite /a.html /b.html break;
return 200 'ok';
location /a.html {
return 200 'a.html';
}
location /b.html {
return 200 'b.html';
}
location /c.html {
proxy_pass http://www.google.com;
}
}
使用場景
域名 -> 域名
將某一個域名的請求在本地攔截之後,轉發到 nginx 中,nginx 將請求轉發到其他域名;
server {
listen 80;
server_name www.baidu.com;
location / {
proxy_pass http://www.google.com;
}
}
域名 -> 本地 ip
將某一個域名的請求攔截之後,轉到到 nginx 中,nginx 將對應的請求打到本地的其他 ip;
server {
listen 80;
server_name www.baidu.com;
location / {
proxy_pass http://127.0.0.1:8001;
}
}
路徑 -> 域名
根據不同路徑將請求轉發至不同的域名;
server {
listen 80;
server_name www.baidu.com;
location ^~ /to_google {
proxy_http_version 1.1;
rewrite .* /;
proxy_pass http://google.com/;
}
}
接口跨域
解決前端本地開發環境調用線上接口時跨域的問題;
server {
listen 80;
location ^~ /api {
proxy_pass http://example.com;
add_header Access-Control-Allow-Methods *;
add_header Access-Control-Max-Age 3600;
add_header Access-Control-Allow-Credentials true;
add_header Access-Control-Allow-Origin $http_origin;
if ($request_method = OPTIONS){
return 200;
}
}
}
小結
-
Nginx 因爲其優秀的架構設計和極致的細節處理,才擁有了現在這麼強悍的性能,兩者缺一不可;
-
Nginx 有一套自己設計的指令式配置語法,跟傳統的編程語言不同,學習成本不高,感興趣的同學可以學習一下。
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/TbKsZ9loS93vl5ojKK6N6g