數據安全(反爬蟲)之「防重放」策略

本文將從 API 數據接口的層面講一種技術方案,實現數據安全。

一、 API 接口請求安全性問題


API 接口存在很多常見的安全性問題,常見的有下面幾種情況

  1. 即使採用 HTTPS,諸如 Charles、Wireshark 之類的專業抓包工具可以扮演證書頒發、校驗的角色,因此可以查看到數據

  2. 拿到請求信息後原封不動的發起第二個請求,在服務器上生產了部分髒數據(接口是背後的邏輯是對 DB 的數據插入、刪除等)

所以針對上述的問題也有一些解決方案:

  1. HTTPS 證書的雙向認證解決抓包工具問題

  2. 假如通過網絡層高手截獲了 HTTPS 加證書認證後的數據,所以需要對請求參數做簽名

  3. 「防重放策略」解決請求的多次發起問題

  4. 請求參數和返回內容做額外 RSA 加密處理,即使截獲,也無法查看到明文。

關於 HTTPS 證書雙向認證和 Web 端反爬蟲技術方案均在大前端時代的安全性一文中有具體講解。接下來引出本文主角:防重放

二、 請求參數防篡改


在之前的文章也講過,HTTPS 依舊可以被抓包,造成安全問題。抓包工具下數據依舊是裸奔的,可以查看 Charles 從入門到精通文中講的如何獲取 HTTPS 數據。

假如通過網絡層高手截獲了 HTTPS 加證書認證後的數據,所以需要對請求參數做簽名。步驟如下

因爲中間人不知道簽名密鑰,所以即使攔截到請求,修改了某項參數,但是無法得到正確的簽名 signature,這樣構造的一個請求,會被服務器判定爲一次非法請求。

三、 防重放策略


在工程師文化中,我們要做一個事情,就首先要對這個事情下個定義。我們才能知道做什麼、怎麼做。

理論上,一個 API 接口請求被收到,服務會做校驗,但是當一個合法請求被中間人攔截後,中間人原封不動得重複發送該請求一次或多次,這種重複利用合法請求進行得攻擊被成爲重放。

重放會造成服務器問題,所以我們需要針對重放做防重放。本質上就是如何區別去一次正常、合法的請求。

3.1 基於 timestamp 的方案

理論上,客戶端發起一次請求,到服務端接收到這個請求的時間,業界判定爲不超過 60 秒。利用這個特徵,客戶端每次請求都加上 timestamp1,客戶端將 timestamp1 和其他請求參數一起簽名得到 signature,之後發送請求到服務器。

假如中間人攔截到請求,修改了 timestamp 或者其他的任何參數,但是不知道密鑰,所以服務器依舊判定爲非法請求。中間人從抓包、篡改參數、發起請求的過程一般來說大於 60 秒,所以服務器依舊會判定爲非法請求。

基於 timestamp 的設計缺陷也很明顯,種種原因下,60 秒內的請求,會鑽規則漏洞,服務器判定爲一次合法請求。

3.2 基於 nonce 的方案

既然時間戳會有漏洞,那麼新方案是基於隨機字符串 nonce。也就是說每次請求都加入一個隨機字符串,然後將其他參數一起利用密鑰加密得到簽名 signature。服務端收到請求後

但是該方案也有缺點,因爲當次的請求都需要和集合中去搜索匹配,所以該集合不能太大,不然匹配算法特別耗時,接口性能降低。所以不得不定期刪除部分 nonce 值。但是這樣的情況下,被刪除的 nonce 被利用爲重放攻擊,服務器判定爲合法請求。

假設服務器只保存 24 小時內請求的 nonce,該存儲仍舊是一筆不小的開銷。

3.3 基於 timestamp + nonce 的方案

根據 timestamp 和 nonce 各自的特點:timestamp 無法解決 60 秒內的重放請求;nonce 存儲和查找消耗較大。所以結合 2 者的特點,便有了 「timestamp + nonce 的防重放方案」。

步驟:

  1. 客戶端將當前 timestamp1、隨機字符串和其他請求參數,按照密鑰,生成簽名 signature

  2. 服務端收到請求,利用服務端密鑰,將除 timestamp1、隨機字符串之外的請求參數,加密生成簽名 autograph

  3. 服務端對比 signature 和 autograph,不相等則認爲非法請求

  4. 拿到服務端時間戳, timestamp2 - timestamp1 < 60,則判定爲一次合法請求,然後保存 nonce

  5. 服務端只保存 60 秒內的 nonce,定時將集合內過期的 nonce 刪除

該集合不應該直接操作文件或者數據庫,否則服務端 IO 太多,造成性能瓶頸。可以是 mmap 或者其他內存到文件的讀寫機制。根據場景可以選擇樂觀鎖、悲觀鎖。

其中有一個 timestamp 的問題,服務器會將請求參數中的 timestamp 判斷差值,其中一個致命的缺點是服務器的時間和客戶端的時間是存在時間差的,當然你也可以通過校驗時間戳解決此問題。時間同步請繼續看下面部分。

四、 計算機網絡時間同步技術原理


客戶端和服務端的時間同步在很多場景下非常重要,舉幾個例子,這些場景都是經常發生的。

所以該現象在計算機領域有非常普遍,有解決方案。

  1. 如果精度要求不高的情況下:先請求服務器上的時間 ServerTime,然後記錄下來,同時記錄當前的時間 LocalTime1;需要獲取當前的時間時,用最新的當前時間 (LocalTime2 - LocalTime1 + ServerTime)

    拿 iOS 端舉例:

  1. 如果需要精度更高,比如 100 納秒的情況,則需要使用 NTP(Network Time Protocol)網絡時間協議、PTP (Precision Time Protocol)精確時間同步協議了。
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/uwW8riLk1miyy7D6ITw_og