PostgreSQL 數據庫跨版本升級常用方案

對於企業而言,將數據庫系統升級到新版本通常可以獲得更好的性能、更多的功能、最新的安全補丁和錯誤修復等。因此,本文就來介紹一下 PostgreSQL 數據庫版本升級的三種常用方案。

升級方案概述

PostgreSQL 版本號由主要版本和次要版本組成。例如,PostgreSQL 12.4 中的 12 是主要版本,4 是次要版本;PostgreSQL 10.0 之前的版本由 3 個數字組成,例如 9.6.19,其中 9.6 是主要版本,19 是次要版本。

發佈次要版本是不會改變內存的存儲格式,因此總是和相同的主要版本兼容。例如,PostgreSQL 12.4 和 PostgreSQL 12.0 以及後續的 PostgreSQL 12.x 兼容。對於這些兼容版本的升級非常簡單,只需要關閉數據庫服務,安裝替換二進制的可執行文件,重新啓動服務即可。

接下來,我們主要討論 PostgreSQL 的跨版本升級問題,例如從 PostgreSQL 12.x 升級到 PostgreSQL 13.y。主要版本的升級可能會修改內部數據的存儲格式,因此需要執行額外的操作。常用的跨版本升級方法和適用場景如下:

2f2lkw

📝如果使用廠商提供的 PostgreSQL 定製版本,也可能通過他們提供的工具實現版本升級,具體參考相關文檔。

注意事項:升級主要版本通過會導致用戶可見的不兼容性,因此應用程序可能需要進行相應的修改。具體的變化可以參考發行說明,尤其是 “Migration” 部分的內容;如果跨多個主要版本進行升級,需要閱讀每個中間版本的發行說明。

通過邏輯備份與還原進行升級

傳統的跨版本升級方法利用 pg_dump/pg_dumpall 邏輯備份導出數據庫,然後在新版本中通過 pg_restore 進行還原。導出舊版本數據庫時推薦使用新版本的 pg_dump/pg_dumpall 工具,可以利用最新的並行導出和還原功能,同時可以減少數據庫膨脹問題。

邏輯備份與還原非常簡單但速度比較慢,停機時間取決於數據庫的大小,因此適合中小型數據庫的升級。

下面我們介紹這種升級方法的具體操作,假如當前 PostgreSQL 軟件的安裝目錄位於 /usr/local/pgsql,同時數據目錄位於 /usr/local/pgsql/data,我們在同一臺服務器上進行升級。

執行邏輯備份之前停止應用程序,確保沒有數據更新,因爲備份開始後的更新不會被導出。如有必要,可以修改 /usr/local/pgsql/data/pg_hba.conf 文件禁止其他人訪問數據庫。

然後備份數據庫:

pg_dumpall > outputfile

如果已經安裝了新版本的 PostgreSQL,可以使用新版本的 pg_dumpall 命令備份舊版本數據庫。

停止舊版本的後臺服務:

pg_ctl stop

或者通過其他方式停止後臺服務。

如果安裝目錄沒有包含特定版本標識,可以將目錄改名,必要時可以再修改回來。可以使用類似以下的命令重命名目錄:

mv /usr/local/pgsql /usr/local/pgsql.old

安裝新版本 PostgreSQL 軟件,假如安裝目錄仍然是 /usr/local/pgsql。

初始化一個新的數據庫集羣,需要使用數據庫專用用戶(通常是 postgres;如果是升級版本,應該已經存在該用戶)執行操作:

/usr/local/pgsql/bin/initdb -D /usr/local/pgsql/data

將舊版本配置文件 pg_hba.conf 和 postgresql.conf 等中的改動在對應的新配置文件中再次進行修改。

使用數據庫專用用戶啓動新版本的後臺服務:

 /usr/local/pgsql/bin/postgres -D /usr/local/pgsql/data

最後,利用新版本的 psql 命令還原數據:

/usr/local/pgsql/bin/psql -d postgres -f outputfile

爲了減少停機時間,可以將新版本的 PostgreSQL 安裝到另一個目錄(例如 /usr/local/pgsql-13),同時使用不同的端口啓動服務。然後同時執行數據庫的導出和導入:

pg_dumpall -p 5432 | psql -d postgres -p 5433

執行以上操作時,新舊版本的後臺服務同時運行,新版本使用 5433 端口,舊版本使用 5432 端口。

利用 pg_upgrade 工具進行升級

pg_upgrade 工具可以支持 PostgreSQL 跨版本的就地升級,不需要執行導出和導入操作。pg_upgrade 可以支持 PostgreSQL 8.4.X 到最新版本的升級,包括快照版本和測試版本。

pg_upgrade 提供了升級前的兼容性檢查(-c 或者 --check 選項)功能, 可以發現插件、數據類型不兼容等問題。如果指定了 --link 選項,新版本服務可以直接使用原有的數據庫文件而不需要執行復制,通常可以在幾分鐘內完成升級操作。

下面我們介紹這種升級方法的具體操作,假如當前 PostgreSQL 軟件的安裝目錄位於 /usr/pgsql-12/,同時數據目錄位於 /var/lib/pgsql/12/data/,我們將其升級爲 PostgreSQL 13。

確定沒有客戶端訪問之後備份數據庫,然後停止舊版本的後臺服務。例如 CentOS 可以執行以下命令:

sudo systemctl stop postgresql-12
sudo systemctl disable postgresql-12

安裝新版本的 PostgreSQL 軟件。例如 PostgreSQL 13.0,安裝目錄位於 /usr/pgsql-13/。

初始化新版本的數據庫集羣。數據目錄設置爲 /var/lib/pgsql/13/data/。

如果舊版本中安裝了擴展模塊,在新版本中也需要安裝相應的共享對象文件或者 DLL 文件。但是不要執行CREATE EXTENSION命令,因爲會從舊數據庫中進行升級。另外,如果使用了任何自定義的全文搜索文件(字典、同義詞、詞庫、停用詞),也需要複製到新的數據庫集羣目錄中。

停止新版本的後臺服務。例如 CentOS 可以執行以下命令:

sudo systemctl stop postgresql-13

通過 pg_upgrade 執行升級操作,使用數據庫專用用戶(通常是 postgres)執行以下操作:

/usr/pgsql-13/bin/pg_upgrade \
  --old-datadir /var/lib/pgsql/12/data/ \
  --new-datadir /var/lib/pgsql/13/data/ \
  --old-bindir /usr/pgsql-12/bin/ \
  --new-bindir /usr/pgsql-13/bin/ \
  --check

其中 --check 表示執行升級檢查,而不會真的執行升級操作。通過檢查之後,可以去掉該參數執行升級:

/usr/pgsql-13/bin/pg_upgrade \
  --old-datadir /var/lib/pgsql/12/data/ \
  --new-datadir /var/lib/pgsql/13/data/ \
  --old-bindir /usr/pgsql-12/bin/ \
  --new-bindir /usr/pgsql-13/bin/ \
  --link

其中 --link 表示將新版本的數據目錄硬鏈接到舊版本的數據目錄,而不會複製一份新的數據文件,可以快速進行升級。

將舊版本配置文件 pg_hba.conf 和 postgresql.conf 等中的改動在對應的新配置文件中再次進行修改。

啓動新版本的後臺服務。例如 CentOS 可以執行以下命令:

sudo systemctl start postgresql-13
sudo systemctl enable postgresql-13

連接服務器查看數據庫的版本信息:

SELECT version();
version                                                                                                |
-------------------------------------------------------------------------------------------------------|
PostgreSQL 13.0 on x86_64-pc-linux-gnu, compiled by gcc (GCC) 4.8.5 20150623 (Red Hat 4.8.5-39), 64-bit|

收集統計信息。pg_upgrade 不會生成新版本數據庫的統計信息,但是會創建一個腳本文件,執行該文件:

./analyze_new_cluster.sh

如果確認升級成功,可以選擇刪除或者保留舊的數據庫軟件和集羣。pg_upgrade 同樣提供了一個刪除舊數據庫集羣的腳本:

  ./delete_old_cluster.sh

然後可以刪除舊版本的 PostgreSQL 軟件,例如 CentOS 可以執行以下命令:

yum remove postgresql12*

如果想要回退到舊版本的數據庫,可以分爲不同的情況:

    1. 如果只運行了 --check 選項命令,表示沒有真正執行升級,重新啓動服務即可;

    2. 如果升級時沒有使用 --link 選項,舊版本的數據庫集羣沒有任何修改,重新啓動服務即可;

    3. 如果升級時使用了 --link 選項,數據庫文件可能已經被新版本的集羣使用:

        1. 如果 pg_upgrade 在鏈接操作之前終止,舊版本的數據庫集羣沒有任何修改,重新啓動服務即可;

        2. 如果沒有啓動過新版本的後臺服務,舊版本的數據庫集羣沒有修改,但是鏈接過程已經將 $PGDATA/global/pg_control 文件重命名爲 $PGDATA/global/pg_control.old;此時需要將該文件名中的 .old 後綴去掉,然後重新啓動服務即可;

       3.  如果已經啓動了新版本的數據庫集羣,已經修改了數據庫文件,再啓動舊版本的服務可能導致數據損壞;此時需要通過備份文件還原舊版本的數據庫。

關於 pg_upgrade 的詳細使用和升級注意事項,例如流複製結構和日誌傳輸複製結構中備用節點的升級,可以參考官方文檔。

使用邏輯複製功能進行升級

PostgreSQL 邏輯複製支持跨版本之間的數據複製,而且支持不同平臺之間的複製,因此也可以用於實現版本升級。我們可以安裝一個新版本的數據庫作爲複製的從節點,當數據已經同步時執行一次主從切換,然後關閉舊版本的主節點。主從切換的升級方法通常只需要幾秒鐘就能完成,利用第三方高可用組件甚至可以實現零停機時間升級。

PostgreSQL 10 開始提供了內置的邏輯複製功能,或者也可以使用 pglogical、Slony、Londiste 以及 Bucardo 等邏輯複雜工具。

關於 PostgreSQL 邏輯複製結構的創建和主從切換,可以參考官方文檔。

總結

PostgreSQL 小版本升級只需要替換二進制文件即可,跨版本升級的方案主要有三種:通過 pg_dump/pg_dumpall 邏輯備份與還原進行升級,利用 pg_upgrade 工具進行升級,使用邏輯複製功能進行升級。瞭解它們的優缺點和適用場景可以幫助我們選擇最佳的升級方式。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/N7aowR1-2KkRKpDtQZqJZQ