Linux tar 命令高級用法 — 備份數據
Linux 上有功能強大的 tar 命令,tar 最初是爲了製作磁帶備份(tape archive)而設計的,它的作用是把文件和目錄備份到磁帶中,然後從磁帶中提取或恢復文件。現在我們可以使用 tar 來備份數據到任何存儲介質上。它是文件級備份,不必考慮底層文件系統類別,並且支持增量備份。
1. 部分常用選項
-z, --gzip: 使用 gzip 工具(解)壓縮,後綴一般爲. gz
-c, --create: tar 打包,後綴一般爲. tar
-f, --file=: 後面立刻接打包或壓縮後得到的文件名
-x, --extract: 解包命令,與 - c 對應
-p: 保留備份數據的原本權限和屬性
-g: 後接增量備份的快照文件
-C: 指定解壓縮的目錄
--exclude: 排除不打包的目錄或文件,支持正則匹配
其他
-X, --exclude-from: 在一個文件中列出要排除的目錄或文件(在 --exclude = 較多時使用)
-t, --list: 列出備份檔案中的文件列表,不與 - c、-x 同時出現
-j, --bzip2: 使用 bzip2 工具(解)壓縮,後綴一般爲. bz2
-P: 保留絕對路徑,解壓時同樣會自動解壓到絕對路徑下
-v: (解)壓縮過程顯示文件處理過程,常用但不建議對大型文件使用
2. 增量備份(網站)數據
許多系統(應用或網站)每天都有靜態文件產生,對於一些比較重要的靜態文件如果有進行定期備份的需求,就可以通過 tar 打包壓縮備份到指定的地方,特別是對一些總文件比較大比較多的情況,還可以利用 - g 選項來做增量備份。
備份的目錄最好使用相對路徑,也就是進入到需要備份的根目錄下
具體示例方法如下。
備份當前目錄下的所有文件
# tar -g /tmp/snapshot_data.snap -zcpf /tmp/data01.tar.gz .
在需要恢復的目錄下解壓恢復
# tar -zxpf /tmp/data01.tar.gz -C .
-g 選項可以理解備份時給目錄文件做一個快照,記錄權限和屬性等信息,第一次備份時 / tmp/snapshot_data.snap 不存在,會新建一個並做完全備份。當目錄下的文件有修改後,再次執行第一條備份命令(記得修改後面的檔案文件名),會自動根據 - g 指定的快照文件,增量備份修改過的文件,包括權限和屬性,沒有動過的文件不會重複備份。
另外需要注意上面的恢復,是 “保留恢復”,即存在相同文件名的文件會被覆蓋,而原目錄下已存在(但備份檔案裏沒有)的,會依然保留。所以如果你想完全恢復到與備份文件一模一樣,需要清空原目錄。如果有增量備份檔案,則還需要使用同樣的方式分別解壓這些檔案,而且要注意順序。
下面演示一個比較綜合的例子,要求:
備份 / tmp/data 目錄,但 cache 目錄以及臨時文件排除在外
由於目錄比較大(>4G),所以全備時分割備份的檔案(如每個備份檔案文件最大 1G)
保留所有文件的權限和屬性,如用戶組和讀寫權限
# cd /tmp/data
做一次完全備份
# rm -f /tmp/snapshot_data.snap
# tar -g /tmp/snapshot_data.snap -zcpf - --exclude=./cache ./ | split -b 1024M - /tmp/bak_data$(date -I).tar.gz_
分割後文件名後會依次加上 aa,ab,ac,...,上面最終的備份歸檔會保存成
bak_data2014-12-07.tar.gz_aa
bak_data2014-12-07.tar.gz_ab
bak_data2014-12-07.tar.gz_ac
...
增量備份
可以是與完全備份一模一樣的命令,但需要注意的是假如你一天備份多次,可能導致檔案文件名重複,那麼就會導致
備份實現,因爲 split 依然會從 aa,ab 開始命名,如果一天的文件產生(修改)量不是特別大,那麼建議增量部分不
分割處理了:( 一定要分割的話,文件名加入更細緻的時間如 $(date +%Y-%m-%d_%H) )
# tar -g /tmp/snapshot_data.snap -zcpf /tmp/bak_data2014-12-07.tar.gz --exclude=./cache ./
第二天增備
# tar -g /tmp/snapshot_data.snap -zcpf /tmp/bak_data2014-12-08.tar.gz --exclude=./cache ./
恢復過程
恢復完全備份的檔案文件
可以選擇是否先清空 / tmp/data / 目錄
# cat /tmp/bak_data2014-12-07.tar.gz_* | tar -zxpf - -C /tmp/data/
恢復增量備份的檔案文件
$ tar –zxpf /tmp/bak_data2014-12-07.tar.gz -C /tmp/data/
$ tar –zxpf /tmp/bak_data2014-12-08.tar.gz -C /tmp/data/
...
一定要保證是按時間順序恢復的,像下面文件名規則也可以使用上面通配符的形式
如果需要定期備份,如每週一次全備,每天一次增量備份,則可以結合 crontab 實現。
3. 備份文件系統
備份文件系統方法有很多,例如 cpio, rsync, dump, tar,這裏演示一個通過 tar 備份整個 Linux 系統的例子,整個備份與恢復過程與上面類似。
首先 Linux(這裏是 CentOS)有一部分目錄是沒必要備份的,如 / proc、/lost+found、/sys、/mnt、/media、/dev、/proc、/tmp,如果是備份到磁帶 / dev/st0 則不必關心那麼多,因爲我這裏是備份到本地 / backup 目錄,所以也需要排除,還有其它一些 NFS 或者網絡存儲掛載的目錄。
創建排除列表文件
# vi /backup/backup_tar_exclude.list
/backup
/proc
/lost+found
/sys
/mnt
/media
/dev
/tmp
$ tar -zcpf /backup/backup_full.tar.gz -g /backup/tar_snapshot.snap --exclude-from=/backup/tar_exclude.list /
4. 注意
使用 tar 無論是備份數據還是文件系統,需要考慮是在原系統上恢復還是另一個新的系統上恢復。
tar 備份極度依賴於文件的 atime 屬性,
文件所屬用戶是根據用戶 ID 來確定的,異機恢復需要考慮相同用戶擁有相同 USERID
備份和恢復的過程儘量不要運行其他進程,可能會導致數據不一致
軟硬連接文件可以正常恢復
來自:Sean's Notes 小樣兒の部落閣
鏈接:http://seanlook.com/2014/12/08/tar_backup_filesystem/
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/LD9Edhdjjw6Q_bj28j7sww