使用 sed 命令進行復制、剪切和粘貼

**導讀:**你可以將保留空間當作剪貼板,實際上,這正是本文所演示的內容:如何使用 sed 複製 / 剪切和粘貼。   

本文字數:3742,閱讀時長大約:5 分鐘

https://linux.cn/article-13417-1.html
作者:Seth Kenlon
譯者:MjSeven

瞭解 sed 的基本用法,然後下載我們的備忘單,方便快速地參考 Linux 流編輯器。

很少有 Unix 命令像 sed、grep 和 awk 一樣出名,它們經常組合在一起,可能是因爲它們具有奇怪的名稱和強大的文本解析能力。它們還在一些語法和邏輯上有相似之處。雖然它們都能用於文本解析,但都有其特殊性。本文研究 sed 命令,它是一個 流編輯器 (stream editor)。

我之前寫過關於 sed 以及它的遠親 ed 的文章。要熟悉 sed,對 ed 有一點了解是有幫助的,因爲這有助於你熟悉緩衝區的概念。本文假定你熟悉 sed 的基本知識,這意味着你至少已經運行過經典的 s/foo/bar 風格的查找和替換命令。

◈ 下載我們的免費 sed 備忘錄

安裝 sed

如果你使用的是 Linux、BSD 或 macOS,那麼它們已經安裝了 GNU 的或 BSD 的 sed。這些是原始 sed 命令的獨特重新實現。雖然它們很相似,但也有一些細微的差別。本文已經在 Linux 和 NetBSD 版本上進行了測試,所以你可以使用你的計算機上找到的任何 sed,但是對於 BSD sed,你必須使用短選項(例如 -n 而不是 --quiet)。

GNU sed 通常被認爲是功能最豐富的 sed,因此無論你是否運行 Linux,你可能都想要嘗試一下。如果在 Ports 樹中找不到 GNU sed(在非 Linux 系統上通常稱爲 gsed),你可以從 GNU 網站 下載源代碼。安裝 GNU sed 的好處是,你可以使用它的額外功能,但是如果需要可移植性,還可以限制它以遵守 sed 的 POSIX 規範。

MacOS 用戶可以在 MacPorts 或 Homebrew 上找到 GNU sed。

在 Windows 上,你可以通過 Chocolatey 來 安裝 GNU sed。

瞭解模式空間和保留空間

sed 一次只能處理一行。因爲它沒有可視化模式,所以會創建一個 模式空間 (pattern space),這是一個內存空間,其中包含來自輸入流的當前行(刪除了尾部的任何換行符)。填充模式空間後,sed 將執行你的指令。當命令執行完時,sed 將模式空間中的內容打印到輸出流,默認是 標準輸出,但是可以將輸出重定向到文件,甚至使用 --in-place=.bak 選項重定向到同一文件。

然後,循環從下一個輸入行再次開始。

爲了在遍歷文件時提供一點靈活性,sed 還提供了保留空間 (hold space)(有時也稱爲 保留緩衝區 (hold buffer)),即 sed 內存中爲臨時數據存儲保留的空間。你可以將保留空間當作剪貼板,實際上,這正是本文所演示的內容:如何使用 sed 複製 / 剪切和粘貼。

首先,創建一個示例文本文件,其內容如下:

Line one
Line three
Line two

複製數據到保留空間

要將內容放置在 sed 的保留空間,使用 h 或 H 命令。小寫的 h 告訴 sed 覆蓋保留空間中的當前內容,而大寫的 H 告訴 sed 將數據追加到保留空間中已經存在的內容之後。

單獨使用,什麼都看不到:

$ sed --quiet -e '/three/ h' example.txt
$

--quiet(縮寫爲 -n)選項禁止顯示所有輸出,但 sed 執行了我的搜索需求。在這種情況下,sed 選擇包含字符串 three 的任何行,並將其複製到保留空間。我沒有告訴 sed 打印任何東西,所以沒有輸出。

從保留空間複製數據

要了解保留空間,你可以從保留空間複製內容,然後使用 g 命令將其放入模式空間,觀察會發生什麼:

$ sed -n -e '/three/h' -e 'g;p' example.txt
Line three
Line three

第一個空白行是因爲當 sed 第一次複製內容到模式空間時,保留空間爲空。

接下來的兩行包含 Line three 是因爲這是從第二行開始的保留空間。

該命令使用兩個唯一的腳本(-e)純粹是爲了幫助提高可讀性和組織性。將步驟劃分爲單獨的腳本可能會很有用,但是從技術上講,以下命令與一個腳本語句一樣有效:

$ sed -n -e '/three/h ; g ; p' example.txt
Line three
Line three

將數據追加到模式空間

G 命令會將一個換行符和保留空間的內容添加到模式空間。

$ sed -n -e '/three/h' -e 'G;p' example.txt
Line one
Line three
Line three
Line two
Line three

此輸出的前兩行同時包含模式空間(Line one)的內容和空的保留空間。接下來的兩行與搜索文本(three)匹配,因此它既包含模式空間又包含保留空間。第三行的保留空間沒有變化,因此在模式空間(Line two)的末尾是保留空間(仍然是 Line three)。

用 sed 剪切和粘貼

現在你知道了如何將字符串從模式空間轉到保留空間並再次返回,你可以設計一個 sed 腳本來複制、刪除,然後在文檔中粘貼一行。例如,將示例文件的 Line three 挪至第三行,sed 可以解決這個問題:

$ sed -n -e '/three/ h' -e '/three/ d' \
-e '/two/ G;p' example.txt
Line one
Line two
Line three

◈ 第一個腳本找到包含字符串 three 的行,並將其從模式空間複製到保留空間,替換當前保留空間中的任何內容。

◈ 第二個腳本刪除包含字符串 three 的任何行。這樣就完成了與文字處理器或文本編輯器中的 剪切 動作等效的功能。

◈ 最後一個腳本找到包含字符串 two 的行,並將保留空間的內容_追加_到模式空間,然後打印模式空間。

任務完成。

使用 sed 編寫腳本

再說一次,使用單獨的腳本語句純粹是爲了視覺和心理上的簡單。剪切和粘貼命令作爲一個腳本同樣有效:

$ sed -n -e '/three/ h ; /three/ d ; /two/ G ; p' example.txt
Line one
Line two
Line three

它甚至可以寫在一個專門的腳本文件中:

#!/usr/bin/sed -nf
/three/h
/three/d
/two/ G
p

要運行該腳本,將其加入可執行權限,然後用示例文件嘗試:

$ chmod +x myscript.sed
$ ./myscript.sed example.txt
Line one
Line two
Line three

當然,你需要解析的文本越可預測,則使用 sed 解決問題越容易。發明 sed 操作(例如複製和粘貼)的 “配方” 通常是不切實際的,因爲觸發操作的條件可能因文件而異。但是,你對 sed 命令的使用越熟練,就越容易根據需要解析的輸入來設計複雜的動作。

重要的事情是識別不同的操作,瞭解 sed 何時移至下一行,並預測模式和保留空間包含的內容。

下載備忘單

sed 很複雜。雖然它只有十幾個命令,但它靈活的語法和原生功能意味着它充滿了無限的潛力。爲了充分利用 sed,我曾經參考過一些巧妙的單行命令,但是直到我開始發明(有時是重新發明)自己的解決方案時,我才覺得自己真正開始學習 sed 了 。如果你正在尋找命令提示和語法方面的有用技巧,下載我們的 sed 備忘單,然後開始一勞永逸地學習 sed!


via: https://opensource.com/article/21/3/sed-cheat-sheet

作者:Seth Kenlon 選題:lujun9972 譯者:MjSeven 校對:wxy

本文由 LCTT 原創編譯,Linux 中國 榮譽推出

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/rGSvmzTiWqgfC1oISsZ8Yg