Python 列表解析式到底該怎麼用?

Python 是一種極其多樣化和強大的編程語言!當需要解決一個問題時,它有着不同的方法。在本文中,將會展示列表解析式(List Comprehension)。我們將討論如何使用它?什麼時候該或不該使用它?

列表解析式的優勢

如何在 Python 中創建列表

列表解析式是一種基於現有列表創建列表的語法結構。讓我們來看看創建列表的不同實現

循環

循環是創建列表的傳統方式。不管你使用什麼樣的循環。要以這種方式創建列表,您應該:

  1. 實例化一個空列表。

  2. 循環遍歷一個可迭代的(如 range)的元素。

  3. 將每個元素附加到列表的末尾。

numbers = []
for number in range(10):
    numbers.append(number)
    
print(numbers)

輸出:

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

在此示例中,您實例化了一個空列表 numbers。然後使用 for 循環迭代 range(10) 並使用 append() 方法將每個數字附加到列表的末尾。

map() 對象

map() 是創建列表的另一種方法。您需要向 map() 傳遞一個函數和一個可迭代對象,之後它會創建一個對象。該對象包含使用指定函數執行每個迭代元素所獲得的輸出。

例如,我們將呈現在某些產品的價格中增加增值稅的任務。

VAT_PERCENT = 0.1  # 10%


def add_vat(price):
    return price + (price * VAT_PERCENT)
    

prices = [10.03, 8.6, 32.85, 41.5, 22.64]
grand_prices = map(add_vat, prices)
print(grand_prices)
grand_prices = list(grand_prices)
print(grand_prices)

您已經構建了 add_vat() 函數並創建了 prices 可迭代對象。您將這兩個參數都傳遞給 map() 並收集生成的 map 對象 grand_prices,或者您可以使用 list() 輕鬆地將其轉換爲列表。

輸出:

<map object at 0x7f18721e7400>  # map(add_vat, prices)
[11.03, 9.46, 36.14, 45.65, 24.9]  # list(grand_prices)

列表解析式

現在,讓我們看一下列表解析式方法!這確實是 Python 風格,並且是創建列表的更好方法。爲了弄清楚這種方法有多強大,我們用一個單行代碼來重寫那個循環示例。

numbers = [number for number in range(10)]
print(numbers)

輸出

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

正如您所見,這是一種不可思議的方法!列表解析式看起來足夠可讀,您不需要編寫更多代碼,而只需一行。

爲了更好地理解列表,請查看以下語法格式:

new_list = [expression for member in iterable]

哪種方法更有效

好的,我們已經學習瞭如何使用循環、map() 和列表解析式來創建列表,在您的腦海中可能會提出 “哪種方法更有效” 的問題。我們來分析一下吧!

import random
import timeit


VAT_PERCENT = 0.1
PRICES = [random.randrange(100) for x in range(100000)]


def add_vat(price):
    return price + (price * VAT_PERCENT)
    

def get_grand_prices_with_map():
    return list(map(add_vat, PRICES))
    

def get_grand_prices_with_comprehension():
    return [add_vat(price) for price in PRICES]
    

def get_grand_prices_with_loop():
    grand_prices = []
    for price in PRICES:
        grand_prices.append(add_vat(price))
    return grand_prices
    

print(timeit.timeit(get_grand_prices_with_map, number=100))
print(timeit.timeit(add_grand_prices_with_comprehension, number=100))
print(timeit.timeit(get_grand_prices_with_loop, number=100))

輸出:

0.9833468980004909  # with_map
1.197223742999995   # with_comprehension
1.3564663889992516  # with_loop

正如我們現在所看到的,創建列表的最優的方法是 map(),排在第二位的是列表解析式,最後是循環

但是,方法的選擇應取決於您想要實現的目標。

  • 使用 map() 可以使你的代碼更高效。

  • 使用循環可以使代碼的思路展現更加清晰。

  • 使用列表解析式可以您使代碼更加緊湊,且較高效。這是創建列表的最佳方式,因爲這種方式可讀性最強。

高級解析式

條件邏輯

早些時候,我向您展示了這個公式:

new_list = [expression for member in iterable]

公式可能有些不完整。對解析式的更加完整描述增加了對可選條件的支持。將條件邏輯添加到列表解析式的最常見方法是在表達式的末尾添加條件:

new_list = [expression for member in iterable (if conditional)]

在這裏,您的條件語句正好位於右邊的括號中。

條件很重要,因爲它們允許列表解析式過濾掉不需要的值,這在一般情況下也可以調用 filter()

numbers = [number for number in range(20) if number % 2 == 0]
print(numbers)

輸出:

[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]

正如您所看到的那樣,這個解析式收集了可被 2 整除且沒有餘數的數字。

如果您需要更復雜的過濾器,那麼您甚至可以將條件邏輯移動到單獨的函數中。

def is_prime(number):
    if number > 1:
        for el in range(2, int(number/2)+1):
            if (number % el) == 0:
                return False 
        else:
            return True
          

numbers = [number for number in range(20) if is_prime(number)]
print(numbers)

輸出:

[2, 3, 5, 7, 11, 13, 17, 19]

您構建 is_prime(number) 以確定是否是素數並返回布爾值。接下來,您應該將函數添加到解析式的條件中。

該公式允許您使用條件邏輯從幾個可能的輸出選項中進行選擇。例如,您有一個產品價格表,若有負數,您應將其轉換爲正數:

price_list = [1.34, 19.01, -4.2, 6, 8.78, -1,1]
normalized_price_list = [price if price > 0 else price*-1 for price in price_list]
print(normalized_price_list)

輸出:

[1.34, 19.01, 4.2, 6, 8.78, 1,1]

在這裏,您的表達式 price 有一個條件語句,如果 price > 0 else price*-1。這會告訴 Python,如果價格爲正,則輸出價格值;但如果價格爲負,則將價格轉換爲正值。該功能很強大,考慮將條件邏輯視爲其自身的函數的確是很有用的:

def normalize_price(price):
    return price if price > 0 else price*-1
    

price_list = [1.34, 19.01, -4.2, 6, 8.78, -1,1]
normalized_price_list = [normalize_price(price) for price in price_list]
print(normalized_price_list)

輸出:

[1.34, 19.01, 4.2, 6, 8.78, 1,1]

集合解析式

您還可以創建一個集合解析式!它基本與列表解析式相同。不同之處在於集合解析式不包含重複項。您可以通過使用花括號取代方括號來創建集合解析式:

string = "Excellent"
unique_string = {letter for letter in string}
print(unique_string)

輸出:

{"E""e""n""t""x""c""l"}

你的集合解析式只包含唯一的字母。這與列表不同,集合不保證項目將以特定順序存儲數據。這就是爲什麼集合輸出的第二個字母是 e,即使字符串中的第二個字母是 x

字典解析式

字典解析式也是是類似的,但需要定義一個

string = "Words are but wind"
word_order = {el: ind+1 for ind, el in enumerate(string.split())}
print(word_order)

輸出:

{"Words": 1, "are": 2, "but": 3, "wind": 4}

要創建 word_order 字典,請在表達式中使用花括號 ({}) 以及鍵值對 (el: ind+1)。

海象運算符

Python 3.8 中引入的海象運算符允許您一次解決兩個問題:爲變量賦值,返回該值。

假設您需要對將返回溫度數據的 API 應用十次。您想要的只是 100 華氏度以上的結果。而每個請求可能都會返回不同的數據。在這種情況下,沒有辦法在 Python 中使用列表解析式來解決問題。可迭代成員(如果有條件)的公式表達式無法讓條件將數據分配給表達式可以訪問的變量。

海象運算符解決了這個問題。它允許您在執行表達式的同時將輸出值分配給變量。以下示例顯示了這是如何實現的,使用 get_weather_data() 生成僞天氣數據:

import random


def get_weather_data():
    return random.randrange(90, 110)
    

hot_temps = [temp for item in range(20) if (temp := get_weather_data()) >= 100]
print(hot_temps)

輸出:

[108, 100, 106, 103, 108, 106, 103, 104, 109, 106]

什麼時候不要使用解析式

列表解析式非常有用,它可以幫助您編寫清晰且易於閱讀和調試的代碼。但在某些情況下,它們可能會使您的代碼運行速度變慢或使用更多內存。如果它讓您的代碼效率更低或更難理解,那麼可以考慮選擇另一種方式。

注意嵌套的解析式

可以通過嵌套解析式以創建列表、字典和集合的組合集合譯者注:這個集合不是指 set 對象類型,而是 collection,泛指容器)。例如,假設一家公司正在跟蹤一年中五個不同城市的收入。存儲這些數據的完美數據結構可以是嵌套在字典解析式中的列表解析式

cities = ['New York''Oklahoma''Toronto''Los Angeles''Miami']
budgets = {city: [for x in range(12)] for city in cities}
print(budgets)

輸出:

{
    "NewYork"[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
    "Oklahoma"[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
    "Toronto"[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
    "LosAngeles"[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
    "Miami"[0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
}

您使用字典解析式創建了 budgets 容器。該表達式是一個鍵值對,其中包含另一個解析式。此代碼將快速生成城市中每個 city 的數據列表。

嵌套列表是創建矩陣的常用方法,通常用於數學目的。查看下面的代碼塊:

matrix = [[for x in range(7)] for y in range(6)]
print(matrix)

輸出:

[
    [0, 1, 2, 3, 4, 5, 6],
    [0, 1, 2, 3, 4, 5, 6],
    [0, 1, 2, 3, 4, 5, 6],
    [0, 1, 2, 3, 4, 5, 6],
    [0, 1, 2, 3, 4, 5, 6],
    [0, 1, 2, 3, 4, 5, 6]
]

外部列表解析式 [... for y in range(6)] 創建了六行,而內部列表解析式 [x for x in range(7)] 將用值填充這些行中的每一行。

到目前爲止,每個嵌套解析式的目標都是真正且直觀的。但是,還有一些其他情況,例如創建扁平化的嵌套列表,其中的邏輯可以使您的代碼非常難以閱讀。讓我們看下面的例子,使用嵌套列表解析式來展平一個矩陣:

matrix = [
    [0, 1, 0],
    [1, 0, 1],
    [2, 1, 2],
]
flat = [num for row in matrix for num in row]
print(flat)

輸出:

[0, 1, 0, 1, 0, 1, 2, 1, 2]

扁平化矩陣的代碼確實很簡潔,但是太難理解了,您應該花點時間弄清楚它是如何工作的。另一方面,如果您使用 for 循環來展平相同的矩陣,那麼您的代碼將更加簡單易讀:

matrix = [
    [0, 1, 0],
    [1, 0, 1],
    [2, 1, 2],
]
flat = []
for row in matrix:
    for num in row:
        flat.append(num)
print(flat)

輸出:

[0, 1, 0, 1, 0, 1, 2, 1, 2]

現在,您可以看到代碼一次遍歷矩陣的一行,在移動到下一行之前取出該行中的所有元素。

雖然嵌套列表解析式可能看起來更具有 Python 風格,但對於能夠編寫出您的團隊可以輕鬆理解和修改的代碼來纔是更加最重要的。當選擇一個方法時,您應該根據解析式是有助於還是有損於可讀性來做出相應的判斷。

爲大型數據集使用生成器

Python 中的列表解析式通過將整個列表存儲到內存中來工作。對於小型至中型列表這通常很好。如果您想將前一千個整數相加,那麼列表解析式將輕鬆地解決此任務:

summary = sum([for x in range(1000)])
print(summary)

輸出:499500

但是,如果您需要對十億個數字求和呢?您可以嘗試執行此操作,但您的計算機可能不會有響應。這是可能因爲計算機中分配大量內存。也許您是因爲計算機沒有如此多的內存資源。

例如,你想要一些第一個十億整數,那麼讓我們使用生成器!這可能多需要一些時間,但計算機應該可以克服它:

summary = sum((for x in range(1000000000)))
print(summary)

輸出:

499999999500000000

讓我們來對比一下哪種方法是更優的!

import timeit


def get_sum_with_map():
    return sum(map(lambda x: x, range(1000000000)))


def get_sum_with_generator():
    return sum((for x in range(1000000000)))


print(timeit.timeit(get_sum_with_map, number=100))
print(timeit.timeit(get_sum_with_generator, number=100))

輸出:

4940.844053814  # get_sum_with_map
3464.1995523349997  # get_sum_with_generator

正如您所見,生成器比 map() 高效得多。

總結

本文向您介紹了列表解析式,以及如何使用它來解決複雜的任務,而不會使您的代碼變得過於困難。

現在你:

感謝您閱讀本文直到結束!如果這篇文章有幫助,請發表評論,記得點擊 “關注” 確保你不會錯過我的文章!你的活動是我的快樂!祝你好運!

鏈接:https://blog.devgenius.io/is-list-comprehension-the-most-effective-way-to-solve-any-tasks-python-b6bb3f5391fa#:~:text=compact%20yet%20optimized.-,Advance%20Level%20of%20a%20Comprehension,-Conditionals%20Logic

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/ndmIgNGN6eBsoF4Y1CeaFg