與 Rust 編譯器的鬥爭 - 4

假設我們有一個整數數組,我們想遍歷偶數。我們可以使用 Iterator::filter() 方法,讓我們嘗試手動實現它,因爲這樣做將使我們對 Rust 的生命週期規則有更深入的瞭解。

代碼如下:

struct Numbers<'a> {
    data: &'a Vec<i32>,
    even_idx: usize,
}

impl<'a> Numbers<'a> {
    pub fn new(data: &'a Vec<i32>) -> Self {
        Self{ data, even_idx: 0 }
    }

    pub fn next_even(&mut self) -> Option<&i32> {
        while let Some(x) = self.get(self.even_idx) {
            self.even_idx += 1;
            if *x % 2 == 0 { return Some(x); }
        }
        None
    }

    fn get(&self, idx: usize) -> Option<&i32> {
        if idx < self.data.len() { 
            Some(&self.data[idx])
        } else {
            None
        }
    }
}

fn main() {
    let xs = vec![1,2,3,4,5,6,7,8,9];
    let mut numbers = Numbers::new(&xs);
    while let Some(x) = numbers.next_even() {
        println!("{}", x);
    }
}

首先,注意 struct Number<'a> 的生命週期說明符'a。這是必需的,因爲 Number 結構體有一個對 vector 的引用,即 data: &'a Vec。換句話說,如果原始數據 Vector 超出作用域,結構體 Number 就不能存在。這在 new(data: &'a Vec) 方法簽名中也很明顯。

這裏的生命週期'a 並不表示 Number 對象本身的生命週期。它是原始 Vector 實例的生命週期!

讓我們看看編譯器對上面的代碼是怎麼說的:

error[E0506]: cannot assign to `self.even_idx` because it is borrowed
  --> src/main.rs:13:13
   |
11 |     pub fn next_even(&mut self) -> Option<&i32> {
   |                      - let's call the lifetime of this reference `'1`
12 |         while let Some(x) = self.get(self.even_idx) {
   |                             ----------------------- `self.even_idx` is borrowed here
13 |             self.even_idx += 1;
   |             ^^^^^^^^^^^^^^^^^^ `self.even_idx` is assigned to here but it was already borrowed
14 |             if *x % 2 == 0 { return Some(x); }
   |                                     ------- returning this value requires that `*self` is borrowed for `'1`

讓我們嘗試從編譯器錯誤消息中理解每個語句。首先,編譯器告訴我們應該假設 & mut self 的生命週期爲'1 ,這是 Number 對象實例本身。如前所述,Number 實例生命週期不是'a,這就是編譯器給它'1 的原因。實際上,用生命週期的名稱會讓代碼更清晰一些,我們將使用與 main() 函數中的變量名相同的生命週期名稱。

let xs = vec![1,2,3,4,5,6,7,8,9];
let mut numbers = Numbers::new(&xs);

也就是說,對於 xs 對象,生命週期名稱爲'xs',對於 numbers 對象,生命週期名稱爲'numbers,這將真正幫助我們理解編譯器消息。

代碼修改如下:

struct Numbers<'xs> {
    data: &'xs Vec<i32>,
    even_idx: usize,
}

impl<'xs> Numbers<'xs> {
    pub fn new(data: &'xs Vec<i32>) -> Self {
        Self{ data, even_idx: 0 }
    }

    pub fn next_even<'numbers>(&'numbers mut self) -> Option<&i32> {
        while let Some(x) = self.get(self.even_idx) {
            self.even_idx += 1;
            if *x % 2 == 0 { return Some(x); }
        }
        None
    }

    fn get<'numbers>(&'numbers self, idx: usize) -> Option<&i32> {
        if idx < self.data.len() { 
            Some(&self.data[idx])
        } else {
            None
        }
    }
}

fn main() {
    let xs = vec![1,2,3,4,5,6,7,8,9];
    let mut numbers = Numbers::new(&xs);
    while let Some(x) = numbers.next_even() {
        println!("{}", x);
    }
}

現在,讓我們再次查看編譯器消息。

error[E0506]: cannot assign to `self.even_idx` because it is borrowed
  --> src/main.rs:40:13
   |
38 |     pub fn next_even<'numbers>(&'numbers mut self) -> Option<&i32> {
   |                      -------- lifetime `'numbers` defined here
39 |         while let Some(x) = self.get(self.even_idx) {
   |                             ----------------------- `self.even_idx` is borrowed here
40 |             self.even_idx += 1;
   |             ^^^^^^^^^^^^^^^^^^ `self.even_idx` is assigned to here but it was already borrowed
41 |             if *x % 2 == 0 { return Some(x); }
   |                                     ------- returning this value requires that `*self` is borrowed for `'numbers`

現在,信息:"'self.even_idx' is borrowed here"是有意義的,因爲我們的 Numbers::get() 方法確實借用了 Numbers 對象本身。由於我們 data 的生命週期爲'xs,因此我們期望返回值的生命週期爲'xs,而不是'numbers。

不知何故,Some(x) 具有'numbers 而不是'xs 的生命週期。爲什麼會這樣?跟蹤 x 的來源,我們看到它來自我們的方法 Numbers::get()。這是否意味着該方法返回 Option<&'numbers i32 > 而不是 Option<&'xs i32>?讓我們顯式地指定方法 next_even() 和 get() 返回的生命週期:

pub fn next_even<'numbers>(&'numbers mut self) -> Option<&'xs i32> {
    while let Some(x) = self.get(self.even_idx) {
        self.even_idx += 1;
        if *x % 2 == 0 { return Some(x); }
    }
    None
}

fn get<'numbers>(&'numbers self, idx: usize) -> Option<&'xs i32> {
    if idx < self.data.len() { 
        Some(&self.data[idx])
    } else {
        None
    }
}

驚喜!有了這個最後的更改,編譯就成功了,我們得到了預期的結果。那麼,根本原因是什麼?這是因爲省略生命週期導致的,基本上,如果 Rust 可以推斷出合理的生命週期,那麼生命週期規範可以被省略。不幸的是,這並不總是有效的。在我們的 get() 方法中,只有一個輸入參數 & self 有生命週期,所以它的輸出 Option<&i32> 被假定爲與輸入具有相同的生命週期,即'numbers 而不是'xs,這就是問題的根源。

總結

1,結構體的生命週期參數與它的實例存在多長時間無關。

2,省略生命週期有時會引入歧義或意外錯誤。


本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/QZaiSf3ngfAl412dhdePbw