Rust 生命週期 (Lifetime)
介紹(幹話)
- 變數 從出生到死亡的時間段
fn main () { let x = Box::new(5); // x 出生 println!("{:?}", x); { let y = Box::new(1); // y 出生 println!("{:?}", y); } // y 死亡 // cannot find value `y` in this scope // y 死掉了,所以你存取不到他 println!("{:?}", y); } // x 死亡
Borrow checker
- 編譯器的機制
- 會檢查借用者的生命週期會不會活的比擁有者久
- 為了避免 null pointer 發生,就是擁有者已經死了,Value 已經被銷毀了,但借用者還活著,就會存取到不存在的東西
#[allow(unused_variables, unused_assignments)] fn main () { let x; // x 出生 { let y = Box::new(1); // y 出生 x = &y; // x 借用 y 的所有權 println!("{:?}", y); } // y 死亡 // `y` does not live long enough // y 死掉了,所以 x 存取不到他 (1編譯器:可憐的 y 他活的不夠久 owo) println!("{:?}", x); } // x 死亡
生命週期標示
- 在名字前面加個
',就是生命週期的標示 - 以剛剛的例子來說
fn main () { test(); } // 生命週期標示,必須像泛型一樣,在 function 簽名中先被宣告 fn test<'a, 'b> () { let x: &'a i32 = &5; // 'a 開始 println!("{:?}", x); { let y: &'b i32 = &2; // 'b 開始 println!("{:?}", y); } // 'b 結束 } // 'a 結束
- 不必要標生命週期的情況
#[derive(Debug)] struct Person { age: i32 } // 因為 傳入值 與 回傳值 只有一個 // 不會造成編譯器需要檢查生命週期的問題 // 所以沒有必要標示生命週期 fn life_again_gun (y: &mut Person) -> &mut Person { y.age = 0; y } fn main () { let mut x = Person { age: 16 }; let y = life_again_gun(&mut x); println!("{:?}", y); }
- 必須要標生命週期的情況
#[derive(Debug)] struct Person { age: i32 } // missing lifetime specifier // 因為編譯器看不出回傳的 借用者 是不是會超過 擁有者 的 lifetime // 所以要求你編上 lifetime fn the_older (x: &Person, y: &Person) -> &Person { if x.age > y.age { x } else { y } } fn main () { } #[derive(Debug)] struct Person { age: i32 } // 我們預期這裡只會有一種生命週期 fn the_older<'a> (x: &'a Person, y: &'a Person) -> &'a Person { if x.age > y.age { x } else { y } } fn main () { let x = Person { age: 16 }; let y = Person { age: 17 }; let res = the_older(&x, &y); println!("{:?}", res) }
- 指定多個生命週期,並標示哪個生命週期比較長
#[derive(Debug)] struct Person { age: i32 } // 我們有兩個生命週期 'a 與 'b,其中 'b 活的比 'a 久 fn the_older<'a, 'b: 'a> (x: &'a Person, y: &'b Person) -> &'a Person { if x.age > y.age { x } else { y } } fn main () { let x = Person { age: 16 }; let res; { let y = Person { age: 17 }; res = the_older(&x, &y); println!("{:?}", res); } }
NLL (Non-Lexical-Lifetime)
Lexical-Lifetime
- 是指說生命週期與變數的作用域是綁定在一起的
- 舉個例子
#[derive(Debug)] struct Person { age: i32 } fn birthday (y: &mut Person) { y.age = y.age + 1; } fn life_again_gun (y: &mut Person) -> &mut Person { y.age = 0; y } fn main () { let mut x = Person { age: 16 }; let y = life_again_gun(&mut x); // 在 Lexical-Lifetime 的情況,y 的生命週期沒有結束 // 所以 y 還在進行可變借用 // 那理論上 x 就不可以再度可變出借 // (NLL 好像已經是標準了,所以我無法實現 LL 的編譯錯誤) birthday(&mut x); println!("{:?}", x); }
Non-Lexical-Lifetime
- borrow checker 的分析結構方式從 AST 轉向 MIR
- AST 是抽象語法樹,它會以樹狀的形式表現程式語言的語法結構,因為舊的 borrow checker 用 AST 做分析,所以會造成生命週期與作用域掛鉤
- MIR 是中間表達式,他在編譯器內部會有像是流程圖的資料結構,用流程控制的方式去分析生命週期
- 只要變數在後面的程式碼中,沒有機會被使用到,就會提早被結束生命週期
- NLL 將作用域與生命週期拆開來看了
- NLL 縮短了過長的生命週期 (縮減了變數的生命),讓程式不會充滿一堆 block 去迴避 LL 造成的問題
- 舉例來說
#[derive(Debug)] struct Person { age: i32 } fn birthday (y: &mut Person) { y.age = y.age + 1; } fn life_again_gun (y: &mut Person) -> &mut Person { y.age = 0; y } fn main () { let mut x = Person { age: 16 }; let y = life_again_gun(&mut x); // 在 Non-Lexical-Lifetime 的情況 // y 在這段程式碼的後面都沒有被使用到 // y 的生命週期就結束了 // 那這裡就不會有問題 birthday(&mut x); println!("{:?}", x); }
#[derive(Debug)] struct Person { age: i32 } fn birthday (y: &mut Person) { y.age = y.age + 1; } fn life_again_gun (y: &mut Person) -> &mut Person { y.age = 0; y } fn main () { let mut x = Person { age: 16 }; let y = life_again_gun(&mut x); // cannot borrow `x` as mutable more than once at a time // 但如果 y 在後面有機會被使用到 // 就代表 y 的生命週期還沒有結束 // 所以 x 不可以再度進行可變出借 birthday(&mut x); y.age = 16; println!("{:?}", x); }
Borrow 的存活時間
出處: https://ithelp.ithome.com.tw/articles/10200106
Rust 有個重要的功能叫 borrow checker ,它除了檢查在上一篇提到的規則外,還檢查使用者會不會使用到懸空參照 (dangling reference) ,懸空參照是在電腦世界中一種現象: 如果你今天把一個變數借給別人,實際上借走的人只是知道我可以去哪裡找到這個別人借我的東西而已,那個東西的擁有者還是你本人,以現實世界做比喻的話,這像是借別人東西只是把放那個東西的儲物櫃位置,以及鑰匙暫時的交給別人而已,送別人東西則是直接把儲物櫃的擁有者變成他。
所以如果今天發生了一種情況,你把東西借給別人後,管理每個儲物櫃擁有者的系統馬上把你的使用權收回去呢?會發生什麼事,這沒人說的準,可能儲物櫃還沒被清空,你還是可以拿到借來的東西,或是馬上又換了主人,你已經不是拿到原本的東西了,就像以下的程式碼:
#![allow(unused)] fn main() { fn foo() ->&i32 { // 這個變數在離開這個範圍後就消失了 let a = 42; // 但是這邊卻回傳了 borrow &a } }
上面這段 code 是無法編譯的。
為瞭解決這樣的一個問題, Rust 提出來的就是 lifetime 的觀念,只要函式的參數或回傳值有 borrow 出現,使用者就要幫 borrow 標上 lifetime ,標記後讓編譯器可以去追蹤每個變數借出去與釋放掉的情況,確保不會有釋放掉已經出借的變數的可能性。
Rust 使用 'a 一個單引號加上一個識別字當作 lifetime 的標記,所以這些都是可以的 'b, 'foo, '_bar ,此外有兩個保留用作特殊用途的 lifetime: 'static 和 '_:
'static: 這代表這是個整個程式都有效的 borrow 比如字串常數"foo"它的 lifetime 就是'static'_:這是保留給 Rust 2018 使用的,這裡先不提它的功能
這邊是個加上 lifetime 標記後的範例:
#![allow(unused)] fn main() { fn foo<'a>(a: &'a i32) -> &'a i32 { a } }
其中我們必須在函式名稱後加上 <> 並在其中宣告我們的 lifetime ,接著把 borrow 的 & 後都加上我們的 lifetime 標記,但事實上在上一篇文章中,我們完全沒用使用到 lifetime , Rust 可以在某些情況下自動推導出正確的 lifetime ,使得實際上需要手動標註的情況並不多,最有可能遇到的情況是一個函式同時使用了兩個 borrow :
fn max<'a>(a: &'a i32, b: &'a i32) -> &'a i32 { if a > b { a } else { b } } fn main() { let a = 3; let m = &a; { let b = 2; let n = &b; // 對於 max 來說, m 與 n 同時存活的這個範圍就是 'a , // 而回傳值也可以在這個範圍內使用 println!("{}", max(m, n)); } // b 與 n 會在這邊消失 } // a 與 m 會在這邊消失
這種情況編譯器因為看到了兩個 borrow ,於是沒辦法猜出來回傳的值應該要跟哪個 lifetime 一樣,這邊的作法就是全部都標記一樣的 lifetime ,讓 Rust 知道說我們的變數都會存活在同一個範圍內,同時回傳值也可以在同樣的範圍存活。
大部份的情況下編譯器都能自動的推導,所以需要手動標註的情況其實不多,通常是先嘗試讓編譯器做推導,如果編譯器報錯了才來想辦法標註。
lifetime 還有個用途是用來限制使用者傳入的參數必須是常數:
#![allow(unused)] fn main() { fn print_message(message: &'static str) { println!("{}", message); } }
這個函式就只能接受如 "Hello" 這樣的常數了,雖說只是偶爾會有這樣的需求。
Lifetime Elision (Lifetime 省略規則) (進階)
這部份大概的瞭解一下就好了
- 所有的 borrow 都會自動的分配一個 lifetime
#![allow(unused)] fn main() { fn foo(a: &i32, b: &i32); fn foo<'a, 'b>(a: &'a i32, b: &'b i32); // 推導結果 }
- 如果函式只有一個 borrow 的參數,則它的 lifetime 會自動被應用到回傳值上
#![allow(unused)] fn main() { fn foo(a: &i32); fn foo<'a>(a: &'a i32) -> &'a i32; // 推導結果 }
- 如果有多個 borrow ,但其中一個是
self,則self的 lifetime 會被應用在回傳值
#![allow(unused)] fn main() { impl Foo { fn method(&self, a: &i32) -> &Self { } } // 推導結果 impl Foo { fn method<'a, 'b>(&'a self, b: &'b i32) -> &'a Self { } } }
若不符合上面任一條規則,則必須要標註型態。
如果我們把以上的規則套用在上面的範例 max 上:
#![allow(unused)] fn main() { fn max(a: &i32, b: &i32) -> &i32 { if a > b { a } else { b } } }
套用規則 1 :
#![allow(unused)] fn main() { fn max<'a, 'b>(a: &'a, i32, b: &'b i32) -> &i32 { if a > b { a } else { b } } }
到這邊結束,編譯器已經沒有可用的規則了,但是回傳值的 lifetime 依然是未知,於是就編譯失敗。
https://buckychu.im/2022/10/05/rust-lifetime/
Rust 的生命週期
今天我們要來介紹其他程式語言中比較少見的機制,但是在 Rust 中是屬於和參考(reference)有關的機制,那就是生命週期(lifetime)。
一、生命週期的概念
生命週期是 Rust 中的一個概念,它是一個變數的有效範圍,也就是它可以被使用的範圍。生命週期的概念是為瞭解決 Rust 中的參考的問題,因為參考是 Rust 中的一個重要機制,它可以讓開發者在不需要複製資料的情況下,就可以使用資料。但是參考也有一個問題,就是它的生命週期,也就是它的有效範圍,如果參考的資料已經被釋放了,那麼參考就會變成一個無效的參考,這樣就會造成程式的錯誤。
這裡有一個範例:
#![allow(unused)] fn main() { { let r; { let x = 5; r = &x; } println!("r: {}", r); } }
先說結論,這個範例是沒辦法通過編譯的,也就是會報錯。 這是因為我們先宣告了一個變數 r,然後我們在一個新的區塊中宣告了一個變數 x,並且將 x 的參考賦值給 r。 這個時候,x 的生命週期就結束了,但是 r 仍然使用 x 的參考,這樣就會造成程式的錯誤。
二、生命週期的標記
- 生命週期的標記不會改變參考的生命週期,它只是用來標記參考的生命週期,讓 Rust 編譯器可以知道這個參考的生命週期是多少。
- 當指定了泛型生命週期參數後,函式就可以接收帶有任何生命週期的參考。
在語法上有以下幾個重點:
- 生命週期參數名稱:
- 以單引號
'開頭 - 一般以全部小寫字母命名
- 大部分的慣例都使用
'a作為生命週期參數名稱
- 以單引號
- 生命週期標記的位置:
- 在參考的
&符號之後 - 使用空格將生命週期與參考分開
- 在參考的
看一下以下的範例:
#![allow(unused)] fn main() { RUST &i32 // 一個參考 &'a i32 // 一個有顯式生命週期的參考 &'a mut i32 // 一個有顯式生命週期的可變參考 }
單一個生命週期標記是沒有意義的,這是因為標記生命週期是為了要讓 Rust 編譯器知道多個參考的生命週期之間的關係,所以如果只有一個參考,那麼就沒有必要標記生命週期。
以下是一個範例:
#![allow(unused)] fn main() { fn longer<'a>(s1: &'a str, s2: &'a str) -> &'a str { if s2.len() > s1.len() { s2 } else { s1 } } }
這個函式接收兩個參考,並且回傳一個參考,這個函式的生命週期參數名稱是 'a,這個生命週期參數名稱被用在了函式的參數與回傳值上,這樣就可以讓 Rust 編譯器知道這三個參考的生命週期是相同的。
最後在執行這個函式的時候就不會問題,並且可以正常執行:
fn main() { let r; { let s1 = "rust"; let s2 = "ecmascript"; r = longer(s1, s2); println!("{} is longer", r); // ecmascript is longer } }
三、生命週期的規則
在 Rust 中,生命週期的規則有三個:
- 每個參考都有一個生命週期
- 每個參考都有一個作用域
- 一個參考的生命週期不能超過它的作用域
總結
Rust 的生命週期跟所有權,兩者在其語言中的資源管理機制上都是非常重要的。由於參考是 Rust 在對於複雜類型中不可少的機制,而每個參考都有其生命週期,這是為了決定該參考是否有效的作用域。
前面有提到 Rust 的型別大多數其實都可以自動判別,而生命週期其實也一樣,都是可以自動推導出來。不過當生命週期以不同方式互相牽連的狀態下,開發者就要自行設定,這也跟型別非常複雜的狀態下,開發者就要自行設定型別一樣。
以上就是 Rust 的生命週期的基本概念,希望大家對 Rust 又更瞭解了一些。
fn example<'a, 'b>(x: &'a str, y: &'b str) -> &'a str where 'b: 'a // 'b lives at least as long as 'a 添加了 where 'b: 'a 約束,確保 'b 的生命週期至少與 'a 一樣長 { if x.len() > y.len() { x } else { y } } fn main() { let x = String::from("hello"); let y = String::from("world"); let x_ref: &str = &x; let y_ref: &str = &y; let result = example(x_ref, y_ref); println!("Result: {}", result); println!("x content address: {:p}", x.as_ptr()); println!("y content address: {:p}", y.as_ptr()); println!("result content address: {:p}", result.as_ptr()); }