Go 與 C 的指針

C 和 Go 都是有指針概念的語言，這篇文章主要借這兩者之間的異同來加深對 Go 指針的理解和使用。

運算符

C 和 Go 都相同：

& 運算符取出變量所在的內存地址
* 運算符取出指針變量所指向的內存地址裏面的值，也叫 “ 解引用 ”

C 語言版示例：

#include <stdio.h>

int main()
{
    int bar = 1;
    // 聲明一個指向 int 類型的值的指針
    int *ptr;
    // 通過 & 取出 bar 變量所在的內存地址並賦值給 ptr 指針
    ptr = &bar;
    // 打印 ptr 的值（爲地址），*prt 表示取出指針變量所指向的內存地址裏面的值
    printf("%p %d\n", ptr, *ptr);
    return (0);
}

// 輸出結果：
// 0x7ffd5471ee54 1

Go 語言版示例：

package main

import "fmt"

func main() {
 bar := 1
 // 聲明一個指向 int 類型的值的指針
 var ptr *int
 // 通過 & 取出 bar 變量所在的內存地址並賦值給 ptr 指針
 ptr = &bar
 // 打印 ptr 變量儲存的指針地址，*prt 表示取出指針變量所指向的內存地址裏面的值
 fmt.Printf("%p %d\n", ptr, *ptr)
}

// 輸出結果：
// 0xc000086020 1

Go 還可以使用 new 關鍵字來分配內存創建指定類型的指針。

 // 聲明一個指向 int 類型的值的指針
 // var ptr *int
 ptr := new(int)
 // 通過 & 取出 bar 變量所在的內存地址並賦值給 ptr 指針
 ptr = &bar

數組名和數組首地址

對於一個數組

// C
int arr[5] = {1, 2, 3, 4, 5};
// Go
// 需要指定長度，否則類型爲切片
arr := [5]int{1, 2, 3, 4, 5}

在 C 中，數組名 arr 代表的是數組首元素的地址，相當於 &arr[0]

而 &arr 代表的是整個數組 arr 的首地址

// C
// arr 數組名代表數組首元素的地址
printf("arr -> %p\n", arr);
// &arr[0] 代表數組首元素的地址
printf("&arr[0] -> %p\n", &arr[0]);
// &arr 代表整個數組 arr 的首地址
printf("&arr -> %p\n", &arr);

// 輸出結果：
// arr -> 0061FF0C
// &arr[0] -> 0061FF0C
// &arr -> 0061FF0C

運行程序可以發現 arr 和 &arr 的輸出值是相同的，但是它們的意義完全不同。

首先數組名 arr 作爲一個標識符，是 arr[0] 的地址，從 &arr[0] 的角度去看就是一個指向 int 類型的值的指針。

而 &arr 是一個指向 int[5] 類型的值的指針。

可以進一步對其進行指針偏移驗證

// C
// 指針偏移
printf("arr+1 -> %p\n", arr + 1);
printf("&arr+1 -> %p\n", &arr + 1);

// 輸出結果：
// arr+1 -> 0061FF10
// &arr+1 -> 0061FF20

這裏涉及到偏移量的知識：一個類型爲 T 的指針的移動，是以 sizeof(T) 爲移動單位的。

arr+1 : arr 是一個指向 int 類型的值的指針，因此偏移量爲 1*sizeof(int)
&arr+1 : &arr 是一個指向 int[5] 的指針，它的偏移量爲 1*sizeof(int)*5

到這裏相信你應該可以理解 C 語言中的 arr 和 &arr 的區別了吧，接下來看看 Go 語言

// 嘗試將數組名 arr 作爲地址輸出
fmt.Printf("arr -> %p\n", arr)
fmt.Printf("&arr[0] -> %p\n", &arr[0])
fmt.Printf("&arr -> %p\n", &arr)

// 輸出結果：
// arr -> %!p([5]int=[1 2 3 4 5])
// &arr[0] -> 0xc00000c300
// &arr -> 0xc00000c300

&arr[0] 和 &arr 與 C 語言一致。

但是數組名 arr 在 Go 中已經不是數組首元素的地址了，代表的是整個數組的值，所以輸出時會提示 %!p([5]int=[1 2 3 4 5])

指針運算

指針本質上就是一個無符號整數，代表了內存地址。

指針和整數值可以進行加減法運算，比如上文的指針偏移例子：

加n : 一個類型爲 T 的指針，以 n*sizeof(T) 爲單位向高位移動。
減n : 一個類型爲 T 的指針，以 n*sizeof(T) 爲單位向低位移動。

其中 sizeof(T) 代表的是數據類型佔據的字節，比如 int 在 32 位環境下爲 4 字節，64 位環境下爲 8 字節

C 語言示例：

#include <stdio.h>

int main()
{
    int arr[] = {1, 2, 3, 4, 5};
    // ptr 是一個指針，爲 arr 數組的第一個元素地址
    int *ptr = arr;
    printf("%p %d\n", ptr, *ptr);

    // ptr 指針向高位移動一個單位，移向到 arr 數組第二個元素地址
    ptr++;
    printf("%p %d\n", ptr, *ptr);
    return (0);
}

// 輸出結果：
// 0061FF08 1
// 0061FF0C 2

在這裏 ptr++ 從 0061FF08 移動了 sizeof(int) = 4 個字節到 0061FF0C ，指向了下一個數組元素的地址

Go 語言示例：

package main

import "fmt"

func main() {
 arr := [5]uint32{1, 2, 3, 4, 5}

 // ptr 是一個指針，爲 arr 數組的第一個元素地址
 ptr := &arr[0]
 fmt.Println(ptr, *ptr)

 // ptr 指針向高位移動一個單位，移向到 arr 數組第二個元素地址
 ptr++
 fmt.Println(ptr, *ptr)
}

// 輸出結果：
// 編譯報錯：
// .\main.go:13:5: invalid operation: ptr++ (non-numeric type *uint32)

編譯報錯 *uint32 非數字類型，不支持運算，說明 Go 是不支持指針運算的。

這個其實在 Go Wiki[1] 中的 Go 從 C++ 過渡文檔中有提到過：Go has pointers but not pointer arithmetic.

Go 有指針但不支持指針運算。

另闢蹊徑

那還有其他辦法嗎？答案當然是有的。

在 Go 標準庫中提供了一個 unsafe 包用於編譯階段繞過 Go 語言的類型系統，直接操作內存。

我們可以利用 unsafe 包來實現指針運算。

func Alignof(x ArbitraryType) uintptr
func Offsetof(x ArbitraryType) uintptr
func Sizeof(x ArbitraryType) uintptr
type ArbitraryType
func Slice(ptr *ArbitraryType, len IntegerType) []ArbitraryType
type IntegerType
type Pointer
func Add(ptr Pointer, len IntegerType) Pointer

核心介紹：

uintptr : Go 的內置類型。是一個無符號整數，用來存儲地址，支持數學運算。常與 unsafe.Pointer 配合做指針運算
unsafe.Pointer : 表示指向任意類型的指針，可以和任何類型的指針互相轉換（類似 C 語言中的 void* 類型的指針），也可以和 uintptr 互相轉換
unsafe.Sizeof : 返回操作數在內存中的字節大小，參數可以是任意類型的表達式，例如 fmt.Println(unsafe.Sizeof(uint32(0))) 的結果爲 4
unsafe.Offsetof : 函數的參數必須是一個字段 x.f，然後返回 f 字段相對於 x 起始地址的偏移量，用於計算結構體成員的偏移量

原理：

Go 的 uintptr 類型存儲的是地址，且支持數學運算

*T (任意指針類型) 和 unsafe.Pointer 不能運算，但是 unsafe.Pointer 可以和 *T 、 uintptr 互相轉換

因此，將 *T 轉換爲 unsafe.Pointer 後再轉換爲 uintptr ，uintptr 進行運算之後重新轉換爲 unsafe.Pointer => *T 即可

代碼實現：

package main

import (
 "fmt"
 "unsafe"
)

func main() {
 arr := [5]uint32{1, 2, 3, 4, 5}

 ptr := &arr[0]

 // ptr(*uint32類型) => one(unsafe.Pointer類型)
 one := unsafe.Pointer(ptr)
 // one(unsafe.Pointer類型) => *uint32
 fmt.Println(one, *(*uint32)(one))

 // one(unsafe.Pointer類型) => one(uintptr類型) 後向高位移動 unsafe.Sizeof(arr[0]) = 4 字節
 // twoUintptr := uintptr(one) + unsafe.Sizeof(arr[0])
 // ！！twoUintptr 不能作爲臨時變量
 // uintptr 類型的臨時變量只是一個無符號整數，並不知道它是一個指針地址，可能被 GC
 // 運算完成後應該直接轉換回 unsafe.Pointer :
 two := unsafe.Pointer(uintptr(one) + unsafe.Sizeof(arr[0]))
 fmt.Println(two, *(*uint32)(two))
}

// 輸出結果：
// 0xc000012150 1
// 0xc000012154 2

甚至還可以更改結構體的私有成員：

// model/model.go

package model

import (
 "fmt"
)

type M struct {
 foo uint32
 bar uint32
}

func (m M) Print() {
 fmt.Println(m.foo, m.bar)
}

// main.go

package main

import (
 "example/model"
 "unsafe"
)

func main() {
 m := model.M{}
 m.Print()

 foo := unsafe.Pointer(&m)
 *(*uint32)(foo) = 1
 bar := unsafe.Pointer(uintptr(foo) + 4)
 *(*uint32)(bar) = 2

 m.Print()
}

// 輸出結果：
// 0 0
// 1 2

小 Tips

Go 的底層 slice 切片源碼就使用了 unsafe 包

// slice 切片的底層結構
type slice struct {
 // 底層是一個數組指針
 array unsafe.Pointer
 // 長度
 len int
 // 容量
 cap int
}

總結

Go 可以使用 & 運算符取地址，也可以使用 new 創建指針
Go 的數組名不是首元素地址
Go 的指針不支持運算
Go 可以使用 unsafe 包打破安全機制來操控指針，但對我們開發者而言，是 "unsafe" 不安全的

[1]

Go Wiki: https://github.com/golang/go/wiki/GoForCPPProgrammers

本文由 Readfog 進行 AMP 轉碼，版權歸原作者所有。
來源：https://mp.weixin.qq.com/s/7vrAXh3frbMT_qzUo4deKw

運算符

數組名和數組首地址

指針運算

另闢蹊徑

小 Tips

總結

猜你喜歡