指針的底層原理與花式技巧

一、前言
二、變量與指針的本質
三、指針的幾個相關概念
四、指向不同數據類型的指針
五、總結

一、前言

如果問 C 語言中最重要、威力最大的概念是什麼，答案必將是指針！威力大，意味着使用方便、高效，同時也意味着語法複雜、容易出錯。指針用的好，可以極大的提高代碼執行效率、節約系統資源；如果用的不好，程序中將會充滿陷阱、漏洞。

這篇文章，我們就來聊聊指針。從最底層的內存存儲空間開始，一直到應用層的各種指針使用技巧，循序漸進、抽絲剝繭，以最直白的語言進行講解，讓你一次看過癮。

說明：爲了方便講解和理解，文中配圖的內存空間的地址是隨便寫的，在實際計算機中是要遵循地址對齊方式的。

二、變量與指針的本質

1. 內存地址

我們編寫一個程序源文件之後，編譯得到的二進制可執行文件存放在電腦的硬盤上，此時它是一個靜態的文件，一般稱之爲程序。

當這個程序被啓動的時候，操作系統將會做下面幾件事情：

把程序的內容 (代碼段、數據段) 從硬盤複製到內存中；

創建一個數據結構 PCB(進程控制塊)，來描述這個程序的各種信息 (例如：使用的資源，打開的文件描述符...);

在代碼段中定位到入口函數的地址，讓 CPU 從這個地址開始執行。

當程序開始被執行時，就變成一個動態的狀態，一般稱之爲進程。

內存分爲：物理內存和虛擬內存。操作系統對物理內存進行管理、包裝，我們開發者面對的是操作系統提供的虛擬內存。
這 2 個概念不妨礙文章的理解，因此就統一稱之爲內存。

在我們的程序中，通過一個變量名來定義變量、使用變量。變量本身是一個確確實實存在的東西，變量名是一個抽象的概念，用來代表這個變量。就比如：我是一個實實在在的人，是客觀存在與這個地球上的，道哥是我給自己起的一個名字，這個名字是任意取得，只要自己覺得好聽就行，如果我願意還可以起名叫：鳥哥、龍哥等等。

那麼，我們定義一個變量之後，這個變量放在哪裏呢？那就是內存的數據區。內存是一個很大的存儲區域，被操作系統劃分爲一個一個的小空間，操作系統通過地址來管理內存。

內存中的最小存儲單位是字節 (8 個 bit)，一個內存的完整空間就是由這一個一個的字節連續組成的。在上圖中，每一個小格子代表一個字節，但是好像大家在書籍中沒有這麼來畫內存模型的，更常見的是下面這樣的畫法：

也就是把連續的 4 個字節的空間畫在一起，這樣就便於表述和理解，特別是深入到代碼對齊相關知識時更容易理解。(我認爲根本原因應該是：大家都這麼畫，已經看順眼了~~)

2. 32 位與 64 位系統

我們平時所說的計算機是 32 位、64 位，指的是計算機的 CPU 中寄存器的最大存儲長度，如果寄存器中最大存儲 32bit 的數據，就稱之爲 32 位系統。

在計算機中，數據一般都是在硬盤、內存和寄存器之間進行來回存取。CPU 通過 3 種總線把各組成部分聯繫在一起：地址總線、數據總線和控制總線。地址總線的寬度決定了 CPU 的尋址能力，也就是 CPU 能達到的最大地址範圍。

剛纔說了，內存是通過地址來管理的，那麼 CPU 想從內存中的某個地址空間上存取一個數據，那麼 CPU 就需要在地址總線上輸出這個存儲單元的地址。假如地址總線的寬度是 8 位，能表示的最大地址空間就是 256 個字節，能找到內存中最大的存儲單元是 255 這個格子 (從 0 開始)。即使內存條的實際空間是 2G 字節，CPU 也沒法使用後面的內存地址空間。如果地址總線的寬度是 32 位，那麼能表示的最大地址就是 2 的 32 次方，也就是 4G 字節的空間。

【注意】：這裏只是描述地址總線的概念，實際的計算機中地址計算方式要複雜的多，比如：虛擬內存中採用分段、分頁、偏移量來定位實際的物理內存，在分頁中還有大頁、小頁之分，感興趣的同學可以自己查一下相關資料。

3. 變量

我們在 C 程序中使用變量來 “代表” 一個數據，使用函數名來 “代表” 一個函數，變量名和函數名是程序員使用的助記符。變量和函數最終是要放到內存中才能被 CPU 使用的，而內存中所有的信息 (代碼和數據) 都是以二進制的形式來存儲的，計算機根據就不會從格式上來區分哪些是代碼、哪些是數據。CPU 在訪問內存的時候需要的是地址，而不是變量名、函數名。

問題來了：在程序代碼中使用變量名來指代變量，而變量在內存中是根據地址來存放的，這二者之間如何映射 (關聯) 起來的？

答案是：編譯器！編譯器在編譯文本格式的 C 程序文件時，會根據目標運行平臺 (就是編譯出的二進制程序運行在哪裏？是 x86 平臺的電腦？還是 ARM 平臺的開發板？) 來安排程序中的各種地址，例如：加載到內存中的地址、代碼段的入口地址等等，同時編譯器也會把程序中的所有變量名，轉成該變量在內存中的存儲地址。

變量有 2 個重要屬性：變量的類型和變量的值。

示例：代碼中定義了一個變量

int a = 20;

類型是 int 型，值是 20。這個變量在內存中的存儲模型爲：

我們在代碼中使用變量名 a，在程序執行的時候就表示使用 0x11223344 地址所對應的那個存儲單元中的數據。因此，可以理解爲變量名 a 就等價於這個地址 0x11223344。換句話說，如果我們可以提前知道編譯器把變量 a 安排在地址 0x11223344 這個單元格中，我們就可以在程序中直接用這個地址值來操作這個變量。

在上圖中，變量 a 的值爲 20，在內存中佔據了 4 個格子的空間，也就是 4 個字節。爲什麼是 4 個字節呢？在 C 標準中並沒有規定每種數據類型的變量一定要佔用幾個字節，這是與具體的機器、編譯器有關。

比如：32 位的編譯器中：

char: 1 個字節；
short int: 2 個字節；
int: 4 個字節；
long: 4 個字節。

比如：64 位的編譯器中：

char: 1 個字節；
short int: 2 個字節；
int: 4 個字節；
long: 8 個字節。

爲了方便描述，下面都以 32 位爲例，也就是 int 型變量在內存中佔據 4 個字節。

另外，0x11223344，0x11223345，0x11223346，0x11223347 這連續的、從低地址到高地址的 4 個字節用來存儲變量 a 的數值 20。在圖示中，使用十六進制來表示，十進制數值 20 轉成 16 進制就是：0x00000014，所以從開始地址依次存放 0x00、0x00、0x00、0x14 這 4 個字節 (存儲順序涉及到大小端的問題，不影響文本理解)。

根據這個圖示，如果在程序中想知道變量 a 存儲在內存中的什麼位置，可以使用取地址操作符 &，如下：

printf("&a = 0x%x \n", &a);

這句話將會打印出：&a = 0x11223344。

考慮一下，在 32 位系統中：指針變量佔用幾個字節？

4. 指針變量

指針變量可以分 2 個層次來理解：

指針變量首先是一個變量，所以它擁有變量的所有屬性：類型和值。它的類型就是指針，它的值是其他變量的地址。既然是一個變量，那麼在內存中就需要爲這個變量分配一個存儲空間。在這個存儲空間中，存放着其他變量的地址。

指針變量所指向的數據類型，這是在定義指針變量的時候就確定的。例如：int *p; 意味着指針指向的是一個 int 型的數據。

首先回答一下剛纔那個問題，在 32 位系統中，一個指針變量在內存中佔據 4 個字節的空間。因爲 CPU 對內存空間尋址時，使用的是 32 位地址空間 (4 個字節)，也就是用 4 個字節就能存儲一個內存單元的地址。而指針變量中的值存儲的就是地址，所以需要 4 個字節的空間來存儲一個指針變量的值。

示例：

int a = 20;
int *pa;
pa = &a;
printf("value = %d \n", *pa);

在內存中的存儲模型如下：

對於指針變量 pa 來說，首先它是一個變量，因此在內存中需要有一個空間來存儲這個變量，這個空間的地址就是 0x11223348；

其次，這個內存空間中存儲的內容是變量 a 的地址，而 a 的地址爲 0x11223344，所以指針變量 pa 的地址空間中，就存儲了 0x11223344 這個值。

這裏對兩個操作符 & 和 * 進行說明：

&：取地址操作符，用來獲取一個變量的地址。上面代碼中 & a 就是用來獲取變量 a 在內存中的存儲地址，也就是 0x11223344。

*：這個操作符用在 2 個場景中：定義一個指針的時候，獲取一個指針所指向的變量值的時候。

int _pa; 這個語句中的_表示定義的變量 pa 是一個指針，前面的 int 表示 pa 這個指針指向的是一個 int 類型的變量。不過此時我們沒有給 pa 進行賦值，也就是說此刻 pa 對應的存儲單元中的 4 個字節裏的值是沒有初始化的，可能是 0x00000000，也可能是其他任意的數字，不確定；

printf 語句中的 * 表示獲取 pa 指向的那個 int 類型變量的值，學名叫解引用，我們只要記住是獲取指向的變量的值就可以了。

5. 操作指針變量

對指針變量的操作包括 3 個方面：

操作指針變量自身的值；

獲取指針變量所指向的數據;

以什麼樣數據類型來使用 / 解釋指針變量所指向的內容。

5.1 指針變量自身的值

int a = 20;這個語句是定義變量 a，在隨後的代碼中，只要寫下 a 就表示要操作變量 a 中存儲的值，操作有兩種：讀和寫。

printf("a = %d \n", a); 這個語句就是要讀取變量 a 中的值，當然是 20；
a = 100;這個語句就是要把一個數值 100 寫入到變量 a 中。

同樣的道理，int *pa;語句是用來定義指針變量 pa，在隨後的代碼中，只要寫下 pa 就表示要操作變量 pa 中的值：

printf("pa = %d \n", pa); 這個語句就是要讀取指針變量 pa 中的值，當然是 0x11223344；
pa = &a;這個語句就是要把新的值寫入到指針變量 pa 中。再次強調一下，指針變量中存儲的是地址，如果我們可以提前知道變量 a 的地址是 0x11223344，那麼我們也可以這樣來賦值: pa = 0x11223344;

思考一下，如果執行這個語句printf("&pa =0x%x \n", &pa);，打印結果會是什麼？

上面已經說過，操作符 & 是用來取地址的，那麼 & pa 就表示獲取指針變量 pa 的地址，上面的內存模型中顯示指針變量 pa 是存儲在 0x11223348 這個地址中的，因此打印結果就是：&pa = 0x11223348。

5.2 獲取指針變量所指向的數據

指針變量所指向的數據類型是在定義的時候就明確的，也就是說指針 pa 指向的數據類型就是 int 型，因此在執行printf("value = %d \n", *pa);語句時，首先知道 pa 是一個指針，其中存儲了一個地址 (0x11223344)，然後通過操作符 * 來獲取這個地址 (0x11223344) 對應的那個存儲空間中的值；又因爲在定義 pa 時，已經指定了它指向的值是一個 int 型，所以我們就知道了地址 0x11223344 中存儲的就是一個 int 類型的數據。

5.3 以什麼樣的數據類型來使用 / 解釋指針變量所指向的內容

如下代碼：

int a = 30000;
int *pa = &a;
printf("value = %d \n", *pa);

根據以上的描述，我們知道 printf 的打印結果會是value = 30000，十進制的 30000 轉成十六進制是 0x00007530，內存模型如下：

現在我們做這樣一個測試：

char *pc = 0x11223344;
printf("value = %d \n", *pc);

指針變量 pc 在定義的時候指明：它指向的數據類型是 char 型，pc 變量中存儲的地址是 0x11223344。當使用 * pc 獲取指向的數據時，將會按照 char 型格式來讀取 0x11223344 地址處的數據，因此將會打印value = 0(在計算機中，ASCII 碼是用等價的數字來存儲的)。

這個例子中說明了一個重要的概念：在內存中一切都是數字，如何來操作 (解釋) 一個內存地址中的數據，完全是由我們的代碼來告訴編譯器的。剛纔這個例子中，雖然 0x11223344 這個地址開始的 4 個字節的空間中，存儲的是整型變量 a 的值，但是我們讓 pc 指針按照 char 型數據來使用 / 解釋這個地址處的內容，這是完全合法的。

以上內容，就是指針最根本的心法了。把這個心法整明白了，剩下的就是多見識、多練習的問題了。

三、指針的幾個相關概念

1. const 屬性

const 標識符用來表示一個對象的不可變的性質，例如定義：

const int b = 20;

在後面的代碼中就不能改變變量 b 的值了，b 中的值永遠是 20。同樣的，如果用 const 來修飾一個指針變量：

int a = 20;
int b = 20;
int * const p = &a;

內存模型如下：

這裏的 const 用來修飾指針變量 p，根據 const 的性質可以得出結論：p 在定義爲變量 a 的地址之後，就固定了，不能再被改變了，也就是說指針變量 pa 中就只能存儲變量 a 的地址 0x11223344。如果在後面的代碼中寫p = &b;，編譯時就會報錯，因爲 p 是不可改變的，不能再被設置爲變量 b 的地址。

但是，指針變量 p 所指向的那個變量 a 的值是可以改變的，即：*p = 21;這個語句是合法的，因爲指針 p 的值沒有改變 (仍然是變量 c 的地址 0x11223344)，改變的是變量 c 中存儲的值。

與下面的代碼區分一下：

int a = 20;
int b = 20;
const int *p = &a;
p = &b;

這裏的 const 沒有放在 p 的旁邊，而是放在了類型 int 的旁邊，這就說明 const 符號不是用來修飾 p 的，而是用來修飾 p 所指向的那個變量的。所以，如果我們寫p = &b;把變量 b 的地址賦值給指針 p，就是合法的，因爲 p 的值可以被改變。

但是這個語句*p = 21就是非法了，因爲定義語句中的 const 就限制了通過指針 p 獲取的數據，不能被改變，只能被用來讀取。這個性質常常被用在函數參數上，例如下面的代碼，用來計算一塊數據的 CRC 校驗，這個函數只需要讀取原始數據，不需要 (也不可以) 改變原始數據，因此就需要在形參指針上使用 const 修飾符：

short int getDataCRC(const char *pData, int len)
{
    short int crc = 0x0000;
    // 計算CRC
    return crc;
}

2. void 型指針

關鍵字 void 並不是一個真正的數據類型，它體現的是一種抽象，指明不是任何一種類型，一般有 2 種使用場景：

函數的返回值和形參;

定義指針時不明確規定所指數據的類型，也就意味着可以指向任意類型。

指針變量也是一種變量，變量之間可以相互賦值，那麼指針變量之間也可以相互賦值，例如：

int a = 20;
int b = a;
int *p1 = &a;
int *p2 = p1;

變量 a 賦值給變量 b，指針 p1 賦值給指針 p2，注意到它們的類型必須是相同的：a 和 b 都是 int 型，p1 和 p2 都是指向 int 型，所以可以相互賦值。那麼如果數據類型不同呢？必須進行強制類型轉換。例如：

int a = 20;
int *p1 = &a;
char *p2 = (char *)p1;

內存模型如下：

p1 指針指向的是 int 型數據，現在想把它的值 (0x11223344) 賦值給 p2，但是由於在定義 p2 指針時規定它指向的數據類型是 char 型，因此需要把指針 p1 進行強制類型轉換，也就是把地址 0x11223344 處的數據按照 char 型數據來看待，然後纔可以賦值給 p2 指針。

如果我們使用void *p2來定義 p2 指針，那麼在賦值時就不需要進行強制類型轉換了，例如：

int a = 20;
int *p1 = &a;
void *p2 = p1;

指針 p2 是 void * 型，意味着可以把任意類型的指針賦值給 p2，但是不能反過來操作，也就是不能把 void * 型指針直接賦值給其他確定類型的指針，而必須要強制轉換成被賦值指針所指向的數據類型，如下代碼，必須把 p2 指針強制轉換成 int * 型之後，再賦值給 p3 指針：

int a = 20;
int *p1 = &a;
void *p2 = p1;
int *p3 = (int *)p2;

我們來看一個系統函數：

void* memcpy(void* dest, const void* src, size_t len);

第一個參數類型是 void*，這正體現了系統對內存操作的真正意義：它並不關心用戶傳來的指針具體指向什麼數據類型，只是把數據挨個存儲到這個地址對應的空間中。

第二個參數同樣如此，此外還添加了 const 修飾符，這樣就說明了 memcpy 函數只會從 src 指針處讀取數據，而不會修改數據。

3. 空指針和野指針

一個指針必須指向一個有意義的地址之後，纔可以對指針進行操作。如果指針中存儲的地址值是一個隨機值，或者是一個已經失效的值，此時操作指針就非常危險了，一般把這樣的指針稱作野指針，C 代碼中很多指針相關的 bug 就來源於此。

3.1 空指針：不指向任何東西的指針

在定義一個指針變量之後，如果沒有賦值，那麼這個指針變量中存儲的就是一個隨機值，有可能指向內存中的任何一個地址空間，此時萬萬不可以對這個指針進行寫操作，因爲它有可能指向內存中的代碼段區域、也可能指向內存中操作系統所在的區域。

一般會將一個指針變量賦值爲 NULL 來表示一個空指針，而 C 語言中，NULL 實質是 ((void*)0) ，在 C++ 中，NULL 實質是 0。在標準庫頭文件 stdlib.h 中，有如下定義：

#ifdef __cplusplus
     #define NULL    0
#else    
     #define NULL    ((void *)0)
#endif

3.2 野指針：地址已經失效的指針

我們都知道，函數中的局部變量存儲在棧區，通過 malloc 申請的內存空間位於堆區，如下代碼：

int *p = (int *)malloc(4);
*p = 20;

內存模型爲：

在堆區申請了 4 個字節的空間，然後強制類型轉換爲 int * 型之後，賦值給指針變量 p，然後通過 * p 設置這個地址中的值爲 14，這是合法的。如果在釋放了 p 指針指向的空間之後，再使用 * p 來操作這段地址，那就是非常危險了，因爲這個地址空間可能已經被操作系統分配給其他代碼使用，如果對這個地址裏的數據強行操作，程序立刻崩潰的話，將會是我們最大的幸運！

int *p = (int *)malloc(4);
*p = 20;
free(p);
// 在free之後就不可以再操作p指針中的數據了。
p = NULL;  // 最好加上這一句。

四、指向不同數據類型的指針

1. 數值型指針

通過上面的介紹，指向數值型變量的指針已經很明白了，需要注意的就是指針所指向的數據類型。

2. 字符串指針

字符串在內存中的表示有 2 種：

用一個數組來表示，例如：char name1[8] = "zhangsan";

用一個 char * 指針來表示，例如：char *name2 = "zhangsan";

name1 在內存中佔據 8 個字節，其中存儲了 8 個字符的 ASCII 碼值；name2 在內存中佔據 9 個字節，因爲除了存儲 8 個字符的 ASCII 碼值，在最後一個字符'n'的後面還額外存儲了一個'\0'，用來標識字符串結束。

對於字符串來說，使用指針來操作是非常方便的，例如：變量字符串 name2:

char *name2 = "zhangsan";
char *p = name2;
while (*p != '\0')
{
    printf("%c ", *p);
    p = p + 1;
}

在 while 的判斷條件中，檢查 p 指針指向的字符是否爲結束符'\0'。在循環體重，打印出當前指向的字符之後，對指針比那裏進行自增操作，因爲指針 p 所指向的數據類型是 char，每個 char 在內存中佔據一個字節，因此指針 p 在自增 1 之後，就指向下一個存儲空間。

也可以把循環體中的 2 條語句寫成 1 條語句：

printf("%c ", *p++);

假如一個指針指向的數據類型爲 int 型，那麼執行p = p + 1;之後，指針 p 中存儲的地址值將會增加 4，因爲一個 int 型數據在內存中佔據 4 個字節的空間，如下所示：

思考一個問題：void * 型指針能夠遞增嗎？如下測試代碼：

int a[3] = {1, 2, 3};
void *p = a;
printf("1: p = 0x%x \n", p);
p = p + 1;
printf("2: p = 0x%x \n", p);

打印結果如下：

1: p = 0x733748c0 
2: p = 0x733748c1

說明 void * 型指針在自增時，是按照一個字節的跨度來計算的。

3. 指針數組與數組指針

這 2 個說法經常會混淆，至少我是如此，先看下這 2 條語句：

int *p1[3];   // 指針數組
int (*p2)[3]; // 數組指針

3.1 指針數組

第 1 條語句中：中括號 [] 的優先級高，因此與 p1 先結合，表示一個數組，這個數組中有 3 個元素，這 3 個元素都是指針，它們指向的是 int 型數據。可以這樣來理解：如果有這個定義char p[3]，很容易理解這是一個有 3 個 char 型元素的數組，那麼把 char 換成 int*，意味着數組裏的元素類型是 int * 型 (指向 int 型數據的指針)。內存模型如下 (注意：三個指針指向的地址並不一定是連續的)：

如果向指針數組中的元素賦值，需要逐個把變量的地址賦值給指針元素：

int a = 1, b = 2, c = 3;
char *p1[3];
p1[0] = &a;
p1[1] = &b;
p1[2] = &c;

3.2 數組指針

第 2 條語句中：小括號讓 p2 與 * 結合，表示 p2 是一個指針，這個指針指向了一個數組，數組中有 3 個元素，每一個元素的類型是 int 型。可以這樣來理解：如果有這個定義int p[3]，很容易理解這是一個有 3 個 char 型元素的數組，那麼把數組名 p 換成是 * p2，也就是 p2 是一個指針，指向了這個數組。內存模型如下 (注意：指針指向的地址是一個數組，其中的 3 個元素是連續放在內存中的)：

在前面我們說到取地址操作符 &，用來獲得一個變量的地址。凡事都有特殊情況，對於獲取地址來說，下面幾種情況不需要使用 & 操作符：

字符串字面量作爲右值時，就代表這個字符串在內存中的首地址；

數組名就代表這個數組的地址，也等於這個數組的第一個元素的地址;

函數名就代表這個函數的地址。

因此，對於一下代碼，三個 printf 語句的打印結果是相同的：

int a[3] = {1, 2, 3};
int (*p2)[3] = a;
printf("0x%x \n", a);
printf("0x%x \n", &a);
printf("0x%x \n", p2);

思考一下，如果對這裏的 p2 指針執行p2 = p2 + 1;操作，p2 中的值將會增加多少？

答案是 12 個字節。因爲 p2 指向的是一個數組，這個數組中包含 3 個元素，每個元素佔據 4 個字節，那麼這個數組在內存中一共佔據 12 個字節，因此 p2 在加 1 之後，就跳過 12 個字節。

4. 二維數組和指針

一維數組在內存中是連續分佈的多個內存單元組成的，而二維數組在內存中也是連續分佈的多個內存單元組成的，從內存角度來看，一維數組和二維數組沒有本質差別。

和一維數組類似，二維數組的數組名錶示二維數組的第一維數組中首元素的首地址，用代碼來說明：

int a[3][3] = {{1,2,3}, {4,5,6}, {7,8,9}}; // 二維數組
int (*p0)[3] = NULL;   // p0是一個指針，指向一個數組
int (*p1)[3] = NULL;   // p1是一個指針，指向一個數組
int (*p2)[3] = NULL;   // p2是一個指針，指向一個數組
p0 = a[0];
p1 = a[1];
p2 = a[2];
printf("0: %d %d %d \n", *(*p0 + 0), *(*p0 + 1), *(*p0 + 2));
printf("1: %d %d %d \n", *(*p1 + 0), *(*p1 + 1), *(*p1 + 2));
printf("2: %d %d %d \n", *(*p2 + 0), *(*p2 + 1), *(*p2 + 2));

打印結果是：

0: 1 2 3 
1: 4 5 6 
2: 7 8 9

我們拿第一個 printf 語句來分析：p0 是一個指針，指向一個數組，數組中包含 3 個元素，每個元素在內存中佔據 4 個字節。現在我們想獲取這個數組中的數據，如果直接對 p0 執行加 1 操作，那麼 p0 將會跨過 12 個字節 (就等於 p1 中的值了)，因此需要使用解引用操作符 *，把 p0 轉爲指向 int 型的指針，然後再執行加 1 操作，就可以得到數組中的 int 型數據了。

5. 結構體指針

C 語言中的基本數據類型是預定義的，結構體是用戶定義的，在指針的使用上可以進行類比，唯一有區別的就是在結構體指針中，需要使用->箭頭操作符來獲取結構體中的成員變量，例如：

typedef struct 
{
    int age;
    char name[8];
} Student;

Student s;
s.age = 20;
strcpy(s.name, "lisi");
Student *p = &s;
printf("age = %d, name = %s \n", p->age, p->name);

看起來似乎沒有什麼技術含量，如果是結構體數組呢？例如：

Student s[3];
Student *p = &s;
printf("size of Student = %d \n", sizeof(Student));
printf("1: 0x%x, 0x%x \n", s, p);
p++;
printf("2: 0x%x \n", p);

打印結果是：

size of Student = 12 
1: 0x4c02ac00, 0x4c02ac00 
2: 0x4c02ac0c

在執行p++操作後，p 需要跨過的空間是一個結構體變量在內存中佔據的大小 (12 個字節)，所以此時 p 就指向了數組中第 2 個元素的首地址，內存模型如下：

6. 函數指針

每一個函數在經過編譯之後，都變成一個包含多條指令的集合，在程序被加載到內存之後，這個指令集合被放在代碼區，我們在程序中使用函數名就代表了這個指令集合的開始地址。

函數指針，本質上仍然是一個指針，只不過這個指針變量中存儲的是一個函數的地址。函數最重要特性是什麼？可以被調用！因此，當定義了一個函數指針並把一個函數地址賦值給這個指針時，就可以通過這個函數指針來調用函數。

如下示例代碼：

int add(int x,int y)
{
    return x+y;
}

int main()
{
    int a = 1, b = 2;
    int (*p)(int, int);
    p = add;
    printf("%d + %d = %d\n", a, b, p(a, b));
}

前文已經說過，函數的名字就代表函數的地址，所以函數名 add 就代表了這個加法函數在內存中的地址。int (*p)(int, int);這條語句就是用來定義一個函數指針，它指向一個函數，這個函數必須符合下面這 2 點 (學名叫：函數簽名)：

有 2 個 int 型的參數;

有一個 int 型的返回值。

代碼中的 add 函數正好滿足這個要求，因此，可以把 add 賦值給函數指針 p，此時 p 就指向了內存中這個函數存儲的地址，後面就可以用函數指針 p 來調用這個函數了。

在示例代碼中，函數指針 p 是直接定義的，那如果想定義 2 個函數指針，難道需要像下面這樣定義嗎？

int (*p)(int, int);
int (*p2)(int, int);

這裏的參數比較簡單，如果函數很複雜，這樣的定義方式豈不是要煩死？可以用 typedef 關鍵字來定義一個函數指針類型：

typedef int (*pFunc)(int, int);

然後用這樣的方式pFunc p1, p2;來定義多個函數指針就方便多了。注意：只能把與函數指針類型具有相同簽名的函數賦值給 p1 和 p2，也就是參數的個數、類型要相同，返回值也要相同。

注意：這裏有幾個小細節稍微瞭解一下：

在賦值函數指針時，使用 p = &a; 也是可以的；

使用函數指針調用時，使用 (*p)(a, b); 也是可以的。

這裏沒有什麼特殊的原理需要講解，最終都是編譯器幫我們處理了這裏的細節，直接記住即可。

函數指針整明白之後，再和數組結合在一起：函數指針數組。示例代碼如下：

int add(int a, int b) { return a + b; }
int sub(int a, int b) { return a - b; }
int mul(int a, int b) { return a * b; }
int divide(int a, int b) { return a / b; }

int main()
{
    int a = 4, b = 2;
    int (*p[4])(int, int);
    p[0] = add;
    p[1] = sub;
    p[2] = mul;
    p[3] = divide;
    printf("%d + %d = %d \n", a, b, p[0](a, b));
    printf("%d - %d = %d \n", a, b, p[1](a, b));
    printf("%d * %d = %d \n", a, b, p[2](a, b));
    printf("%d / %d = %d \n", a, b, p[3](a, b));
}

這條語句不太好理解:int (*p[4])(int, int);，先分析中間部分，標識符 p 與中括號 [] 結合(優先級高)，所以 p 是一個數組，數組中有 4 個元素；然後剩下的內容表示一個函數指針，那麼就說明數組中的元素類型是函數指針，也就是其他函數的地址，內存模型如下：

如果還是難以理解，那就回到指針的本質概念上：指針就是一個地址！這個地址中存儲的內容是什麼根本不重要，重要的是你告訴計算機這個內容是什麼。如果你告訴它：這個地址裏存放的內容是一個函數，那麼計算機就去調用這個函數。那麼你是如何告訴計算機的呢，就是在定義指針變量的時候，僅此而已！

五、總結

我已經把自己知道的所有指針相關的概念、語法、使用場景都作了講解，就像一個小酒館的掌櫃，把自己的美酒佳餚都呈現給你，但願你已經酒足飯飽！

如果以上的內容太多，一時無法消化，那麼下面的這兩句話就作爲飯後甜點爲您奉上，在以後的編程中，如果遇到指針相關的困惑，就想一想這兩句話，也許能讓你茅塞頓開。

指針就是地址，地址就是指針。

指針就是指向內存中的一塊空間，至於如何來解釋 / 操作這塊空間，由這個指針的類型來決定。

另外還有一點囑咐，那就是學習任何一門編程語言，一定要弄清楚內存模型，內存模型，內存模型！

祝您好運！

如果覺得文章不錯，請轉發、分享給您的朋友。

我會把十多年嵌入式開發中的項目實戰經驗進行總結、分享，相信不會讓你失望的！

本文由 Readfog 進行 AMP 轉碼，版權歸原作者所有。
來源：https://mp.weixin.qq.com/s/kUVNprJxNlGvhhL3Ln82Uw