全面講解 C 語言的結構體 -struct-,一網打盡
結構體的定義
結構體 (struct) 是由一系列具有相同類型或不同類型的數據構成的數據集合,也叫結構。
結構體和其他類型基礎數據類型一樣,例如 int 類型,char 類型;只不過結構體可以做成你想要的數據類型,以方便日後的使用。
在實際項目中,結構體是大量存在的。研發人員常使用結構體來封裝一些屬性來組成新的類型。由於 C 語言無法操作數據庫,所以在項目中通過對結構體內部變量的操作將大量的數據存儲在內存中,以完成對數據的存儲和操作。
在實際問題中有時候我們需要幾種數據類型一起來修飾某個變量。
例如一個學生的信息就需要學號(字符串),姓名(字符串),年齡(整型)等等。
這些數據類型都不同但是他們又是表示一個整體,要存在聯繫,那麼我們就需要一個新的數據類型——結構體,它就將不同類型的數據存放在一起,作爲一個整體進行處理。
結構體在函數中的作用不是簡便,其最主要的作用就是封裝。封裝的好處就是可以再次利用。讓使用者不必關心這個是什麼,只要根據定義使用就可以了。
結構體的大小不是結構體元素單純相加就行的,因爲我們現在主流的計算機使用的都是 32Bit 字長的 CPU,對這類型的 CPU 取 4 個字節的數要比取一個字節要高效,也更方便。所以在結構體中每個成員的首地址都是 4 的整數倍的話,取數據元素時就會相對更高效,這就是內存對齊的由來。
每個特定平臺上的編譯器都有自己的默認 “對齊係數”(也叫對齊模數)。程序員可以通過預編譯命令 #pragma pack(n),n=1,2,4,8,16 來改變這一系數,其中的 n 就是你要指定的 “對齊係數”。
規則
1、數據成員對齊規則:結構 (struct)(或聯合(union)) 的數據成員,第一個數據成員放在 offset 爲 0 的地方,以後每個數據成員的對齊按照 #pragma pack 指定的數值和這個數據成員自身長度中,比較小的那個進行。
2、結構 (或聯合) 的整體對齊規則:在數據成員完成各自對齊之後,結構 (或聯合) 本身也要進行對齊,對齊將按照 #pragma pack 指定的數值和結構 (或聯合) 最大數據成員長度中,比較小的那個進行。
3、結合 1、2 可推斷:當 #pragma pack 的 n 值等於或超過所有數據成員長度的時候,這個 n 值的大小將不產生任何效果。
在 C 語言中,可以定義結構體類型,將多個相關的變量包裝成爲一個整體使用。在結構體中的變量,可以是相同、部分相同,或完全不同的數據類型。結構體不能包含函數。
在面向對象的程序設計中,對象具有狀態(屬性)和行爲,狀態保存在成員變量中,行爲通過成員方法(函數)來實現。C 語言中的結構體只能描述一個對象的狀態,不能描述一個對象的行爲。在 C++ 中,考慮到 C 語言到 C++ 語言過渡的連續性,對結構體進行了擴展,C++ 的結構體可以包含函數,這樣,C++ 的結構體也具有類的功能,與 class 不同的是,結構體包含的函數默認爲 public,而不是 private。
結構體聲明
//聲明一個結構體
struct book
{
char title[MAXTITL];//一個字符串表示的titile 題目 ;
char author[MAXAUTL];//一個字符串表示的author作者 ;
float value;//一個浮點型表示的value價格;
}; //注意分號不能少,這也相當於一條語句;
這個聲明描述了一個由兩個字符數組和一個 float 變量組成的結構體。
但是注意,它並沒有創建一個實際的數據對象,而是描述了一個組成這類對象的元素。
因此,我們有時候也將結構體聲明叫做模板,因爲它勾勒出數據該如何存儲,並沒有實例化數據對象。
下面介紹一下上面的結構體聲明;
1、首先使用關鍵字 struct,它表示接下來是一個結構體。
2、後面是一個可選的標誌(book),它是用來引用該結構體的快速標記。
因此我們以後就可以這樣創建數據對象
struct book library;// 把 library 設爲一個可以使用 book 結構體的結構體變量,則 library 這個變量就包含了其 book 結構體中的所有元素
3、接下來就是一個花括號,括起了結構體成員列表,及每個成員變量,使用的都是其自己的聲明方式來描述,用分號來結束描述;
例如:char title[MAXTITL]; 字符數組就是這樣聲明的,用分號結束;
注意:其中每個成員可以使用任何一種 C 數據結構甚至是其他的結構體,也是可以的;
4、在結束花括號後的分號表示結構體設計定義的結束。
**關於其 struct 聲明的位置,也就是這段代碼要放到哪裏。**同樣這也是具有作用域的。
這種聲明如果放在任何函數的外面,那麼則標記可以在在本文件中,該聲明後面的所有函數都可以使用。
如果這種聲明在某個函數的內部,則它的標記只能在內部使用,並且在其聲明之後;
關於我們不斷說的,標記名是可選的,那麼我們什麼時候可以省略,什麼時候一定不能省略呢?
如果是上面那種聲明定義的方法,並且想在一個地方定義結構體設計,而在其他地方定義實際的結構體變量,那麼就必須使用標記;
可以省略,設計的同時就創建該結構體變量,但是這種設計是一次性的。
一般格式就是:
struct 結構體名 (也就是可選標記名){ 成員變量;};// 使用分號表示定義結束。
C 語言結構體定義的三種方式
1、最標準的方式:
#include <stdio.h>
struct student //結構體類型的說明與定義分開。聲明
{
int age; /*年齡*/
float score; /*分數*/
char sex; /*性別*/
};
int main ()
{
struct student a={ 20,79,'f'}; //定義
printf("年齡:%d 分數:%.2f 性別:%c\n", a.age, a.score, a.sex );
return 0;
}
2、不環保的方式
#include <stdio.h>
struct student /*聲明時直接定義*/
{
int age; /*年齡*/
float score; /*分數*/
char sex; /*性別*/
/*這種方式不環保,只能用一次*/
} a={21,80,'n'};
int main ()
{
printf("年齡:%d 分數:%.2f 性別:%c\n", a.age, a.score, a.sex );
}
3、最奈何人的方式
#include <stdio.h>
struct //直接定義結構體變量,沒有結構體類型名。這種方式最爛
{
int age;
float score;
char sex;
} t={21,79,'f'};
int main ()
{
printf("年齡:%d 分數:%f 性別:%c\n", t.age, t.score, t.sex);
return 0;
}
定義結構體變量
之前我們結構體類型的定義(結構體的聲明)只是告訴編譯器該如何表示數據,但是它沒有讓計算機爲其分配空間。
我們要使用結構體,那麼就需要創建變量,也就是結構體變量;
創建一個結構體變量;
struct book library;
看到這條指令,編譯器纔會創建一個結構體變量 library,此時編譯器纔會按照 book 模板爲該變量分配內存空間,並且這裏存儲空間都是以這個變量結合在一起的。
這也是後面訪問結構體變量成員的時候,我們就要用到結構體變量名來訪問。
分析:
struct book 的作用:
在結構體聲明中,struct book 所起到的作用就像 int 等基礎數據類型名作用一樣。
struct book s1,s2,*ss;
定義兩個 struct book 結構體類型的結構體變量,還定義了一個指向該結構體的指針,其 ss 指針可以指向 s1,s2,或者任何其他的 book 結構體變量。
struct book library;
等效於:
struct book{
char …
….
…..
}library;
這兩種是等效的,只是第一種可以減少代碼的編寫量;
現在還是回到剛纔提及的那個問題,可選標誌符什麼時候可以省略;
其一:
struct
{
char title[MAXTITL];
char author[MAXAUTL];
float value;
}library;
注意,這裏不再是定義聲明結構體類型,而是直接創建結構體變量了,這個編譯器會分配內存的;
這樣的確可以省略標識符也就是結構體名,但是隻能使用一次;因爲這時,聲明結構體的過程和定義結構體變量的過程和在了一起,並且各成員變量沒有初始化。
如果你想多次使用一個結構體模塊,這樣子是行不通的。
其二,
用 typedef 定義新類型名來代替已有類型名,即給已有類型重新命名;
一般格式爲;typedef 已有類型 新類型名;
typedef int Elem;
typedef struct{
int date;
.....
.....
}STUDENT;
STUDENT stu1,stu2;
總結一下關於結構體變量的定義:
1、先定義結構體類型後再定義結構體變量;
格式爲:struct 結構體名 變量名列表;
//注意這種之前要先定義結構體類型後再定義變量;
struct book s1,s2,*ss;
**2、**在定義結構體類型的同時定義結構體變量;
格式爲:
struct 結構體名
{
成員列表;
}變量名列表;//這裏結構體名是可以省的,但儘量別省;
struct book
{
char title[MAXTITL];//一個字符串表示的titile 題目 ;
char author[MAXAUTL];//一個字符串表示的author作者 ;
float value;//一個浮點型表示的value價格;
}s1,s2
直接定義結構體類型變量,就是第二種中省略結構體名的情況;
這種方式不能指明結構體類型名而是直接定義結構體變量,並且在只定義一次結構體變量時適用,無結構體名的結構體類型是無法重複使用的。
也就是說,後面程序不能再定義此類型變量了,除非再寫一次重複的 struct。
對於結構體變量的初始化
先回憶一下關於基本數據類型和數組類型的初始化:
int a = 0;
int array[4] = {1,2,3,4};//每個元素用逗號隔開
回憶一下數組初始化問題:
再回到結構體變量的初始化吧
關於結構體變量的初始化與初始化數組類似;
也是使用花括號括起來,用逗號分隔的初始化好項目列表。注意,每個初始化項目必須要和要初始化的結構體成員類型相匹配。
struct book s1=
{ //對結構體初始化
"yuwen", //title爲字符串
"guojiajiaoyun", //author爲字符數組
22.5 //value爲flaot型
};
//要對應起來,用逗號分隔開來,與數組初始化一樣;
加入一點小知識,關於結構體初始化和存儲類時期的問題:如果要初始化一個具有靜態存儲時期的結構體,初始化項目列表中的值必須是常量表達式;
注意,如果在定義結構體變量的時候沒有初始化,那麼後面就不能全部一起初始化了;意思就是:
/////////這樣是可以的,在定義變量的時候就初始化了;
struct book s1=
{ //對結構體初始化
"guojiajiaoyun",//author爲字符數組
"yuwen",//title爲字符串
22.5
};
/////////這種就不行了,在定義變量之後,若再要對變量的成員賦值,那麼只能單個賦值了;
struct book s1;
s1={
"guojiajiaoyun",//author爲字符數組
"yuwen",//title爲字符串
22.5
};//這樣就是不行的,只能在定義的時候初始化才能全部賦值,之後就不能再全體賦值了,只能單個賦值;
只能:
s1.title = "yuwen";........//單個賦值;
對於結構體的指定初始化:
訪問結構體成員
結構體就像一個超級數組,在這個超級數組內,一個元素可以是 char 類型,下個元素就可以是 flaot 類型,再下個還可以是 int 數組型,這些都是存在的。
在數組裏面我們通過下標可以訪問一個數組的各個元素,那麼如何訪問結構體中的各個成員呢?
用結構成員運算符點(.)就可以了;
結構體變量名. 成員名;
注意,點其結合性是自左至右的,它在所有的運算符中優先級是最高的;
例如,s1.title 指的就是 s1 的 title 部分;s1.author 指的就是 s1 的 author 部分;s1.value 指的就是 s1 的 value 部分。
然後就可以像字符數組那樣使用 s1.title,像使用 float 數據類型一樣使用 s1.value;
注意,s1 雖然是個結構體,但是 s1.value 卻是 float 型的。
因此 s1.value 就相當於 float 類型的變量名一樣,按照 float 類型來使用;
例如:
printf(“%s\n%s\n%f”,s1.title,s1.author,s1.value); // 訪問結構體變量元素
注意 scanf(“%d”,&s1.value); 這語句存在兩個運算符,& 和結構成員運算符點。
按照道理我們應該將(s1.value 括起來,因爲他們是整體,表示 s1 的 value 部分)但是我們不括起來也是一樣的,因爲點的優先級要高於 &。
如果其成員本身又是一種結構體類型,那麼可以通過若干個成員運算符,一級一級的找到最低一級成員再對其進行操作;
結構體變量名. 成員. 子成員……… 最低一級子成員;
struct date
{
int year;
int month;
int day;
};
struct student
{
char name[10];
struct date birthday;
}student1;
//若想引用student的出生年月日,可表示爲;student.brithday.year;
brithday是student的成員;year是brithday的成員;
整體與分開
可以將一個結構體變量作爲一個整體賦值給另一相同類型的結構體變量,可以到達整體賦值的效果;這個成員變量的值都將全部整體賦值給另外一個變量;
不能將一個結構體變量作爲一個整體進行輸入和輸出;在輸入輸出結構體數據時,必須分別指明結構體變量的各成員;
小結:除去 “相同類型的結構體變量可以相互整體賦值” 外,其他情況下,不能整體引用,只能對各個成員分別引用;
結構體長度
數據類型的字節數:
16 位編譯器
**char :**1 個字節
*char(即指針變量): **2 個字節
**short int : **2 個字節
int: 2 個字節
unsigned int : 2 個字節
**float: ** 4 個字節
**double: ** 8 個字節
**long: ** 4 個字節
**long long: ** 8 個字節
**unsigned long: **4 個字節
32 位編譯器
**char :*1 個字節
char(即指針變量): 4 個字節(32 位的尋址空間是 2^32, 即 32 個 bit,也就是 4 個字節。同理 64 位編譯器)
short int : 2 個字節
**int: ** 4 個字節
**unsigned int : **4 個字節
**float: **4 個字節
**double: ** 8 個字節
**long: ** 4 個字節 **long long:**8 個字節
**unsigned long: ** 4 個字節
那麼,下面這個結構體類型佔幾個字節呢?
typedef struct
{
char addr;
char name;
int id;
}PERSON;
通過 printf("PERSON 長度 =%d 字節 \ n",sizeof(PERSON)); 可以看到結果:
結構體字節對齊
通過下面的方式,可以清楚知道爲什麼是 8 字節。
1、定義 20 個 char 元素的數組
char ss[20]={0x10,0x11,0x12,0x13,0x14,0x15,0x16,0x17,0x18,0x19,0x20,0x21,0x22,0x23,0x24,0x25,0x26,0x27,0x28,0x29};
2、定義結構體類型的指針 ps 指向 ss 數組
PERSON *ps=(PERSON *)ss;
3、打印輸出各個成員
printf("0x%02x,0x%02x,0x%02x\n",ps->addr,ps->name,ps->id);printf("PERSON長度=%d字節\n",sizeof(PERSON));
可以看到 addr 和 name 都只佔一個字節,但是未滿 4 字節,跳過 2 字節後纔是 id 的值,這就是 4 字節對齊。結構體成員有 int 型,會自動按照 4 字節對齊。
把結構體成員順序調換位置
typedef struct
{
char addr;
int id;
char name;
}PERSON;
輸出:
按照下面的順序排列:
typedef struct
{
int id;
char addr;
char name;
}PERSON;
輸出:
可見,結構體成員順序優化,可節省空間。
如果全部成員都是 char 型,會按照 1 字節對齊,即
typedef struct
{
char addr;
char name;
char id;
}PERSON;
輸出結果:
結構體嵌套
結構體嵌套結構體方式:
typedef struct
{
char addr;
char name;
int id;
}PERSON;
typedef struct
{
char age;
PERSON ps1;
}STUDENT;
先定義結構體類型 PERSON,再定義結構體 STUDENT,PERSON 作爲它的一個成員。
按照前面的方法,打印各成員的值。
1、定義 STUDENT 指針變量指向數組 ss
STUDENT *stu=(STUDENT *)ss;
2、打印輸出各成員和長度
printf("0x%02x,0x%02x,0x%02x,0x%02x\n",stu->ps1.addr,stu->ps1.name,stu->ps1.id,stu->age);
printf("STUDENT長度=%d字節\n",sizeof(STUDENT));
調換 STUDENT 成員順序,
typedef struct
{
PERSON ps1;
char age;
}STUDENT;
輸出結果:
結構體嵌套其實沒有太意外的東西,只要遵循一定規律即可:
//對於“一錘子買賣”,只對最終的結構體變量感興趣,其中A、B也可刪,不過最好帶着
struct A{
struct B{
int c;
}b;
}a;
//使用如下方式訪問:
a.b.c = 10;
特別的, 可以一邊定義結構體 B,一邊就使用上:
struct A{
struct B{
int c;
}b;
struct B sb;
}a;
使用方法與測試:
a.b.c = 11;
printf("%d\n",a.b.c);
a.sb.c = 22;
printf("%d\n",a.sb.c);
結果無誤。
但是如果嵌套的結構體 B 是在 A 內部才聲明的,並且沒定義一個對應的對象實體 b,這個結構體 B 的大小還是不算進結構體 A 中。
佔用內存空間
struct 結構體,在結構體定義的時候不能申請內存空間,不過如果是結構體變量,聲明的時候就可以分配——兩者關係就像 C++ 的類與對象,對象才分配內存(不過嚴格講,作爲代碼段,結構體定義部分 “.text” 真的就不佔空間了麼?當然,這是另外一個範疇的話題)。
結構體的大小通常(只是通常)是結構體所含變量大小的總和,下面打印輸出上述結構體的 size:
printf("size of struct man:%d\n",sizeof(struct man));
printf("size:%d\n",sizeof(Huqinwei));
結果毫無懸念,都是 28:分別是 char 數組 20,int 變量 4,浮點變量 4。
下邊說說不通常的情況
對於結構體中比較小的成員,可能會被強行對齊,造成空間的空置,這和讀取內存的機制有關。
爲了效率,通常 32 位機按 4 字節對齊,小於的都當 4 字節,有連續小於 4 字節的,可以不着急對齊,等到湊夠了整,加上下一個元素超出一個對齊位置,纔開始調整,比如 3+2 或者 1+4,後者都需要另起(下邊的結構體大小是 8bytes),相關例子就多了,不贅述。
struct s
{
char a;
short b;
int c;
};
相應的,64 位機按 8 字節對齊。不過對齊不是絕對的,用 #pragma pack() 可以修改對齊,如果改成 1,結構體大小就是實實在在的成員變量大小的總和了。
和 C++ 的類不一樣,結構體不可以給結構體內部變量初始化,。
如下,爲錯誤示範:
#include<stdio.h>
//直接帶變量名
struct stuff{
// char job[20] = "Programmer";
// char job[];
// int age = 27;
// float height = 185;
};
PS:結構體的聲明也要注意位置的,作用域不一樣。
C++ 的結構體變量的聲明定義和 C 有略微不同,說白了就是更 “面向對象” 風格化,要求更低。
爲什麼有些函數的參數是結構體指針型
如果函數的參數比較多,很容易產生 “重複 C 語言代碼”,例如:
int get_video(char **name, long *address, int *size, time_t *time, int *alg)
{
...
}
int handle_video(char *name, long address, int size, time_t time, int alg)
{
...
}
int send_video(char *name, long address, int size, time_t time, int alg)
{
...
}
上述 C 語言代碼定義了三個函數:get_video() 用於獲取一段視頻信息,包括:視頻的名稱,地址,大小,時間,編碼算法。
然後 handle_video() 函數根據視頻的這些參數處理視頻,之後 send_video() 負責將處理後的視頻發送出去。下面是一次調用:
char *name = NULL;
long address;
int size, alg;
time_t time;
get_video(&name, &address, &size, &time, &alg);
handle_video(name, address, size, time, alg);
send_video(name, address, size, time, alg);
從上面這段 C 語言代碼來看,爲了完成視頻的一次 “獲取”——“處理”——“發送” 操作,C 語言程序不得不定義多個變量,並且這些變量需要重複寫至少三遍。
雖說 C 語言程序的代碼風格因人而異,但是 “重複的代碼” 永遠是應盡力避免的,不管怎麼說,每次使用這幾個函數,都需要定義很多臨時變量,總是非常麻煩的。所以,這種情況下,完全可以使用 C 語言的結構體語法:
struct video_info
{
char *name;
long address;
int size;
int alg;
time_t time;
};
定義好 video_info 結構體後,上述三個 C 語言函數的參數可以如下寫,請看:
int get_video(struct video_info *vinfo)
{
...
}
int handle_video(struct video_info *vinfo)
{
...
}
int send_video(struct video_info *vinfo)
{
...
}
修改後的 C 語言代碼明顯精簡多了,在函數內部,視頻的各個信息可以通過結構體指針 vinfo 訪問,例如:
printf("video name: %s\n", vinfo->name);
long addr = vinfo->address;
int size = vinfo->size;
事實上,使用結構體 video_info 封裝視頻信息的各個參數後,調用這幾個修改後的函數也是非常簡潔的:
struct video_info vinfo = {0};
get_video(&vinfo);
handle_video(&vinfo);
send_video(&vinfo);
從上述 C 語言代碼可以看出,使用修改後的函數只需定義一個臨時變量,整個代碼變得非常精簡。
讀者應該注意到了,修改之前的 handle_video() 和 send_video() 函數原型如下:
int handle_video(char *name, long address, int size, time_t time, int alg);
int send_video(char *name, long address, int size, time_t time, int alg);
根據這段 C 語言代碼,我們知道 handle_video() 和 send_video() 函數只需要讀取參數信息,並不再修改參數,那爲什麼使用結構體 video_info 封裝數據,修改後的 handle_video() 和 send_video() 函數參數是 struct video_info * 指針型呢?
int handle_video(struct video_info *vinfo);
int send_video(struct video_info *vinfo);
既然 handle_video() 和 send_video() 函數只需要讀取參數信息,那我們就無需再使用指針型了呀?的確如此,這兩個函數的參數直接使用 struct video_info 型也是可以的:
int handle_video(struct video_info vinfo)
{
...
}
int send_video(struct video_info vinfo)
{
...
}
似乎這種寫法和使用 struct video_info * 指針型 參數的區別,無非就是函數內部訪問數據的方式改變了而已。但是,如果讀者能夠想到我們之前討論過的 C 語言函數的 “棧幀” 概念,應該能夠發現,使用指針型參數的 handle_video() 和 send_video() 函數效率更好,開銷更小。
嵌入式開發中,C 語言位結構體用途詳解
在嵌入式開發中,經常需要表示各種系統狀態,位結構體的出現大大方便了我們,尤其是在進行一些硬件層操作和數據通信時。但是在使用位結構體的過程中,是否深入思考一下它的相關屬性?是否真正用到它的便利性,來提高系統效率?
下面將進行一些相關實驗(這裏以項目開發中的實際代碼爲例):
1. 位結構體類型設計
//data structure except for number structure
typedef struct symbol_struct
{
uint_32 SYMBOL_TYPE :5; //data type,have the affect on "data display type"
uint_32 reserved_1 :4;
uint_32 SYMBOL_NUMBER :7; //effective data number in one element
uint_32 SYMBOL_ACTIVE :1;//symbol active status
uint_32 SYMBOL_INDEX :8; //data index in norflash,result is related to "xxx_BASE_ADDR"
uint_32 reserved_2 :8;
}SYMBOL_STRUCT, _PTR_ SYMBOL_STRUCT_PTR;
分析:這裏定義了一個位結構體類型 SYMBOL_STRUCT,那麼用該類型定義的變量都哪些屬性呢?
看下面運行結果:
WORDS 是定義的另一個外層類型定義封裝,可以把它當作變量來看待。WORDS 變量裏前 5 個數據域的地址都是 0x1ffff082c,而 reserved_2 的地址 0x1fff0830, 緊接着的 PressureState 變量是 0x1fff0834。
開始以爲:reserved_1 和 SYMBOL_TYPE 不在一個地址上,因爲他們 5+4 共 9 位,超過了 1 個字節地址,但實際他們共用首地址了;而且 reserved_2 只定義了 8 位,竟然實際佔用了 4 個字節(0x1fff0834 - 0x1fff0830),我本來是想讓他佔用 1 個字節的。
WORDS 整體佔了 8 個字節(0x1fff0834 - 0x1fff082c),設計時分析佔用 5 個字節:
SYMBOL_TYPE 1 個;reserved_1 1 個;
SYMBOL_NUMBER+SYMBOL_ACTIVE 1 個;
SYMBOL_INDEX 1 個;reserved_2 1 個;
**uint_32 reserved_2 : 8; ** 佔用 4 個字節,估計是 uint_32 在起作用,而這裏寫的 8 位,只是我使用的有效位數,另外 24 位空閒,如果在下面再定義一個 uint_32 reserved_3 : 8,地址也是一樣的,都是以 uint_32 爲單位取地址。
同理,上面的 5 個變量,共用一個地址就不足爲奇了。而且有效位的分配不是連續進行的,例如 SYMBOL_TYPE+reserved_1 共 9 位,超過了一個字節,索性系統就分配兩個字節給他們,每人一個;SYMBOL_NUMBER+SYMBOL_ACTIVE 共 8 位,一個字節就能搞定。
2、修改數據結構,驗證上述猜想
//data structure except for number structure
typedef struct symbol_struct
{
uint_8 SYMBOL_TYPE :5; //data type,have the affect on "data display type"
uint_8 reserved_1 :4;
uint_8 SYMBOL_NUMBER :7; //effective data number in one element
uint_8 SYMBOL_ACTIVE :1; //symbol active status
uint_8 SYMBOL_INDEX :8; //data index in norflash,result is related to "xxx_BASE_ADDR"
uint_8 reserved_2 :8;
}SYMBOL_STRUCT,_PTR_ SYMBOL_STRUCT_PTR;
地址數據如下:
當換成 uint_8 後,可以看到地址空間佔用大大減小,reserved_2 只佔用 1 個字節 (0x1fff069f - 0x1fff069e),其他變量也都符合上面的結論猜想。但是,注意看上面黃色和紅色的語句,總感覺有些勉強,那麼我又會想,前兩個變量數據域是 9 位,那麼他們實際上是不是真正的獨立呢?雖然在 uint_8 上面他們是不同的地址,在 uint_32 的時候是不是也是不同的地址空間呢?
3、分析結構體內部的數據域是否連續,看下圖及結果
本來假設: 由前 2 次試驗的結論,一共佔用 8 個字節,節空間佔用:(2+4)+(4+4)+(2+2+4)+(2+2)+(6)。可是,實際效果並不是想的那樣。實際只佔用了 4 個字節,系統並沒有按照預想的方式,爲 RESERVED 變量分配 4 個字節。
分析:
這些數據域,整體相加一共 32 位,佔用 4 個字節 (不考慮數據對齊問題)。而實際確實是佔用了 4 個字節,唯一的原因就是:這些數據域以緊湊的方式鏈接,沒有任何空閒位。實際是不是這樣呢?
看下圖和結果:
這裏爲了驗證是否緊湊鏈接,用到了一個 union 數據,後面會講到用 union 不會對數據組織方式有任何影響,看實際與上次的一樣,也能分析出來。
主要是分析第 2 和第 3 個數據域是否緊密鏈接的。OBJECT_ACTIVE_PRE 賦值 0b00001111,NUMBER_ACTIVE 賦值 0b00000101,其他變量都是 0,看到 WORD 數值 0b1011111000000。分析 WORD 數據,可以看到這款 MCU 還是小端格式 (高位數據在高端,低位數據在低端,這裏不對大小端進行討論),斷開數據變成 (0)10111 11000000,正好是 0101+1111,OBJECT_ACTIVE_PRE 數據域,跨越了兩個字節,並不是剛開始設想的那樣。這就印證了上面的緊密鏈接的結論,也符合數據結果輸出。
4、再次實驗,分析數據是否緊密鏈接,看下圖和結果
可以看到,RESERVED 數據域已經不再屬於 4 個地址空間內了 (0x1fff0518 - 0x1fff051b),但是他們整體加起來還是 32 個位域。這說明數據中間肯定有“空隙” 存在了,空隙在哪?看一下 NUMBER_STATE,如果緊密的話它應該跟 NUMBER_ACTIVE 在同一個字節地址上,可是他們並不在一塊,“空隙”就存在這裏。
這兩個結構體有什麼不一樣?數據類型不一致,一個是 uint_32,一個是 uint_8。
綜上所述:數據類型影響的是編譯器在分配物理空間時的大小單位,uint_32 是以 4 個字節爲單位,而後面的位域則是指在已經分配好的物理空間內部再緊湊的方式分配數據位,當物理空間不能滿足位域時,那麼系統就再次以一定大小單位進行物理空間分配,這個單位就是上面提到的 uint_8 或者 uint_32。
舉例:上面 uint_32 時,這些位域不管是不是在一個字節地址上,如果能夠緊湊的分配在一個 4 字節空間大小上,就直接緊湊分配。如果不能則繼續分配 (總空間超過 4 字節),則再次以 4 字節空間分配,並把新的位域建立在新的地址空間上 (條目 1 上的就是)。當 uint_8 時,很明顯如果位域不能緊湊的放在一個字節空間上,那麼就從新分配新的 1 字節空間大小,道理是一樣的。
**5、結構體組合、共用體組合是否影響上述結論 **
可以看到,系統並沒有因爲位結構體上面有 uint_4 的 4 字節變量或者共用體類型,就改變分配策略把位域都擠到 4 字節之內,看來他們是沒有什麼實質性聯繫的。這裏把 uint_32 改成 uint_8,或者把位結構體也替換掉,經我試驗證明,都是沒有任何影響的。
總結:
1、在操作位結構體時,要關注變量的位域是否在一個變量類型(uint_32 或者 uint_8)上,判斷佔用空間大小。
2、除了位域,還要關注變量定義類型,因爲編譯器空間分配始終是按類型分配的,位域只是指出了有效位 (小於類型佔用空間),而且如果位域大於類型空間,編譯器直接報錯(如 uint_8 test :15,可自行實驗)。
3、這兩個因素都影響變量佔用空間大小,具體可以結合調試窗口,通過地址分配分析判斷。
4、最重要的一點:上面的所有結果,都是基於我自己的 CodeWarrior10.2 和 MQX3.8 分析出來的,不同的編譯環境和操作系統,都可能會有不同的結果;而且即便是環境相同,編譯器的配置和優化選項都有可能影響系統處理結果。結論並不重要,主要想告訴大家這一塊隱藏陷阱,在以後處理類似問題時,要注意分析避讓並掌握方法。
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源:https://mp.weixin.qq.com/s/d5NDVO8FAYQCtDMMc3Ax3w