C 和彙編如何互相調用?

來自公衆號:一口 Linux

鏈接:https://blog.csdn.net/daocaokafei/article/details/109661116

一、gcc 內聯彙編

內聯彙編即在 C 中直接使用匯編語句進行編程,使程序可以在 C 程序中實現 C 語言不能完成的一些工作,例如,在下面幾種情況中必須使用內聯彙編或嵌入型彙編。

  1. 程序中使用飽和算術運算 (Saturating Arithmetic)

  2. 程序需要對協處理器進行操作

  3. 在 C 程序中完成對程序狀態寄存器的操作

格式:

__asm__ __volatile__("asm code"
 :output
 :input
 :changed registers);

asm 或__asm__開頭,小括號 + 分號,括號內容寫彙編指令。指令 +\n\t 用雙引號引上。

參數

**「asm code」**主要填寫彙編代碼:

"mov r0, r0\n\t" 
"mov r1,r1\n\t" 
"mov r2,r2"

**「output(asm->C)」**用於定義輸出的參數,通常只能是變量:

:"constraint" (variable)
"constraint"用於定義variable的存放位置:
 r 表示使用任何可用的寄存器
 m 表示使用變量的內存地址
 + 可讀可寫
 = 只寫
 & 表示該輸出操作數不能使用輸入部分使用過的寄存器,只能用"+&""=&"的方式使用

**「input(C->asm)」**用於定義輸入的參數,可以是變量也可以是立即數:

:"constraint" (variable/immediate)
"constraint"用於定義variable的存放位置:
 r 表示使用任何可用的寄存器(立即數和變量都可以)
 m 表示使用變量的內存地址
 i 表示使用立即數

Note:

  1. 使用__asm__和__volatile__表示編譯器將不檢查後面的內容,而是直接交給彙編器。

  2. 如果希望編譯器爲你優化,__volatile__可以不加

  3. 沒有 asm code 也不能省略 ""

  4. 沒有前面的和中間的部分,不可以相應的省略:

  5. 沒有 changed 部分,必須相應的省略:

  6. 最後的; 不能省略,對於 C 語言來說這是一條語句

  7. 彙編代碼必須放在一個字符串內,且字符串中間不能直接按回車換行,可以寫成多個字符串,注意中間不能有任何符號,這樣就會將兩個字符串合併爲一個

  8. 指令之間必須要換行,還可以使用 \ t 使指令在彙編中保持整齊

舉例

例 1:無參數,無返回值 這種情況,output 和 input 可以省略:

 asm
 ( //彙編指令
  "mrs r0,cpsr     \n\t"
  "bic r0,r0,#0x80 \n\t"
  "msr cpsr,r0     \n\t"
 );

例 2:有參數 ,有返回值 讓內聯彙編做加法運算,求 a+b,結果存在 c 中

 int a =100, b =200, c =0;
 asm
 (
  "add %0,%1,%2\n\t"
  : "=r"(c)
  : "r"(a),"r"(b)
  : "memory"
 );

%0 對應變量 c %1 對應變量 a %2 對應變量 b

例 3:有參數 2 ,有返回值

讓內聯彙編做加法運算,求 a+b,結果存在 sum 中,把 a-b 的存在 d 中

 asm volatile
 (
  "add %[op1],%[op2],%[op3]\n\t"
  "sub %[op4],%[op2],%[op3]\n\t"
  :[op1]"=r"(sum),[op4]"=r"(d)
  :[op2]"r"(a),[op3]"r"(b)
  :"memory"
 );

%0 對應變量 c %1 對應變量 a %2 對應變量 b

三、ATPCS 規則:(ARM、thumber 程序調用規範)

爲了使單獨編譯的 C 語言程序和彙編程序之間能夠相互調用, 必須爲子程序之間的調用規定一定的規則. ATPCS 就是 ARM 程序和 THUMB 程序中子程序調用的基本規則。

基本 ATPCS 規定了在子程序調用時的一些基本規則,包括下面 3 方面的內容:

  1. 各寄存器的使用規則及其相應的名稱。

  2. 數據棧的使用規則。

  3. 參數傳遞的規則。

  4. 寄存器的使用必須滿足下面的規則:


ATPCS 下 ARM 寄存器的命名:

b2JmWK

2、堆棧使用規則:

ATPCS 規定堆棧爲 FD 類型,即滿遞減堆棧。並且堆棧的操作是 8 字節對齊。

而對於彙編程序來說, 如果目標文件中包含了外部調用, 則必須滿足以下條件:

  1. 外部接口的數據棧一定是 8 位對齊的,也就是要保證在進入該彙編代碼後, 直到該彙編程序調用外部代碼之間, 數據棧的棧指針變化爲偶數個字;

  2. 在彙編程序中使用 PRESERVE8 僞操作告訴連接器, 本彙編程序是 8 字節對齊的.

3、參數的傳遞規則:

根據參數個數是否固定, 可以將子程序分爲參數個數固定的子程序和參數個數可變的子程序. 這兩種子程序的參數傳遞規則是不同的.

1. 參數個數可變的子程序參數傳遞規則

對於參數個數可變的子程序, 當參數不超過 4 個時, 可以使用寄存器 R0~R3 來進行參數傳遞, 當參數超過 4 個時, 還可以使用數據棧來傳遞參數.

在參數傳遞時, 將所有參數看做是存放在連續的內存單元中的字數據。然後, 依次將各名字數據傳送到寄存器 R0,R1,R2,R3; 如果參數多於 4 個, 將剩餘的字數據傳送到數據棧中, 入棧的順序與參數順序相反, 即最後一個字數據先入棧.

按照上面的規則, 一個浮點數參數可以通過寄存器傳遞, 也可以通過數據棧傳遞, 也可能一半通過寄存器傳遞,另一半通過數據棧傳遞。

舉例:

 void func(a,b,c,d,e)
    a -- r0
    b -- r1
    c -- r2
    d -- r3
    e -- 棧

2. 參數個數固定的子程序參數傳遞規則

對於參數個數固定的子程序, 參數傳遞與參數個數可變的子程序參數傳遞規則不同, 如果系統包含浮點運算的硬件部件。

浮點參數將按照下面的規則傳遞: (1)各個浮點參數按順序處理; (2)爲每個浮點參數分配 FP 寄存器;

分配的方法是, 滿足該浮點參數需要的且編號最小的一組連續的 FP 寄存器. 第一個整數參數通過寄存器 R0~R3 來傳遞, 其他參數通過數據棧傳遞.

3、子程序結果返回規則

舉例:
使用 r0 接收返回值

 int func1(int m, int n)
  m  -- r0
  n  -- r1
  返回值給 r0

**「爲什麼有的編程規範要求自定義函數的參數不要超過 4 個?」**答:因爲參數超過 4 個就需要壓棧退棧,而壓棧退棧需要增加很多指令週期。對於參數比較多的情況,我們可以把數據封裝到結構體中,然後傳遞結構體變量的地址。

四、C 語言和彙編相互調用

C 和彙編相互調用要特別注意遵守相應的 ATPCS 規則。

  1. C 調用匯編

例 1:c 調用匯編文件中函數帶返回值 簡化代碼如下,代碼架構可以參考《7. 從 0 開始學 ARM-GNU 僞指令、代碼編譯,lds 使用》。

;.asm                                     
add:
 add r2,r0,r1
 mov r0,r2
    MOV pc, lr

main.c

extern int add(int a,int b);

printf("%d \n",add(2,3));
  1. a->r0,b->r1

  2. 返回值通過 r0 返回計算結果給 c 代碼

例 2,用匯編實現一個 strcopy 函數

;.asm 
.global strcopy
strcopy:      ;R0指向目的字符串 ;R1指向源字符串 
 LDRB R2, [R1]#1   ;加載字字符並更新源字符串指針地址 
 STRB R2, [R0]#1   ;存儲字符並更新目的字符串指針地址 
 CMP R2, #0   ;判斷是否爲字符串結尾 
 BNE strcopy   ;如果不是,程序跳轉到strcopy繼續循環 
 MOV pc, lr   ;程序返回
//.c 
#include <stdio.h> 
extern void strcopy(char* des, const char* src); 
int main(){ 
 const char* srcstr = "yikoulinux"; 
 char desstr[]="test";
 strcopy(desstr, srcstr); 
 return 0; 
}
  1. 彙編調用 C

//.c 
int fcn(int a, int b , int c, int d, int e)
{ 
 return a+b+c+d+e; 
}
;.asm ;
.text .global _start 
_start: 
 STR lr, [sp, #-4]! ;保存返回地址lr 
 ADD R1, R0, R0 ;計算2*i(第2個參數) 
 ADD R2, R1, R0 ;計算3*i(第3個參數) 
 ADD R3, R1, R2 ;計算5*i 
 STR R3, [SP, #-4]! ;第5個參數通過堆棧傳遞 
 ADD R3, R1, R1 ;計算4*i(第4個參數) 
 BL fcn ;調用C程序 
 ADD sp, sp, #4 ;從堆棧中刪除第五個參數 
 .end

假設程序進入 f 時,R0 中的值爲 i ;

int f(int i){
 return fcn(i, 2*i, 3*i, 4*i, 5*i);
}

五、內核實例

爲了讓讀者有個更加深刻的理解, 以內核中的例子爲例:

arch/arm/kernel/setup.c

void notrace cpu_init(void) 
{
    unsigned int cpu = smp_processor_id();----獲取CPU ID 
    struct stack *stk = &stacks[cpu];----獲取該CPU對於的irq abt和und的stack指針
……
#ifdef CONFIG_THUMB2_KERNEL 
#define PLC    "r"----Thumb-2下,msr指令不允許使用立即數,只能使用寄存器。 
#else 
#define PLC    "I" 
#endif    __asm__ ( 
    "msr    cpsr_c, %1\n\t"----讓CPU進入IRQ mode 
    "add    r14, %0, %2\n\t"----r14寄存器保存stk->irq 
    "mov    sp, r14\n\t"----設定IRQ mode的stack爲stk->irq 
    "msr    cpsr_c, %3\n\t" 
    "add    r14, %0, %4\n\t" 
    "mov    sp, r14\n\t"----設定abt mode的stack爲stk->abt 
    "msr    cpsr_c, %5\n\t" 
    "add    r14, %0, %6\n\t" 
    "mov    sp, r14\n\t"----設定und mode的stack爲stk->und 
    "msr    cpsr_c, %7"---回到SVC mode 
        :----上面是code,下面的output部分是空的 
        : "r" (stk),----對應上面代碼中的%0 
          PLC (PSR_F_BIT | PSR_I_BIT | IRQ_MODE),----對應上面代碼中的%1 
          "I" (offsetof(struct stack, irq[0])),----對應上面代碼中的%2 
          PLC (PSR_F_BIT | PSR_I_BIT | ABT_MODE),----以此類推,下面不贅述
          "I" (offsetof(struct stack, abt[0])), 
          PLC (PSR_F_BIT | PSR_I_BIT | UND_MODE), 
          "I" (offsetof(struct stack, und[0])), 
          PLC (PSR_F_BIT | PSR_I_BIT | SVC_MODE) 
        : "r14");----上面是input操作數列表,r14是要clobbered register列表 
}
本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/hvR39QTc4ITZBoZEJJavwQ