淺顯易懂 Linux 的啓動流程

今天,一起探討操作系統的啓動流程。

這個部分比較有意思。因爲在 BIOS 階段,計算機的行爲基本上被寫死了,程序員可以做的事情並不多;但是,一旦進入操作系統,程序員幾乎可以定製所有方面。所以,這個部分與程序員的關係更密切。

我主要關心的是 Linux 操作系統,它是目前服務器端的主流操作系統。下面的內容針對的是 Debian 發行版,因爲我對其他發行版不夠熟悉。

   1、加載內核    

操作系統接管硬件以後,首先讀入 /boot 目錄下的內核文件。

以我的電腦爲例,/boot 目錄下面大概是這樣一些文件:

 $ ls /boot
  
  config-3.2.0-3-amd64
  config-3.2.0-4-amd64
  grub
  initrd.img-3.2.0-3-amd64
  initrd.img-3.2.0-4-amd64
  System.map-3.2.0-3-amd64
  System.map-3.2.0-4-amd64
  vmlinuz-3.2.0-3-amd64
  vmlinuz-3.2.0-4-amd64

   2、啓動初始化進程 

內核文件加載以後,就開始運行第一個程序 /sbin/init,它的作用是初始化系統環境。

由於 init 是第一個運行的程序,它的進程編號(pid)就是 1。其他所有進程都從它衍生,都是它的子進程。

   3、確定運行級別    

許多程序需要開機啓動。它們在 Windows 叫做 "服務"(service),在 Linux 就叫做 " 守護進程 "(daemon)。

init 進程的一大任務,就是去運行這些開機啓動的程序。但是,不同的場合需要啓動不同的程序,比如用作服務器時,需要啓動 Apache,用作桌面就不需要。Linux 允許爲不同的場合,分配不同的開機啓動程序,這就叫做 "運行級別"(runlevel)。也就是說,啓動時根據 "運行級別",確定要運行哪些程序。

Linux 預置七種運行級別(0-6)。一般來說,0 是關機,1 是單用戶模式(也就是維護模式),6 是重啓。運行級別 2-5,各個發行版不太一樣,對於 Debian 來說,都是同樣的多用戶模式(也就是正常模式)。

init 進程首先讀取文件 /etc/inittab,它是運行級別的設置文件。如果你打開它,可以看到第一行是這樣的:

id:2:initdefault:

initdefault 的值是 2,表明系統啓動時的運行級別爲 2。如果需要指定其他級別,可以手動修改這個值。

那麼,運行級別 2 有些什麼程序呢,系統怎麼知道每個級別應該加載哪些程序呢?...... 回答是每個運行級別在 / etc 目錄下面,都有一個對應的子目錄,指定要加載的程序。

 /etc/rc0.d
  /etc/rc1.d
  /etc/rc2.d
  /etc/rc3.d
  /etc/rc4.d
  /etc/rc5.d
  /etc/rc6.d

上面目錄名中的 "rc",表示 run command(運行程序),最後的 d 表示 directory(目錄)。下面讓我們看看 /etc/rc2.d 目錄中到底指定了哪些程序。

 $ ls  /etc/rc2.d
  
  README
  S01motd
  S13rpcbind
  S14nfs-common
  S16binfmt-support
  S16rsyslog
  S16sudo
  S17apache2
  S18acpid
  ...

可以看到,除了第一個文件 README 以外,其他文件名都是 "字母 S + 兩位數字 + 程序名" 的形式。字母 S 表示 Start,也就是啓動的意思(啓動腳本的運行參數爲 start),如果這個位置是字母 K,就代表 Kill(關閉),即如果從其他運行級別切換過來,需要關閉的程序(啓動腳本的運行參數爲 stop)。

後面的兩位數字表示處理順序,數字越小越早處理,所以第一個啓動的程序是 motd,然後是 rpcbing、nfs...... 數字相同時,則按照程序名的字母順序啓動,所以 rsyslog 會先於 sudo 啓動。

這個目錄裏的所有文件(除了 README),就是啓動時要加載的程序。如果想增加或刪除某些程序,不建議手動修改 /etc/rcN.d 目錄,最好是用一些專門命令進行管理(參考這裏和這裏)。

   4、加載開機啓動程序    

前面提到,七種預設的 "運行級別" 各自有一個目錄,存放需要開機啓動的程序。不難想到,如果多個 "運行級別" 需要啓動同一個程序,那麼這個程序的啓動腳本,就會在每一個目錄裏都有一個拷貝。這樣會造成管理上的困擾:如果要修改啓動腳本,豈不是每個目錄都要改一遍?

Linux 的解決辦法,就是七個 /etc/rcN.d 目錄裏列出的程序,都設爲鏈接文件,指向另外一個目錄 /etc/init.d ,真正的啓動腳本都統一放在這個目錄中。init 進程逐一加載開機啓動程序,其實就是運行這個目錄裏的啓動腳本。

下面就是鏈接文件真正的指向。

$ ls -l /etc/rc2.d
  
  README
  S01motd -> ../init.d/motd
  S13rpcbind -> ../init.d/rpcbind
  S14nfs-common -> ../init.d/nfs-common
  S16binfmt-support -> ../init.d/binfmt-support
  S16rsyslog -> ../init.d/rsyslog
  S16sudo -> ../init.d/sudo
  S17apache2 -> ../init.d/apache2
  S18acpid -> ../init.d/acpid
  ...

這樣做的另一個好處,就是如果你要手動關閉或重啓某個進程,直接到目錄 /etc/init.d 中尋找啓動腳本即可。比如,我要重啓 Apache 服務器,就運行下面的命令:

$ sudo /etc/init.d/apache2 restart

/etc/init.d 這個目錄名最後一個字母 d,是 directory 的意思,表示這是一個目錄,用來與程序 /etc/init 區分。

   5、用戶登錄  

開機啓動程序加載完畢以後,就要讓用戶登錄了。

一般來說,用戶的登錄方式有三種:

  (1)命令行登錄

  (2)ssh 登錄

  (3)圖形界面登錄

這三種情況,都有自己的方式對用戶進行認證。

**(1)**命令行登錄:init 進程調用 getty 程序(意爲 get teletype),讓用戶輸入用戶名和密碼。輸入完成後,再調用 login 程序,覈對密碼(Debian 還會再多運行一個身份覈對程序 / etc/pam.d/login)。如果密碼正確,就從文件 /etc/passwd 讀取該用戶指定的 shell,然後啓動這個 shell。

**(2)**ssh 登錄:這時系統調用 sshd 程序(Debian 還會再運行 / etc/pam.d/ssh ),取代 getty 和 login,然後啓動 shell。

**(3)**圖形界面登錄:init 進程調用顯示管理器,Gnome 圖形界面對應的顯示管理器爲 gdm(GNOME Display Manager),然後用戶輸入用戶名和密碼。如果密碼正確,就讀取 / etc/gdm3/Xsession,啓動用戶的會話。

   6、進去 Login shell   

所謂 shell,簡單說就是命令行界面,讓用戶可以直接與操作系統對話。用戶登錄時打開的 shell,就叫做 login shell。

Debian 默認的 shell 是 Bash,它會讀入一系列的配置文件。上一步的三種情況,在這一步的處理,也存在差異。

**(1)**命令行登錄:首先讀入 /etc/profile,這是對所有用戶都有效的配置;然後依次尋找下面三個文件,這是針對當前用戶的配置。

  ~/.bash_profile
  ~/.bash_login
  ~/.profile

需要注意的是,這三個文件只要有一個存在,就不再讀入後面的文件了。比如,要是 ~/.bash_profile 存在,就不會再讀入後面兩個文件了。

**(2)**ssh 登錄:與第一種情況完全相同。

**(3)**圖形界面登錄:只加載 /etc/profile 和 ~/.profile。也就是說,~/.bash_profile 不管有沒有,都不會運行。

   7、打開 non-login shell   

老實說,上一步完成以後,Linux 的啓動過程就算結束了,用戶已經可以看到命令行提示符或者圖形界面了。但是,爲了內容的完整,必須再介紹一下這一步。

用戶進入操作系統以後,常常會再手動開啓一個 shell。這個 shell 就叫做 non-login shell,意思是它不同於登錄時出現的那個 shell,不讀取 / etc/profile 和. profile 等配置文件。

non-login shell 的重要性,不僅在於它是用戶最常接觸的那個 shell,還在於它會讀入用戶自己的 bash 配置文件 ~/.bashrc。大多數時候,我們對於 bash 的定製,都是寫在這個文件裏面的。

你也許會問,要是不進入 non-login shell,豈不是. bashrc 就不會運行了,因此 bash 也就不能完成定製了?事實上,Debian 已經考慮到這個問題了,請打開文件 ~/.profile,可以看到下面的代碼:

  if [ -n "$BASH_VERSION" ]; then    
      if [ -f "$HOME/.bashrc" ]; then      
          . "$HOME/.bashrc"    
      fi  
  fi

上面代碼先判斷變量 $BASH_VERSION 是否有值,然後判斷主目錄下是否存在 .bashrc 文件,如果存在就運行該文件。第三行開頭的那個點,是 source 命令的簡寫形式,表示運行某個文件,寫成 "source ~/.bashrc" 也是可以的。

因此,只要運行~/.profile 文件,~/.bashrc 文件就會連帶運行。但是上一節的第一種情況提到過,如果存在~/.bash_profile 文件,那麼有可能不會運行~/.profile 文件。解決這個問題很簡單,把下面代碼寫入. bash_profile 就行了。

  if [ -f ~/.profile ]; then    
      . ~/.profile
  fi

這樣一來,不管是哪種情況,.bashrc 都會執行,用戶的設置可以放心地都寫入這個文件了。

Bash 的設置之所以如此繁瑣,是由於歷史原因造成的。早期的時候,計算機運行速度很慢,載入配置文件需要很長時間,Bash 的作者只好把配置文件分成了幾個部分,階段性載入。系統的通用設置放在 /etc/profile,用戶個人的、需要被所有子進程繼承的設置放在. profile,不需要被繼承的設置放在. bashrc。

順便提一下,除了 Linux 以外, Mac OS X 使用的 shell 也是 Bash。但是,它只加載. bash_profile,然後在. bash_profile 裏面調用. bashrc。而且,不管是 ssh 登錄,還是在圖形界面裏啓動 shell 窗口,都是如此。

原文:http://www.ruanyifeng.com/blog/2013/08/

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/cTJ8uoxmxQfRg8jis4UXjg