Linux 內存管理 - 詳解 mmap 原理

  1. 一句話概括 mmap

mmap 的作用,在應用這一層,是讓你把文件的某一段,當作內存一樣來訪問。將文件映射到物理內存,將進程虛擬空間映射到那塊內存。

這樣,進程不僅能像訪問內存一樣讀寫文件,多個進程映射同一文件,還能保證虛擬空間映射到同一塊物理內存,達到內存共享的作用。

  1. 虛擬內存?虛擬空間?

其實是一個概念,前一篇對於這個詞沒有確切的定義,現在定義一下:

虛擬空間就是進程看到的所有地址組成的空間,虛擬空間是某個進程對分配給它的所有物理地址(已經分配的和將會分配的)的重新映射。

而虛擬內存,爲啥叫虛擬內存,是因爲它就不是真正的內存,是假的,因爲它是由地址組成的空間,所以在這裏,使用虛擬空間這個詞更加確切和易懂。(不過虛擬內存這個詞也不算錯)

2.1 虛擬空間原理

2.1.1 物理內存

首先,物理地址實際上也不是連續的,通常是包含作爲主存的 DRAM 和 IO 寄存器

以前的 CPU(如 X86)是爲 IO 劃分單獨的地址空間,所以不能用直接訪問內存的方式(如指針)IO,只能用專門的方法(in/read/out/write)諸如此類。

現在的 CPU 利用 PCI 總線將 IO 寄存器映射到物理內存,所以出現了基於內存訪問的 IO。

還有一點補充的,就如同進程空間有一塊內核空間一樣,物理內存也會有極小一部分是不能訪問的,爲內核所用。

2.1.2 三個總線

這裏再補充下三個總線的知識,即:地址總線、數據總線、控制總線

比如 CPU 通過控制總線發送讀取命令,同時用地址總線發送要讀取的數據虛地址,經過 MMU 後到內存

內存通過數據總線將數據傳輸給 CPU。

虛擬地址的空間和指令集的地址長度有關,不一定和物理地址長度一致,比如現在的 64 位處理器,從 VA 角度看來,可以訪問 64 位的地址,但地址總線長度只有 48 位,所以你可以訪問一個位於 2^52 這個位置的地址。

2.1.3 虛擬內存地址轉換(虛地址轉實地址)

上面已經明確了虛擬內存是虛擬空間,即地址的集合這一概念。基於此,來說說原理。

如果還記得操作系統課程裏面提到的虛地址,那麼這個虛地址就是虛擬空間的地址了,虛地址通過轉換得到實地址,轉換方式課程內也講得很清楚,虛地址頭部包含了頁號(段地址和段大小,看存儲模式:頁存儲、段存儲,段頁式),剩下部分是偏移量,經過 MMU 轉換成實地址。

存儲方式

如圖則是頁式存儲動態地址變換的方式

虛擬地址頭部爲頁號通過查詢頁表得到物理頁號,假設一頁時 1K,那麼頁號 * 偏移量就得到物理地址

如圖所示,段式存儲

虛擬地址頭部爲段號,段表中找到段基地址加上偏移量得到實地址

段頁式結合兩者,如圖所示。

  1. mmap 映射

至此,如果對虛擬空間已經瞭解了,那麼接下來,作爲 coder,應該自動把虛擬空間無視掉,因爲 Linux 的目的也是要讓更多額進程能享用內存,又不讓進程做麻煩的事情,是將虛擬空間和 MMU 都透明化,讓進程(和 coder)只需要管對內存怎樣使用。

所以現在開始不再強調虛擬空間了。

mmap 就是將文件映射到內存上,進程直接對內存進行讀寫,然後就會反映到磁盤上。

本文由 Readfog 進行 AMP 轉碼,版權歸原作者所有。
來源https://mp.weixin.qq.com/s/nVqt_j1K4NUENRmqQ1NbFQ