8080是一个8位CPU,但是却有16根地址线,可以寻址64K。其内存寻址方案非常简单:把一个16位地址放到地址线上,然后取出存放在那个位置处的8位值。内存系统中地址线的根数和存放在每个位置上的数据的位数没有直接的关系。16位地址可以用两个寄存器给出。
8086是16位CPU,有20根地址线,可以寻址1M。1M内存可视作多个64K内存段,通过指定64K段地址与段内偏移可标识一个内存地址。这种设计就是分段模式。
1M内存需要20根地址线寻址,需要两个16位寄存器。采用如下方式:
逻辑地址 = 段地址:偏移地址
物理地址 = 段地址 << 4 + 偏移地址
注意不是左移16位。如果左移16位,1M内存被均分为互不重叠、首尾相接的16个64K内存段。而左移4位,任意16字节对齐的地址均可作为段首地址,有64K个段地址。这样,16位段寄存器可取任意值,寻址非常灵活,同一个物理地址比如00034h,其逻辑地址可为:
0003:0004
0002:0014
0001:0024
0000:0034
这种设计给新程序造成很大的不便,那些一次需要大于64K的程序不得不使用64K的段,通过切换进入和离开段寄存器的值来实现这些内存块之间的切换。
80386出现了保护模式与分页机制,地址总线与通用寄存器长度达到了32位,可寻址4G内存,似乎不再需要分段。为了兼容性,分段模式保留了下来,段寄存器用于指定段描述符。保护模式下的段由段描述符来描述,里面包含了很多属性,如:段起始地址、长度、是否可读、是否可写、是否可执行、是否驻在内存等。
分段与分页机制在很大程度上功能重叠,且分页机制更为先进。分段机制是CPU固有功能,无法关闭,因此,很多操作系统选择忽略分段模式,这就是平坦内存模型:将段地址固定为0,段长度为4G,偏移地址可指向任意地址。
与分段机制不同,分页机制可以开启和关闭。若关闭,由段地址+偏移地址所得就是物理地址。若开启,由段地址+偏移地址所得叫线性地址,因为呈现给进程的是0-4G的空间,就算内存只有512M,或有内存漏洞(一些设备或BIOS占据了部分内存空间),进程依然可以使用0-4G的线性地址空间。线性地址也叫虚拟地址,因为线性地址是不存在的,毕竟当只有512M内存时,依旧可以寻址4G的内存。
线性地址被输送到页部件,页部件会输出一个物理内存上的真实地址,也就是物理地址。所谓分页机制就是将线性地址空间的4G内存划分为固定大小的虚拟页(如:4K),同时也将物理内存(例如:512M)划分为4K大小的物理页,同时创建一些表格记录虚拟页与物理页的对应关系(举个例子:访问A虚拟页中内存实际是访问B物理页中内存),这些表格叫做页表。页部件通过查询页表将线性地址翻译为物理地址。
页表由操作系统创建并维护,然后交给页部件。操作系统为每一个进程维护一份页表,进程切换时,同时为页部件切换页表。页表内容是动态的,因为进程不停打开关闭、执行不同区域代码、使用交换分区等。
举个例子,变量a的地址为逻辑地址A,经过分段机制转换为线性地址B,经过页部件变为物理地址C。
页表除了记录虚拟页与物理页的对应关系外,还记录了一些页属性,如:是否可读、是否可写、是否可执行、是否驻在内存等。当虚拟页对应的物理页不在内存时,会触发中断,操作系统会为该虚拟页分配物理页,并在页表中建立对应关系。当虚拟页短时间内不会被访问时,其对应的物理页会被挪作他用。
由于每个进程有一份页表,理论上页表所占空间很大,但是CPU和操作系统使用多级页表技术大大降低了页表所占空间。
我写了一个小项目桃花源(英文名为 peach),该项目是一个迷你虚拟机,用于学习 Intel 硬件虚拟化技术。学习该项目可使读者对 CPU 虚拟化、内存虚拟化技术有个感性、直观的认识,为学习 KVM 打下坚实的基础。peach 实现了如下功能:
- 使用Intel VT-x技术实现CPU虚拟化
- 使用EPT技术实现内存虚拟化
- 支持虚拟x86实模式运行环境
- 支持虚拟CPUID指令
- 支持虚拟HLT指令,Guest利用HLT指令关机
代码仓库如下:
https://gitee.com/pandengyang/peach.git
https://github.com/pandengyang/peach.git
本文暂时没有评论,来添加一个吧(●'◡'●)