为什么磁盘采用4KB的页

前置概念:

页表是一种特殊的数据结构，放在系统空间的页表区，存放逻辑页与物理页帧的对应关系。每一个进程都拥有一个自己的页表，PCB表中有指针指向页表。

逻辑地址转换成物理地址的过程是：用页号p去检索页表，从页表中得到该页的物理块号，把它装入物理地址寄存器中。同时，将页内地址d直接送入物理地址寄存器的块内地址字段中。这样，物理地址寄存器中的内容就是由二者拼接成的实际访问内存的地址，从而完成了从逻辑地址到物理地址的转换。

用固定大小的页(Page)来描述逻辑地址空间，用相同大小的页框(Frame)来描述物理内存空间，由操作系统实现从逻辑页到物理页框的页面映射，同时负责对所有页的管理和进程运行的控制。

正文

在使用4KB作为磁盘的分页前，大部分磁盘驱动器厂商采用的是512B的分页。美国国家半导体32016机器上的页大小为512字节，对于16MB内存大小的计算机来说可以处理32768个页面。即使每个页面只需要16字节的开销，整体就需要512KB的内存空间，即内存的1/32。

对于操作系统来说，现在Linux每逻辑分页的开销为64字节，当然，在32位系统中linux对每页的开销为32字节。

4KB磁盘驱动已经在90年代就已经出现了。但是在2009年，西部数据才正式主推4KB的磁盘分页驱动器。

在90年代，人们发现随着磁盘驱动器容量的扩大512字节领域的意义越来越小，在以MB为单位统计磁盘大小的时候512字节是在技术因素与保持最小浪费空间中所达成的良好平衡。

在进行硬盘驱动器设计时需要平衡三个因素：面密度、读取驱动器盘片时的信噪比（SNR）以及错误检查和纠正（ECC）。当面密度增加，扇区变小，其SNR降低。为了保持可靠性，需要对ECC进行改进，而改进的方式就是使用更多的位数。

各种面密度的SNR

在这种时候，磁盘驱动商们需要往面密度中添加尽可能多的ECC，否则无法保证数据的可靠性。因此，提高ECC校验块的大小就成了最好的解决办法。对于大块，ECC在更大的数据块上使用效率更高，虽然对于单个大块比在512上需要的空间更多，但是平均下来的空间利用率比512要小得多。

对于4K扇区来说需要100字节的ECC数据，而对于8位操作系统上的512扇区来说需要320字节的数据（40 x 8）。而且随着数据量的增多，每次发生错误的错误数据规模也在增加，对于4KB的错误数据来说，需要擦除8个512规模的扇区，而4KB扇区只需要擦除一个。

为什么选4KB而不是2KB或者8KB呢？

有一个因素是在x86处理器上正常内存页面也为4KB（当然也有4MB）。x86页面大小又导致文件系统簇（文件系统中最小的存储单元）变为4KB，因为4KB簇恰好适合内存页面。在数据总量增长的同时，对于小文件以及小的簇的需求也在逐渐减少，即小于4KB的文件少，浪费空间。这也导致NTFS，EXT3和HFS+在现代磁盘驱动器上均默认4KB簇，因此4KB物理扇区与4KB逻辑簇完美映射，而4KB文件系统与4KB内存页面完美映射。因此，目前4KB是磁盘驱动器的完美分页大小。