一、磁盘的结构
1、磁盘、磁道、扇区、盘面、柱面的概念
磁盘的表面由一些磁性物质组成,可以用这些磁性物质来记录二进制数据。
2、如何在磁盘中读/写数据
读/写数据时需要把“磁头”移动到想要读/写的扇区所在的磁道。磁盘会转起来,让目标扇区从磁头下面划过,才能完 成对扇区的读/写操作。
磁盘的物理地址
可用(柱面号,盘面号,扇区号)来定位任意一个“磁盘块”。文件数据存放在外存中的几号块,这个块号就可以转换成(柱面号,盘面号,扇区号) 的地址形式。可根据该地址读取一个“块”:
- 根据“柱面号”移动磁臂,让磁头指向指定柱面;
- 激活指定盘面对应的磁头;
- 磁盘旋转的过程中,指定的扇区会从磁头下面划过,这样就完成了对指定扇区的读/写。
3、磁盘分类
根据磁头分类
- 磁头可以移动的称为活动头磁盘,磁臂可以来回伸缩来带动磁头定位磁道;
- 磁头不可移动的称为固定头磁盘,这种磁盘中每个磁道有一个磁头。
根据磁盘分类
- 盘片可以更换的称为可换盘磁盘;
- 盘片不可更换的称为固定盘磁盘。
4、总结
二、磁盘调度算法
1、一次磁盘读/写操作需要的时间
(1)寻找时间
寻找时间(寻道时间)TS:在读/写数据前,将磁头移动到指定磁道所花的时间。
- 启动磁头臂是需要时间的,假设耗时为 s;
- 移动磁头也是需要时间的,假设磁头匀速移动,每跨越一个磁道耗时为 m,总共需要跨越 n 条磁道;
- 寻道时间 $ TS =s+m*n$
(2)延迟时间
延迟时间 TR:通过旋转磁盘,使磁头定位到目标扇区所需要的时间。设磁盘转速为 r(单位:转/秒,或转/分),则平均所需的延迟时间 $ TR =(1/2)*(1/r)=1/(2r)$ (1/r 就是转一圈需要的时间。找到目标扇区平均需要转半圈,因此再乘以 1/2)。
(3)传输时间
传输时间 Tt:从磁盘读出或向磁盘写入数据所经历的时间,假设磁盘转速为 r,此次读/写的字节数为 b,每个磁道上的字节数为 N。则: 传输时间 $ Tt =(1/r)* (b/N)=b/(rN)$。
(4)总平均存取时间
总平均存取时间 $ Ta =TS +1/(2r)+b/(rN)$,延迟时间和传输时间都与磁盘转速相关,且为线性相关。而转速是硬件的固有属性,因此操作系统也无法优化延迟时间和传输时间。
2、先来先服务算法(FCFS)
根据进程请求访问磁盘的先后顺序进行调度。假设磁头的初始位置是 100 号磁道,有多个进程先后陆续地请求访问 55、58、39、18、90、160、150、38、184号磁道。
按照 FCFS 的规则,按照请求到达的顺序,磁头需要依次移动到 55、58、39、18、90、160、150、38、184号磁道。
- 磁头总共移动了 45+3+19+21+72+70+10+112+146=498 个磁道;
- 响应一个请求平均需要移动 498/9=55.3 个磁道(平均寻找长度);
- 优点:公平;如果请求访问的磁道比较集中的话,算法性能还算过的去;
- 缺点:如果有大量进程竞争使用磁盘,请求访问的磁道很分散,则FCFS在性能上很差,寻道时间长。
3、最短寻找时间优先(SSTF)
SSTF 算法会优先处理的磁道是与当前磁头最近的磁道。可以保证每次的寻道时间最短,但是并不能保证总的寻道时间最短。(其实就是贪心算法的思想,只是选择眼前最优,但是总体未必最优)
假设磁头的初始位置是100号磁道,有多个进程先后陆续地请求访问55、58、39、18、90、160、150、38、184号磁道。
- 磁头总共移动了 (100-18)+(184-18)=248 个磁道;
- 响应一个请求平均需要移动 248/9=27.5 个磁道(平均寻找长度);
- 优点:性能较好,平均寻道时间短;
- 缺点:可能产生“饥饿”现象。
4、扫描算法(SCAN)
SSTF 算法会产生饥饿的原因在于:磁头有可能在一个小区域内来回来去地移动。为了防止这个问题,可以规定,只有磁头移动到最外侧磁道的时候才能往内移动,移动到最内侧磁道的时候才能往外移动。这就是扫描算法(SCAN)的思想。由于磁头移动的方式很像电梯,因此也叫电梯算法。
假设某磁盘的磁道为 0~200 号,磁头的初始位置是 100 号磁道,且此时磁头正在往磁道号增大的方向移动,有多个进程先后陆续地请求访问 55、58、39、18、90、160、150、38、184号磁道。(只有到了最边上的磁道才能改变磁头移动方向)
- 磁头总共移动了 (200-100)+(200-18)=282 个磁道;
- 响应一个请求平均需要移动 282/9=31.3 个磁道(平均寻找长度);
- 优点:性能较好,平均寻道时间较短,不会产生饥饿现象;
- 缺点:只有到达最边上的磁道时才能改变磁头移动方向,事实上,处理了 184 号磁道的访问请求之后就不需要再往右移动磁头了。SCAN 算法对于各个位置磁道的响应频率不平均。
LOOK 调度算法
扫描算法(SCAN)中,只有到达最边上的磁道时才能改变磁头移动方向,事实上,处理了 184 号磁道的访问请求之后就不需要再往右移动磁头了。LOOK 调度算法就是为了解决这个问题,如果在磁头移动方向上已经没有别的请求,就可以立即改变磁头移动方向。(边移动边观察,因此叫 LOOK,如果在磁头移动方向上已经没有别的请求,就可以立即改变磁头移动方向)
- 磁头总共移动了 (184-100)+(184-18)=250 个磁道;
- 响应一个请求平均需要移动 250/9=27.5 个磁道(平均寻找长度);
- 优点:比起 SCAN 算法来,不需要每次都移动到最外侧或最内侧才改变磁头方向,使寻道时间进 一步缩短。
5、循环扫描算法(C-SCAN)
SCAN 算法对于各个位置磁道的响应频率不平均,而 C-SCAN 算法就是为了解决这个问题。规定只有磁头朝某个特定方向移动时才处理磁道访问请求,而返回时直接快速移动至起始端而不处理任何请求。
假设某磁盘的磁道为 0~200 号,磁头的初始位置是 100 号磁道,且此时磁头正在往磁道号增大的方向移动,有多个进程先后陆续地请求访问 55、58、39、18、90、160、150、38、184号磁道。(只有到了最边上的磁道才能改变磁头移动方向。磁头返回途中不处理任何请求)
- 磁头总共移动了 (200-100)+(200-0)+(90-0)=390 个磁道;
- 响应一个请求平均需要移动 390/9=43.3 个磁道(平均寻找长度);
- 优点:比起 SCAN 来,对于各个位置磁道的响应频率很平均。;
- 缺点:只有到达最边上的磁道时才能改变磁头移动方向,事实上,处理了 184 号磁道的访问请求之后就不需要再往右移动磁头了;并且,磁头返回时其实只需要返回到18号磁道即可,不需要返回到最边缘的磁道。另外,比起 SCAN 算法来,平均寻道时间更长。
C-LOOK 调度算法
C-SCAN 算法的主要缺点是只有到达最边上的磁道时才能改变磁头移动方向,并且磁头返回时不一定需要返回到最边缘的磁道上。C-LOOK 算法就是为了解决这个问题。如果磁头移动的方向上已经没有磁道访问请求了,就可以立即让磁头返回,并且磁头只需要返回到有磁道访问请求的位置即可。
假设某磁盘的磁道为 0~200 号,磁头的初始位置是 100 号磁道,且此时磁头正在往磁道号增大的方向移动,有多个进程先后陆续地请求访问 55、58、39、18、90、160、150、38、184号磁道。(磁头只需要返回最靠近边缘的、并且需要访问的磁道上即可)
- 磁头总共移动了 (184-100)+(184-18)+(90-18)=322 个磁道;
- 响应一个请求平均需要移动 322/9=35.8 个磁道(平均寻找长度);
- 优点:比起 C-SCAN 算法来,不需要每次都移动到最外侧或最内侧才改变磁头方向,使寻道时间进一步缩短。
6、总结
三、减少延迟时间的方法
延迟时间:通过旋转磁盘,使磁头定位到目标扇区所需要的时间。
1、交替编号
假设要连续读取橙色区域的 2、3、4 扇区:磁头读取一块的内容(也就是一个扇区的内容)后,需要一小段时间处理,而盘片又在不停地旋转因此,如果 2、3 号扇区相邻着排列,则读完 2 号扇区后无法连续不断地读入 3 号扇区必须等盘片继续旋转,3 号扇区再次划过磁头,才能完成扇区读入。
结论:磁头读入一个扇区数据后需要一小段时间处理,如果逻辑上相邻的扇区在物理上也相邻,则读入几个连续的逻辑扇区,可能需要很长的“延迟时间”。
若采用交替编号的策略,即让逻辑上相邻的扇区在物理上有一定的间隔,可以使读取连续的逻辑扇区所需要的延迟时间更小。
2、磁盘地址结构的设计
为什么? 磁盘的物理地址是(柱面号,盘面号,扇区号) 而不是(盘面号,柱面号,扇区号)。
假设某磁盘有 8 个柱面/磁道(假设最内侧柱面/磁道号为 0 ), 4 个盘面,8 个扇区。则可用 3 个二进制位表示柱面,2 个二进制位表示盘面,3 个二进制位表示扇区。
若物理地址结构是(盘面号,柱面号,扇区号),且需要连续读取物理地址 (00,000,000) ~ (00,001,111)
的扇区时。(00,000,000) ~ (00,000,111)
转两圈可读完;在读 (00,001,000) ~ (00,001,111)
之前,需要启动磁头臂,将磁头移动到下一个磁道。
若物理地址结构是(柱面号,盘面号,扇区号),且需要连 续读取物理地址 (000,00,000) ~ (000,01,111)
的扇区:(000,00,000) ~ (000,00,111)
由盘面 0 的磁头读入数据;在读 (000,01,000) ~ (000,01,111)
,由于柱面号/磁道号相同,只是盘面号不同,因此不需要移动磁头臂。只需要激活相邻盘面的磁头即可。
所以读取地址连续的磁盘块时,采用(柱面号,盘面号,扇区号)的地址结构可以减少磁头移动消耗的时间。
3、错位命名
若相邻的盘面相对位置相同处扇区编号相同。读取完磁盘块(000, 00,111)之后,需要短暂的时间处理,而盘面又在不停地转动,因此当(000,01,000)第一次划过 1 号盘面的磁头下方时,并不能读取数据,只能再等该扇区再次划过磁头。
错位命名法:由于采用错位命名法,因此读取完磁盘块(000,00,111)之后,还有一段时间处理,当(000,01,000)第一次划过 1 号盘面的磁头下方时,就可以直接读取数据。从而减少了延迟时间。
4、总结
四、磁盘的管理
1、磁盘初始化
- 进行低级格式化(物理格式化),将磁盘的各个磁道划分为扇区。一个扇区通常可分为头、数据区域(如:512B大小)、尾 三个部分组成。管理扇区所需要的各种数据结构一般存放在头、尾两个部分,包括扇区校验码(如:奇偶校验、CRC 循环冗余校验码等,校验码用于校验扇区中的数据是否发生错误);
- 将磁盘分区,每个分区由若干柱面组成(即分为我们熟悉的 C盘、D盘、E盘);
- 进行逻辑格式化,创建文件系统。包括创建文件系统的根目录、初始化存储空间管理所用的数据结构(如:位示图、 空闲分区表)。
2、引导块
计算机开机时需要进行一系列初始化的工作,这些初始化工作是通过执行初始化程序(自举程序)完成的。
初始化程序可以放在 ROM (只读存储器)中。ROM 中的数据在出厂时就写入了(集成在主板上),并且以后不能再修改。万一需要更新自举程序,将会很不方便,因为 ROM 中的数据无法更改。如何解决呢?
将完整的自举程序放在磁盘的启动块(即引导块/启动分区)上,启动块位于磁盘的固定位置。而 ROM 中只存放很小的“自举装入程序”,开机时计算机先运行“自举装入程序”,通过执行该程序就可找到引导块,并将完整的“自举程序”读入内存,完成初始化。拥有启动分区的磁盘称为启动磁盘或系统磁盘(C:盘)。
3、坏块的管理
坏了、无法正常使用的扇区就是“坏块”。这属于硬件故障,操作系统是无法修复的。应该将坏块标记出来,以免错误地使用到它。
对于简单的磁盘,可以在逻辑格式化时(建立文件系统时)对整个磁盘进行坏块检查,标明哪些扇区是坏扇区,比如:在 FAT 表上标明。(在这种方式中,坏块对操作系统不透明)
对于复杂的磁盘,磁盘控制器(磁盘设备内部的一个硬件部件)会维护一个坏块链表。 在磁盘出厂前进行低级格式化(物理格式化)时就将坏块链进行初始化。会保留一些“备用扇区”,用于替换坏块。这种方案称为扇区备用。且这种处理方式中,坏块对操作系统透明。
4、总结
标题:磁盘存储器的管理——操作系统笔记
作者:Yi-Xing
地址:http://47.94.239.232:10014/articles/2020/12/01/1606834017080.html
博客中若有不恰当的地方,请您一定要告诉我。前路崎岖,望我们可以互相帮助,并肩前行!