一、进程的概念、组成、 特征

1、进程的定义

  程序是静态的,是个存放在磁盘里的可执行文件,是一系列的指令集合。而进程(Process)是动态的,是程序的一次执行过程(同一个程序多次执行会对应多个进程)。

  操作系统需要对各个并发运行的进程进行管理,但凡管理时所需要的信息,都会被放在PCB中。程序段、数据段、PCB 三部分组成了进程实体(进程映像)。一般情况下,我们把进程实体就简称为进程。

  引入进程实体的概念后,进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。一个进程被“调度”,就是指操作系统决定让这个进程上 CPU 运行。进程和进程实体严格来说是不同的,进程实体是静态的,进程是动态的。进程实体反应了进程在某一时刻的状态。

2、进程的组成

  进程(进程实体)由程序段、数据段、PCB 三部分组成。PCB 是给操作系统用的;程序段、数据段是给进程自己用的。

image.png

  PCB 是进程存在的唯一标志,当进程被创建时,操作系统为其创建 PCB,当进程结束时,会回收其 PCB。操作系统对进程进行管理工作所需的信息都存在 PCB 中。

1CASPIU98WPX0S1FEFL.png

3、进程的组织

  在一个系统中,通常有数十、数百乃至数千个 PCB。为了能对他们加以有效的管理,应该用适当的方式把这些 PCB 组织起来。进程的组成讨论的是一个进程内部由哪些部分构成的问题,而进程的组织讨论的是多个进程之间的组织方式问题。

(1)链接方式

  按照进程状态将 PCB 分为多个队列,操作系统持有指向各个队列的指针:

  • 执行指针:指向当前处于运行态(执行态)的进程,单 CPU 计算机中,同一时刻只会有一个进程处于运行态;
  • 就绪队列指针:指向当前处于就绪态的进程,优先级高的进程方在队头;
  • 阻塞队列指针:指向当前处于阻塞态的进程,很多操作系统还会根据阻塞原因不同,再分为多个阻塞队列。
(2)索引方式

  根据进程状态的不同,建立几张索引表,操作系统持有指向各个索引表的指针:

  • 执行指针:指向当前处于运行态(执行态)的进程;
  • 就绪表指针:建立就绪索引表;
  • 阻塞表指针:建立阻塞表。

4、进程的特征

  程序是静态的,进程是动态的,相比于程序,进程拥有以下特征:

1EIAIVSJX4499EA92.png

5、总结

AIXJYGDSZAQH3B8CU.png

二、进程的状态与转换

  进程是程序的一次执行,在这个执行过程中,有时进程正在被 CPU 处理,有时又需要等待 CPU 服务。为了方便对各个进程的管理,操作系统需要将进程合理地划分为几种状态。

  进程 PCB 中,会有一个变量 state 来表示进程的当前状态。如:1 表示创建态、2 表示就绪态、3 表示运行态… 为了对同一个状态下的各个进程进行统一的管理,操作系统会将各个进程的PCB 组织起来。

1、进程的三种基本状态

0WQAWZARGJGFAESRXQ.png

2、进程的另外两种状态

  创建态:进程正在被创建时,它的状态是“创建态”,在这个阶段操作系统会为进程分配资源、初始化 PCB。

  终止态:一个进程可以执行 exit 系统调用,请求操作系统终止该进程。此时该进程会进入“终止态”。进程从系统中撤销,操作系统会回收进程拥有的资源、撤销 PCB。

image.png

3、进程状态的转换

image.png

4、总结

image.png

三、进程的控制

  进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现进程状态转换等功能。简单来说就是实现进程状态的转换。

1、原语

  原语采用“关中断指令”和“开中断指令”实现。CPU 执行了关中断指令之后,就不再例行检查中断信号,直到执行开中断指令之后才会恢复检查。关/开中断指令的权限非常大,只允许在核心态下执行的特权指令。

  进程控制用原语来实现。因为原语是一种特殊的程序,它的执行具有原子性(执行期间不允许中断)。也就是说,这段程序的运行必须一气呵成,不可中断。

进程控制会导致进程状态的转换,无论哪个原语,要做的无非三类事情:

  • 更新 PCB 中的信息;
    • 所有的进程控制原语一定都会修改进程状态标志;
    • 剥夺当前进程的 CPU 使用权必然需要保存其运行环境;
    • 某进程开始运行前必然要恢复其运行环境。
  • 将 PCB 插入合适的队列中;
  • 分配/回收资源。

2、进程的创建

DIMOGSH2WRIBWAYRL.png

3、进程的终止

6TDGVB4PED645GMPNL5H8.png

4、进程的阻塞和唤醒

JA8TSTNR5QW7W2JD26.png

5、进程的切换

CVFEKODE1P77G9T.png

6、总结

H1GNL1TE0E8EUOBK.png

四、进程的通信

  顾名思义,进程通信就是指进程之间的信息交换。进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。为了保证安全,一个进程不能直接访问另一个进程的地址空间。 但是进程之间的信息交换又是必须实现的。为了保证进程间的安全通信,操作系统提供了一些方法。

1、共享存储

  所谓共享存储,就是两个进程有一个共享的存储空间。两个进程对共享空间的访问必须是互斥的(互斥访问通过操作系统提供的工具实现)。操作系统只负责提供共享空间和同步互斥工具(如:P、V操作)。

  • 基于数据结构的共享:比如共享空间里只能放 一个长度为 10 的数组。这种共享方式速度慢、 限制多,是一种低级通信方式。
  • 基于存储区的共享:在内存中画出一块共享存储区,数据的形式、存放位置都由进程控制,而不是操作系统。相比之下,这种共享方式速度更快,是一种高级通信方式。

2、消息传递

  进程间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的“发送消息/接收消息”两个原语进行数据交换。

  消息由消息头和消息体组成。消息头包括:发送进程 ID、接受进程 ID、消息类型、消息长度等格式化的信息(计算机网络中发送的“报文”其实就是一种格式化的消息)。

  • 直接通信方式:消息直接挂到接收进程的消息缓冲队列上;
  • 间接通信方式:消息要先发送到中间实体(信箱)中,因此也称“信箱通信方式”。

3、管道通信

  管道是指用于连接读写进程的一个共享文件,又名 pipe 文件。其实就是在内存中开辟 一个大小固定的缓冲区。

  • 管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道。
  • 各进程要互斥地访问管道。
  • 数据以字符流的形式写入管道,当管道写满时,写进程的 write() 系统调用将被阻塞,等待读进程将数据取走。当读进程将数据全部取走后,管道变空,此时读进程的 read() 系统调用将被阻塞。
  • 如果没写满,就不允许读。如果没读空,就不允许写。
  • 数据一旦被读出,就从管道中被抛弃,这就意味着读进程最多只能有一个,否则可能会有读错数据的情况。

4、总结

image.png

五、线程与多线程

  有的进程可能需要“同时”做很多事,而传统的进程只能串行地执行一系列程序。为此,引入了“线程”,来增加并发度。可以把线程理解为“轻量级进程”。线程是一个基本的 CPU 执行单元,也是程序执行流的最小单位。

1、引入线程机制后,有什么变化?

  引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务(如:QQ 视频、文字聊天、传文件)。引入线程后,进程只作为除 CPU 之外的系统资源的分配单元(如:打 印机、内存地址空间等都是分配给进程的)。 线程则作为处理机的分配单元。

image.png

2、线程的属性

Y3D8ZF282Q5HZD1OI2S.png

3、线程的实现方式

(1)用户级线程
  • 用户级线程由应用程序通过线程库实现,所有的线程管理工作都由应用程序负责(包括线程切换)。
  • 用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。
  • 在用户看来是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。用户级线程就是从用户视角看能看到的线程。
  • 优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高。
  • 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。

NKNH1I4WIGKYYDFKZW.png

(2)内核级线程
  • 内核级线程的管理工作由操作系统内核完成。
  • 线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。
  • 操作系统会为每个内核级线程建立相应的 TCB(ThreadControlBlock,线程控制块),通过 TCB 对线程进行管理。内核级线程就是从操作系统内核视角看能看到的线程。
  • 优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
  • 缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。

YLX4S3N2ANAH6YX.png

4、多线程模型

  在支持内核级线程的系统中,根据用户级线程和内核级线程的映射关系,可以划分为几种多线程模型。

(1)一对一模型

  一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。

  • 优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。
  • 缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。
(2)多对一模型

  多个用户级线程映射到一个内核级线程。且一个进程只被分配一个内核级线程。

  • 优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高。
  • 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。
(3)多对多模型

  n 用户级线程映射到 m 个内核级线程(n>=m)。每个用户进程对应 m 个内核级线程。 克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。

5、总结

0FLUW4R0DMYS49Q6QAO.png


标题:进程的描述与控制——操作系统笔记
作者:Yi-Xing
地址:http://47.94.239.232/articles/2020/11/21/1605930164723.html
博客中若有不恰当的地方,请您一定要告诉我。前路崎岖,望我们可以互相帮助,并肩前行!