操作系统-进程
程序:就是一个指令序列。
程序段、数据段、PCB三部分组成了进程实体(进程映像)。一般情况下,我们把进程实体就简称为进程,例如,所谓创建进程,实质上是创建进程
进程进程的概念进程的定义 程序:就是一个指令序列。 程序段、数据段、PCB三部分组成了进程实体(进程映像)。一般情况下,我们把进程实体就简称为进程,例如,所谓创建进程,实质上是创建进程实体中的PCB;而撤销进程,实质上是撤销进程实体中的PCB。 PCB是进程存在的唯一标志 ! 从不同的角度,进程可以有不同的定义,比较传统典型的定义有: 进程是程序的一次执行过程。进程是一个程序及其数据在处理机上顺序执行时所发生的活动。进程是具有独立功能的程序在数据集合上运行的过程,它是系统进行资源分配和调度的一个独立单位。 进程是进程实体的运行过程,是系统进行资源分配和调度的一个独立单位。 严格来说,进程实体和进程并不一样,进程实体是静态的,进程则是动态的。进程的组成 进程(进程实体)由程序段、数据段、PCB三 部分组成。 进程的管理者(操作系统)所需的数据都在PCB中 程序本身的运行所需的数据存放在程序段和数据段中 PCB 进程的组织 在一个系统中,通常有数十、数百乃至数千个PCB。为了能对他们加以有效的管理,应该用适当的方式把这些PCB组织起来。 注:进程的组成讨论的是一个进程内部由哪些部分构成的问题,而进程的组织讨论的是多个进程之间的组织方式问题 链接方式 索引方式 进程的特征 小结 进程状态及转换三种基本状态 进程是程序的一次执行。在这个执行过程中,有时进程正在被CPU处理,有时又需要等待CPU服务,可见,进程的状态是会有各种变化。为了方便对各个进程的管理,操作系统需要将进程合理地划分为几种状态。 注意:单核处理机环境下,每时刻最多只有一个进程处于运行态。(双核环境下可以同时有两个进程处于运行态) 进程已经拥有了除处理机之外所有需要的资源,一旦获得处理机,即可立即进入运行态开始运行。即:万事俱备,只欠CPU 如:等待操作系统分配打印机、等待读磁盘操作的结果。CPU是计算机中最昂贵的部件,为了提高CPU的利用率,需要先将其他进程需要的资源分配到位,才能得到CPU的服务 另外两种状态 操作系统需要完成创建进程。操作系统为该进程分配所需的内存空间等系统资源,并为其创建、初始化PCB (如:为进程分配PID) 进程运行结束(或者由于bug导致进程无法继续执行下去,比如数组越界错误),需要撤销进程。 操作系统需要完成撤销进程相关的工作。完成将分配给进程的资源回收,撤销进程PCB等工作 进程状态的转换 进程控制 知识总结 进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现进程状态转换等功能。 简化理解:反正进程控制就是要实现进程状态转换 如何实现进程控制? 用原语实现 原语是一种特殊的程序,它的执行具有原子性。也就是说,这段程序的运行必须一气呵成,不可中断 思考:为何进程控制(状态转换)的过程要“一气呵成”? 如果不能“一气呵成”,就有可能导致操作系\统中的某些关键数据结构信息不统一的情况,这会影响操作系统进行别的管理工作。 验证: Eg:假设PCB中的变量 state 表示进程当前所处状态,1表示就绪态,2表示阻塞态… 假设此时进程2等待的事件发生,则操作系统中,负责进程控制的内核程序至少需要做这样两件事: 完成了第一步后收到中断信号,那么PCB2的state=1,但是它却被放在阻塞队列里,现在就产生了不好的操作。 如何实现原语的“原子性”? 原语的执行具有原子性,即执行过程只能一气呵成,期间不允许被中断。 可以用“关中断指令”和“开中断指令”这两个特权指令实现原子性 正常情况:CPU每执行完一条指令都会例行检查是否有中断信号需要处理,如果有,则暂停运行当前这段程序,转而执行相应的中断处理程序。 CPU执行了关中断指令之后,就不再例行检查中断信号,直到执行开中断指令之后才会恢复检查。这样,关中断、开中断之间的这些指令序列就是不可被中断的,这就实现了“原子性” 进程控制相关的原语创建原语 撤消原语 阻塞 唤醒 进程切换 知识滚雪球:程序是如何运行的? 在进程切换时先在PCB中保存这个进程的运行环境(保存一些必要的寄存器信息) 进程控制相关的原语更新PCB中的信息所有的进程控制原语一定都会修改进程状态标志 剥夺当前运行进程的CPU使用权必然需要保存其运行环境某进程开始运行前必然要恢复期运行环境将PCB插入合适的队列分配 / 回收资源如何实现进程控制 进程通信 知识总览 什么是进程通信? 顾名思义,进程通信就是指进程之间的信息交换。 进程是分配系统资源的单位(包括内存地址空间),因此各进程拥有的内存地址空间相互独立。 为了保证安全,一个进程不能直接访问另一个进程的地址空间。 但是进程之间的信息交换又是必须实现的。为了保证进程间的安全通信,操作系统提供了一些方法。 进程通信——共享存储 基于数据结构的共享:比如共享空间里只能放一个长度为10的数组。这种共享方式速度慢、限制多,是一种低级通信方式。 基于存储区的共享:在内存中画出一块共享存储区,数据的形式、存放位置都由进程控制,而不是操作系统。相比之下unix线程切换,这种共享方式速度更快,是一种高级通信方式。 进程通信——管道通信 “管道”是指用于连接读写进程的一个共享文件,又名pipe文件。其实就是在内存中开辟一个大小固定的缓冲区 管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道。各进程要互斥地访问管道。数据以字符流的形式写入管道,当管道写满时,写进程的write() 系统调用将被阻塞,等待读进程将数据取走。当读进程将数据全部取走后,管道变空,此时读进程的read() 系统调用将被阻塞。(缓冲区的特性)如果没写满,就不允许读。如果没读空,就不允许写。(缓冲区的特性)数据一旦被读出,就从管道中被抛弃,这就意味着读进程最多只能有一个,否则可能会有读错数据的情况。进程通信——消息传递 进程间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的“发送消息 / 接收消息”两个原语进行数据交换。 小结 线程线程的概念和特点知识总览 什么是线程,为什么要引入线程? 进程是程序的一次执行。这些功能显然需要用不同的几段程序才能实现,并且这几段程序还要并发运行 当切换进程时,需要保存 / 恢复进程运行环境,还需要切换内存地址空间(更新快表、更新缓存)开销很大 引入线程后,线程是CPU调度的基本单位 线程的优点和特性线程间并发,开销更小 引入线程机制后,并发带来的系统开销降低,系统并发性提升 注意:从属于不同进程的线程间通信,也必须请求操作系统服务! 引入线程前,进程既是资源分配的基本单位,也是调度的基本单位。 引入线程后,进程是资源分配的基本单位,线程是调度的基本单位。线程也有运行态、就绪态、阻塞态 在多CPU环境下,各个线程也可以分派到不同的CPU上并行地执行。 线程几乎不拥有资源,只拥有极少量的资源(线程控制块TCB、寄存器信息、堆栈等) 小结 线程的实现方式多线程模型知识总览 线程的实现方式用户级 历史背景:早期的操作系统(如:早期Unix)只支持进程,不支持线程。当时的“线程”是由线程库实现的 从代码的角度看,线程其实就是一段代码逻辑。上述三段代码逻辑上可以看作三个“线程”。while 循环就是一个最弱智的“线程库”,线程库完成了对线程的管理工作(如调度)。 很多编程语言提供了强大的线程库,可以实现线程的创建、销毁、调度等功能。线程的管理工作由谁来完成?用户级线程由应用程序通过线程库实现,所有的线程管理工作都由应用程序负责(包括线程切换) 2. 线程切换是否需要CPU变态? 用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预。 3. 操作系统是否能意识到用户级线程的存在? 在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。“用户级线程”就是“从用户视角看能看到的线程” 4. 这种线程的实现方式有什么优点和缺点? 优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统 开销小,效率高 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行。内核级 内核级线程(Kernel-Level Thread, KLT, 又称“内核支持的线程”) 由操作系统支持的线程 大多数现代操作系统都实现了内核级线程,如Windows、Linux 1. 线程的管理工作由谁来完成? 内核级线程的管理工作由操作系统内核完成。 2. 线程切换是否需要CPU变态? 线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成。 3. 操作系统是否能意识到内核级线程的存在? 操作系统会为每个内核级线程建立相应的TCB(Thread Control Block,线程控制块),通过TCB对线程进行管理。“内核级线程”就是“从操作系统内核视角看能看到的线程” 4. 这种线程的实现方式有什么优点和缺点? 优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。 缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。多线程模型 在支持内核级线程的系统中,根据用户级线程和内核级线程的映射关系,可以划分为几种多线程模型 一对一 一对一模型:一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程。 优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行。 缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大。 多对一 多对一模型:多个用户级线程映射到一个内核级线程。且一个进程只被分配一个内核级线程。 优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行 操作系统只“看得见”内核级线程,因此只有内核级线程才是处理机分配的单位。多对多 多对多模型:n 用户及线程映射到m 个内核级线程(n >= m)。每个用户进程对应 m 个内核级线程。 克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用户进程占用太多内核级线程,开销太大的缺点。 # 可以这么理解: # 用户级线程是“代码逻辑”的载体 # 内核级线程是“运行机会”的载体 * 一段“代码逻辑”只有获得了“运行机会”才能被CPU执行 内核级线程中可以运行任意一个有映射关系的用户级线程代码,只有两个内核级线程中正在运行的代码逻辑都阻塞时,这个进程才会阻塞 小结 ———————————————— 笔记是抄的,链接就不发了,怕封。 (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |