[特殊字符] 深入理解 Linux 内核进程管理:架构、核心函数与调度机制

news2025/6/8 23:12:19

Linux 内核作为一个多任务操作系统,其进程管理子系统是核心组成部分之一。无论是用户应用的运行、驱动行为的触发,还是系统调度决策,几乎所有操作都离不开进程的创建、调度与销毁。本文将从进程的概念出发,深入探讨 Linux 内核中进程管理的架构、关键结构体、核心函数以及调度机制,帮助读者全面理解进程管理的内部实现。


1️⃣ 进程管理概述

1.1 什么是进程管理?

在操作系统中,进程是资源分配和调度的基本单位。Linux 内核通过进程管理子系统实现对进程的创建、调度、同步和终止等操作。掌握进程管理,有助于深入理解内核的调度策略与系统行为,在嵌入式开发、系统调试、驱动开发与性能调优等方面提供底层逻辑支持。

1.2 Linux 进程管理架构概览

Linux 内核的进程管理架构主要包括以下模块:

模块名称核心职责关键结构 / 函数示例相关源码位置
进程描述结构体描述进程状态、资源、调度信息task_structthread_infoinclude/linux/sched.h
进程创建机制创建进程、复制上下文、初始化资源fork()do_fork()copy_process()kernel/fork.c
程序执行加载替换进程地址空间并执行新程序execve()do_execveat_common()fs/exec.ckernel/exec_domain.c
进程退出机制释放资源、通知父进程、进入僵尸态exit()do_exit()release_task()kernel/exit.c
进程调度器管理调度实体、决定谁运行、支持多种调度策略schedule()、CFS、rqsched_classkernel/sched/core.cfair.c
上下文切换切换执行流、保存/恢复 CPU 状态context_switch()switch_to()kernel/sched/core.carch/*/kernel/
进程状态管理控制进程运行/睡眠/终止状态,便于调度与同步TASK_RUNNINGTASK_INTERRUPTIBLEinclude/linux/sched.h
阻塞与唤醒机制通过等待队列控制休眠/唤醒流程,协调资源争用wait_queue_head_twake_up()kernel/sched/wait.cinclude/linux/wait.h
调度策略与优先级支持普通、实时调度,动态调整权重与时间片SCHED_NORMALSCHED_FIFOnicekernel/sched/ 各调度策略子模块
用户态/内核态交互系统调用入口、堆栈切换、权限切换sys_clone()do_syscall_64()arch/arm64/kernel/entry.Skernel/

2️⃣ 进程的状态

在 Linux 中,进程的状态主要包括:

  • TASK_RUNNING:可运行状态,正在运行或准备运行。
  • TASK_INTERRUPTIBLE:可中断睡眠状态,等待某事件发生。
  • TASK_UNINTERRUPTIBLE:不可中断睡眠状态,通常用于等待 I/O 操作完成。
  • TASK_STOPPED:停止状态,进程被暂停。
  • TASK_TRACED:被跟踪状态,进程正在被调试。
  • EXIT_ZOMBIE:僵尸状态,进程已终止但尚未被父进程回收。
  • EXIT_DEAD:死亡状态,进程资源已被释放。

这些状态的转换由内核调度器根据系统资源和进程行为进行管理。


3️⃣ 进程管理核心架构

3.1 task_struct 结构体

内核通过 task_struct 结构体来描述一个进程,它被称为进程描述符(Process Descriptor),保存着支撑一个进程正常运行的所有信息。
在这里插入图片描述

task_struct 包含的信息包括:

  • 进程状态(如运行、睡眠等)
  • 进程标识符(PID)
  • 父子进程关系
  • 调度信息(如优先级、调度策略)
  • 内存管理信息(如地址空间)
  • 文件系统信息(如打开的文件)
  • 信号处理信息
  • 安全信息(如权限)

通过 task_struct,内核可以全面管理和调度进程。

3.2 核心函数

3.2.1 kernel_clone()

kernel_clone() 是 Linux 内核中用于创建新进程或线程的核心函数之一,广泛用于内核线程创建、系统调用 clone()clone3() 的实现中。它负责准备和校验参数、决定是否进行 ptrace 跟踪、调用 copy_process() 完成进程复制,并处理进程唤醒与后续收尾逻辑。

其主要步骤包括:

  1. 参数校验,防止 CLONE_PIDFDCLONE_PARENT_SETTID 指向同一地址。
  2. 判断是否需要触发 ptrace 跟踪事件,如 PTRACE_EVENT_FORKCLONEVFORK
  3. 调用 copy_process() 创建并初始化新进程的 task_struct
  4. 添加系统熵,增强内核熵池。
  5. 调度器事件追踪,记录进程创建事件。
  6. 获取新进程的 PID,并根据需要写入 parent_tid
  7. 若设置了 CLONE_VFORK,初始化同步机制,并在父进程阻塞等待。
  8. 若未共享地址空间(非 CLONE_VM),设置内存 LRU 跟踪。
  9. 唤醒新创建的子进程,启动任务调度。
  10. 如果启用了 ptrace 事件,发送通知。
  11. 如果是 vfork,阻塞当前进程直到子进程释放 VM。
  12. 释放 PID 引用,防止内存泄漏。
  13. 返回子进程 PID。
3.2.2 copy_process()

copy_process() 是内核创建新进程(包括 fork、vfork、clone 和内核线程)的核心函数,它的实现逻辑极其庞大。其主要职责包括:

  1. 复制当前进程的 task_struct 结构体,分配内存并初始化任务栈。
  2. 复制用户凭据(uid/gid/capability),对应 clone_flagsCLONE_NEWUSER 等。
  3. 初始化延迟统计结构,仅用于性能跟踪。
  4. 调度器层面初始化新任务,分配调度相关结构。
  5. 初始化 perf 事件跟踪数据,支持性能事件分析。
  6. 分配审计信息结构,针对安全模块。
  7. 安全模块初始化,如 SELinux,与 LSM(Linux 安全模块)有关。
  8. 复制 SYSV 信号量取消状态,若使用信号量。
  9. 文件描述符表复制,区分共享与独立 fd 表。
  10. 复制 fs_struct(cwd/root 等),控制工作目录和挂载点的继承。
  11. 复制信号处理函数表,若不共享 sighand(CLONE_SIGHAND)。
  12. 创建新的 signal_struct(信号相关状态)

接续上文,本文将继续深入探讨 Linux 内核进程管理的关键机制,包括进程调度策略、上下文切换过程以及相关核心结构体的作用。


4️⃣ 进程调度机制

4.1 调度的基本概念

进程调度的核心任务是决定哪个进程在何时运行。调度器依据一定的策略,从就绪队列中选择一个进程分配 CPU 时间。调度策略的设计直接影响系统的响应速度、吞吐量和公平性。

4.2 调度策略分类

Linux 内核支持多种调度策略,主要包括:

  • SCHED_NORMAL(或 SCHED_OTHER):默认的时间共享调度策略,适用于普通进程。
  • SCHED_BATCH:适用于批处理作业,优化吞吐量。
  • SCHED_IDLE:用于系统空闲时运行的低优先级任务。
  • SCHED_FIFO 和 SCHED_RR:实时调度策略,适用于对响应时间有严格要求的任务。
  • SCHED_DEADLINE:基于截止时间的调度策略,适用于具有明确时间约束的任务。

4.3 完全公平调度器(CFS)

CFS(Completely Fair Scheduler)是 Linux 内核自 2.6.23 版本起引入的默认调度器,旨在为所有进程提供公平的 CPU 时间分配。([linux-audit.com][1])

4.3.1 核心理念

CFS 模拟一个理想的多任务处理器,假设所有进程可以同时并行运行。由于实际硬件无法实现真正的并行,CFS 引入了“虚拟运行时间”(vruntime)的概念,用于衡量进程的实际运行时间与其应得运行时间之间的差距。([zh.wikipedia.org][2])

4.3.2 数据结构

CFS 使用红黑树(Red-Black Tree)作为就绪队列的数据结构,每个节点表示一个可调度实体(sched_entity),按照 vruntime 进行排序。调度器总是选择 vruntime 最小的进程进行调度。

4.3.3 时间片计算

CFS 不使用固定的时间片,而是根据系统的目标延迟(target latency)和就绪队列中的进程数量动态计算每个进程的时间片,确保每个进程在目标延迟内至少运行一次。([medium.com][3])


5️⃣ 上下文切换机制

5.1 上下文切换的定义

上下文切换是指操作系统保存当前运行进程的状态,并恢复另一个进程的状态,使其能够继续执行的过程。这是实现多任务处理的基础。

5.2 上下文切换的触发时机

上下文切换可能在以下情况下发生:

  • 当前进程主动放弃 CPU(例如,调用 schedule())。
  • 当前进程被阻塞(例如,等待 I/O 操作完成)。
  • 系统发生中断或异常。
  • 当前进程的时间片耗尽。

5.3 上下文切换的实现过程

在 Linux 内核中,上下文切换主要由 context_switch() 函数完成,其过程包括:

  1. 调用 prepare_task_switch() 准备切换。
  2. 调用 arch_start_context_switch() 执行架构相关的切换操作。
  3. 根据需要切换内存地址空间(即更新页表)。
  4. 保存当前进程的寄存器状态。
  5. 恢复目标进程的寄存器状态。
  6. 调用 finish_task_switch() 完成切换。([linux-kernel-labs.github.io][4])

整个过程确保了进程的执行环境被完整保存和恢复,实现了进程之间的无缝切换。


6️⃣ 调度相关的核心结构体

6.1 sched_class

sched_class 是一个结构体,定义了调度器的行为和操作函数指针,如选择下一个任务、任务入队出队等。不同的调度策略(如 CFS、实时调度器)通过实现各自的 sched_class 来定义其调度逻辑。

6.2 sched_entity

sched_entitytask_struct 中的一个成员,表示一个可调度的实体,包含了调度相关的信息,如 vruntime、权重等。在 CFS 中,调度器通过操作 sched_entity 来管理进程的调度。


7️⃣ 总结

Linux 内核的进程管理机制涵盖了从进程的创建、调度到终止的完整生命周期。通过深入理解 task_structkernel_clone()copy_process()、CFS 调度器以及上下文切换的实现,可以更好地掌握内核的工作原理,为系统优化和问题排查提供坚实的基础。

希望本文能帮助您构建起完整的进程管理知识体系,深入理解 Linux 内核的精妙设计。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2404682.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Flutter:下拉框选择

![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/d4 b70dec92594838a8b2c130717938aa.png) 文档地址dropdown_button2 // 限价、市价 状态final List<String> orderTypes [普通委托, 市价委托];String? selectedOrderType 普通委托;changeOrderType(String …

SpringAI(GA):Nacos2下的分布式MCP

原文链接地址&#xff1a;SpringAI(GA)&#xff1a;Nacos2下的分布式MCP 教程说明 说明&#xff1a;本教程将采用2025年5月20日正式的GA版&#xff0c;给出如下内容 核心功能模块的快速上手教程核心功能模块的源码级解读Spring ai alibaba增强的快速上手教程 源码级解读 版…

[AI绘画]sd学习记录(二)文生图参数进阶

目录 7.高分辨率修复&#xff1a;以小博大8.细化器&#xff08;Refiner&#xff09;&#xff1a;两模型接力9.随机数种子&#xff08;Seed&#xff09;&#xff1a;复现图片吧 本文接续https://blog.csdn.net/qq_23220445/article/details/148460878?spm1001.2014.3001.5501…

CRM管理系统中的客户分类与标签管理技巧:提升转化率的核心策略

在客户关系管理(CRM)领域&#xff0c;有效的客户分类与标签管理是提升销售效率、优化营销ROI的关键。据统计&#xff0c;使用CRM管理系统进行科学客户分层的企业&#xff0c;客户转化率平均提升35%(企销客数据)。本文将深入解析在CRM管理软件中实施客户分类与标签管理的最佳实践…

怎么解决cesium加载模型太黑,程序崩溃,不显示,位置不对模型太大,Cesium加载gltf/glb模型后变暗

有时候咱们cesium加载模型时候型太黑&#xff0c;程序崩溃&#xff0c;不显示&#xff0c;位置不对模型太大怎么办 需要处理 可以联系Q:424081801 谢谢 需要处理 可以联系Q:424081801 谢谢

【AI系列】BM25 与向量检索

博客目录 引言&#xff1a;信息检索技术的演进第一部分&#xff1a;BM25 算法详解第二部分&#xff1a;向量检索技术解析第三部分&#xff1a;BM25 与向量检索的对比分析第四部分&#xff1a;融合与创新&#xff1a;混合检索系统 引言&#xff1a;信息检索技术的演进 在信息爆…

模拟法解题的思路与算法分享

我们先来看思路与算法&#xff1a; 使用变长数组对栈进行模拟。 如果操作是 &#xff0c;那么访问数组的后两个得分&#xff0c;将两个得分之和加到总得分&#xff0c;并且将两个得分之和入栈。如果操作是 D&#xff0c;那么访问数组的最后一个得分&#xff0c;将得分乘以 2 …

mysql密码正确SpringBoot和Datagrip却连接不上

报错信息&#xff1a;SQLException: Access denied for user ‘root‘‘localhost‘ (using password: YES&#xff09; 原因可能是是有端口号冲突 我这里是禅道端口与MySQL冲突&#xff0c;禅道端口也是3306&#xff0c;ctrlaltdelete打开任务管理器&#xff0c;关闭mysqlzt …

高保真组件库:数字输入框

拖入一个文本框。 拖入一个矩形,作为整个数字输入框的边框,边框颜色为灰色DCDEE2,圆角半径为4。 拖入一个向上的箭头图标作为增加按钮,再拖入一个矩形,将向上箭头图标放入矩形内。矩形:18x15,边框颜色DCDEE2,边框左下可见,箭头图标:8x5,矩形置底,组合在一起命名”增…

【Linux】awk 命令详解及使用示例:结构化文本数据处理工具

【Linux】awk 命令详解及使用示例&#xff1a;结构化文本数据处理工具 引言 awk 是一种强大的文本处理工具和编程语言&#xff0c;专为处理结构化文本数据而设计。它的名称来源于其三位创始人的姓氏首字母&#xff1a;Alfred Aho、Peter Weinberger 和 Brian Kernighan。 基…

紫光同创FPGA系列实现Aurora 8b/10b协议

特性 1.兼容XILINX aurora IP核 2.支持X1、X2、X4、X8模式&#xff08;根据硬件条件选择模式&#xff09; 3.支持FRAMING和STREAMING 用户接口 4.自动初始化和维护链路状态 5.支持热插拔 6.支持扰码、解扰 7.支持流量控制 8.支持crc用户数据 9.支持全双工或者半双工模式 10.最…

DAY 44 预训练模型

知识点回顾&#xff1a; 预训练的概念常见的分类预训练模型图像预训练模型的发展史预训练的策略预训练代码实战&#xff1a;resnet18 &#xff08;一&#xff09;预训练的概念 我们发现准确率最开始随着epoch的增加而增加。随着循环的更新&#xff0c;参数在不断发生更新。 所以…

【NLP中向量化方式】序号化,亚编码,词袋法等

1.序号化 将单词按照词典排序&#xff0c;给定从0或者1或者2开始的序号即可&#xff0c;一般情况有几 个特征的单词: PAD表示填充字符&#xff0c;UNK表示未知字符 在这个例子中&#xff0c;我们可以看到我们分别将3个文本分为了4个token&#xff0c;每个token用左侧的词典表示…

C++学习-入门到精通【16】自定义模板的介绍

C学习-入门到精通【16】自定义模板的介绍 目录&#xff09; C学习-入门到精通【16】自定义模板的介绍前言一、类模板创建一个自定义类模板&#xff1a;Stack\<T\> 二、使用函数模板来操作类模板特化的对象三、非类型形参四、模板类型形参的默认实参五、重载函数模板 前言…

源码级拆解:如何搭建高并发「数字药店+医保购药」一体化平台?

在全民“掌上看病、线上购药”已成常态的今天&#xff0c;数字药店平台正在以惊人的速度扩张。而将数字药店与医保系统打通&#xff0c;实现线上医保购药&#xff0c;更是未来互联网医疗的关键拼图。 那么&#xff0c;如何从技术底层搭建一个 支持高并发、可扩展、安全合规的数…

Hadoop 3.x 伪分布式 8088端口无法访问问题处理

【Hadoop】YARN ResourceManager 启动后 8088 端口无法访问问题排查与解决(伪分布式启动Hadoop) 在配置和启动 Hadoop YARN 模块时&#xff0c;发现虽然 ResourceManager 正常启动&#xff0c;JPS 进程中也显示无误&#xff0c;但通过浏览器访问 http://主机IP:8088 时却无法打…

零基础在实践中学习网络安全-皮卡丘靶场(第十期-Over Permission 模块)

经过这么长时间的学习&#xff0c;我相信大家已经有了很大的信心&#xff0c;有可能会有看不起的意思&#xff0c;因为皮卡丘是基础靶场&#xff0c;但是俗话说"基础不牢&#xff0c;地动山摇"&#xff0c;所以还请大家静下心来进行学习 来翻译一下是什么意思&#…

毕设 基于机器视觉的驾驶疲劳检测系统(源码+论文)

文章目录 0 前言1 项目运行效果2 课题背景3 Dlib人脸检测与特征提取3.1 简介3.2 Dlib优点 4 疲劳检测算法4.1 眼睛检测算法4.2 打哈欠检测算法4.3 点头检测算法 5 PyQt55.1 简介5.2相关界面代码 6 最后 0 前言 &#x1f525;这两年开始毕业设计和毕业答辩的要求和难度不断提升…

学习STC51单片机30(芯片为STC89C52RCRC)

每日一言 当你感到疲惫时&#xff0c;正是成长的关键时刻&#xff0c;再坚持一下。 IIC协议 是的&#xff0c;IIC协议就是与我们之前的串口通信协议是同一个性质&#xff0c;就是为了满足模块的通信&#xff0c;其实之前的串口通信协议叫做UART协议&#xff0c;我们千万不要弄…

Python-进程

进程 简介 操作系统分配资源的基本单位 创建 依赖 依赖模块 multiprocessing 中的 Process 语法 Process(group[,target[,name[,args[,kwargs]]]]) target&#xff1a;如果传递了函数的引用&#xff0c;这个子进程就执行这里的代码args&#xff1a;元组的方式传递&#x…