Linux线程(二): 线程控制之创建
一、线程相关概念知识补充1.1 提升检索的方法TLBCPU给MMU传虚拟地址MMU去问TLB有没有 TLB全称为转移后备缓冲器也俗称快表是集成在CPU内的一段存储空间它与MMU紧密协同工作。其核心作用是缓存虚拟地址到物理地址的映射关系以此提升地址转化效率避免直接查页表带来的多次访存延迟。当CPU进行虚拟地址到物理地址的转化时MMU会优先在TLB中查询是否有对应的映射若命中则直接获取物理地址无需再访问内存中的页表若未命中才会通过查页表获取物理地址并同步将该映射关系添加到TLB中刷新记录进而加快后续的地址转化速度。TLBTranslation Lookaside Buffer的关键特性速度TLB在CPU芯片内访问速度≈寄存器比内存快100倍容量通常64-1024项存放最常用的映射进程切换必须刷新TLB或标记无效因为不同进程页表不同1.2 缺页中断缺页中断是CPU访问虚拟地址时因未在 TLB 和 页表 中找到对应物理页且虚拟地址合法而触发的硬件异常核心作用是实现虚拟内存的按需分配具体内容如下触发条件与本质当CPU传递虚拟地址进行物理地址转化时若TLB和页表均未命中对应物理页但该虚拟地址处于进程锁定的合法地址空间内CPU硬件会自动触发缺页异常本质是操作系统对物理内存的延迟申请机制——仅在程序真正需要访问对应内存时才触发物理内存的分配。处理流程程序中断与入口切换缺页异常产生后用户程序被中断CPU转而执行中断向量表中对应的缺页中断处理方法由内核处理器接管处理。按类型分类处理硬件缺页主要缺页错误若物理内存中无对应物理页操作系统会查找管理物理内存的数据结构申请物理内存将内存的占用标志位设为使用中随后构建物理页框与页表的映射关系若数据在磁盘还需从磁盘读取数据到物理内存再完成映射。次要缺页错误若物理内存中已存在对应物理页如动态库被其他进程提前载入则无需读取数据仅需建立虚拟地址与该物理页的映射关系即可。越界与无效情况区分若触发异常的虚拟地址页号非法或地址超出进程内存映射范围会被判定为越界或无效缺页错误操作系统会直接终止进程而非执行内存申请与映射。核心价值缺页中断实现了虚拟内存的延迟申请程序申请虚拟地址空间时无需立即分配物理内存仅在真正访问时触发中断分配。未使用的内存可分配给其他进程大幅提升了内存的使用充分度是虚拟内存机制的核心支撑。1.3 如何理解 new/malloc用户态内存申请malloc 本质用户态向内核申请内存的接口底层依赖系统调用brk/sbrk/mmap。小内存申请128KB用brk扩展堆低地址向上扩展复用空闲内存块。大内存申请128KB用mmap映射匿名页独立虚拟区域释放直接 munmap。new vs mallocnew 是 C 运算符底层调用 malloc还会调用构造函数。malloc 是 C 库函数仅分配内存不初始化。核心逻辑用户态 malloc≠直接分配物理内存是分配虚拟地址空间物理内存由缺页异常延迟分配。1.4 如何区分越界 / 缺页类型核心特征内核处理方式缺页虚拟地址有映射但无物理页分配物理页建立页表映射软 / 硬缺页越界虚拟地址无映射或权限非法判定为非法地址发送 SIGSEGV 信号判断依据内核查vmavm_area_struct若虚拟地址不在任何 vma 范围内→越界若在 vma 内但无物理页→缺页。1.5 是不是线程越多越好线程过多的问题切换开销爆炸线程切换需保存 / 恢复上下文线程数 CPU 核心数时切换成本占比飙升反而降低效率。资源竞争共享资源全局变量、锁竞争加剧导致死锁、性能下降。内存溢出每个线程默认栈大小8MB线程过多会耗尽进程内存。合理线程数计算密集型CPU 核心数 1避免线程空闲时切换浪费。I/O 密集型CPU 核心数 ×2~4IO 等待时线程切换利用空闲 CPU。1.6 为什么 I/O 的时候创建多线程是好的I/O 密集型核心特征线程大部分时间阻塞等待 IO如 read/write/recvCPU 空闲。多线程价值一个线程阻塞时操作系统调度其他线程执行充分利用 CPU避免资源浪费。多线程可并发处理多个 IO 请求如网络服务端每个线程处理一个连接提升并发量。对比单线程单线程 I/O 时一个请求阻塞整个程序停滞无法处理其他请求。1.7 什么是计算密集型 / I/O 密集型1计算密集型定义程序运行时大部分时间在做 CPU 计算IO 操作极少CPU 利用率高。特征任务数值计算、数据加密、矩阵运算、算法竞赛CCF / 算法赛。资源需求高 CPU 算力、低延迟内存访问。瓶颈CPU 性能而非 IO / 网络。2I/O 密集型定义程序运行时大部分时间在等待 IO磁盘 / 网络 / 用户输入CPU 空闲时间多。特征任务网络请求HTTP、文件读写、数据库操作、日志处理。资源需求高并发 IO 处理、低 IO 延迟。瓶颈IO 速度而非 CPU 性能。GPU 核心设计大量计算核心流处理器专为并行计算优化无复杂 IO 控制单元。计算密集型场景图形渲染顶点 / 片元着色器计算并行处理大量像素 / 顶点。大模型训练 / 推理矩阵乘法、张量运算海量并行计算。科学计算流体力学、气象模拟并行处理数据块。对比 CPUCPU 有复杂的分支预测、缓存、IO 控制适合通用场景GPU 无 IO 冗余纯计算效率拉满。二、进程和线程2.1 进程和线程进程是资源分配的基本单位线程是调度的基本单位2-2 进程的多个线程共享同一地址空间因此Tex Segment、Data Segmentt 都是共享的如果定义一个函数在线程中都可以调用如果定义一个全局变量在各个线程中都可以访问到除此之外各线程还共享以下进程资源和环境文件描述符表每个信号的处理方式SIG_IGNSIG_DFL 或者自定义的信号处理函数当前工作目录用户id和组id关系图对于之前学习的单进程其实是只有一个线程执行流的进程三、线程控制在linux中如果想要创建多线程需要用到第三方库3.1 POSIX线程库在Linux下编写多线程程序几乎都使用POSIX线程库简称pthread。它定义了一套标准API在所有遵循POSIX的系统上通用Linux、macOS、BSD等。头文件#include pthread.h编译链接gcc program.c -lpthread注意是小写l-lpthread函数命名所有线程相关函数都以pthread_开头例如pthread_create创建pthread_self获取自身IDpthread_exit退出pthread_cancel取消pthread_join等待pthread_detach分离⚠️ 注意pthread库中的函数不修改全局errno而是直接返回错误码。这和很多系统调用如open、read不同需要适应。3.2 创建线程int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine)(void *), void *arg);参数thread输出型参数线程创建成功后线程ID会存入这里。attr线程属性如栈大小、调度策略。传NULL表示使用默认属性。start_routine线程启动后要执行的函数返回void*参数也是void*。arg传递给start_routine的参数。返回值成功返回0失败返回正数错误码如EAGAIN、EINVAL等。3-2-1 线程创建demo#include iostream #include string #include pthread.h #include unistd.h void *threadrun(void *args) { std::string name (const char *)args; while (true) { std::cout 我是新线程:name: name std::endl; sleep(1); } return nullptr; } int main() { pthread_t tid; pthread_create(tid, nullptr, threadrun, (void *)thread-1); while (true) { std::cout 我是主线程... std::endl; sleep(1); } return 0; }查询一共有多少个进程在运行 ps ajx | head -1 ps ajx | grep test_thread用ps -aL命令可以看到每个线程实际上都是一个独立的 LWP它们拥有独立的 PID进程 ID但共享同一组虚拟地址空间CPU 调度时依据的是 LWP而非用户层面的线程概念ps -aLLWP:轻量级进程CPU 调度的时候 看lwp !!!!Linux 系统不存在真正意义上的线程它所谓的线程概念是使用轻量级进程模拟的。但 OS 中只有轻量级进程所谓模拟线程是我们的说法3-2-2 核心理论解析1. 资源分配时间片等分双核创建两个线程总时间片均分地址空间共享父子进程通过clone()系统调用实现2. 异常传播特性崩溃影响范围任一线程崩溃导致整个进程终止信号处理所有线程共享信号处理动作健壮性对比多线程程序比多进程更容易整体崩溃3. 资源共享问题显示器竞争多个线程并发写入终端导致输出混乱解决方案预告后续将引入互斥锁(Mutex)机制3-3-3 为什么要有线程库系统调用与用户层的封装Linux 只提供创建轻量级进程的系统调用如clone用户只需要关心线程不需要关心底层的 LWP 实现pthread 库将创建轻量级进程的细节封装起来向用户提供统一的线程操作接口层级说明用户层pthread 库提供线程创建、同步、销毁等接口内核层实际创建的是轻量级进程LWP本质用户级线程—— 在线程库层面实现的线程概念链接 pthread 库编译多线程程序时必须链接 pthread 库# 错误示例未链接库 g -o test_thread TestThread.cc # 报错undefined reference to pthread_create # 正确做法 g -o test_thread TestThread.cc -lpthread # 使用 C11 线程时也要链接 g -stdc11 -o test_thread TestThread.cc -lpthread实现原理平台底层实现LinuxC11 的std::thread本质封装了 pthread 库Windows封装 Windows 创建线程的接口如CreateThread跨平台原理所有平台各实现一份通过条件编译形成统一接口的库。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2516895.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!