理解计算机系统_线程(九):线程安全问题

news2026/3/18 2:39:17

前言

以<深入理解计算机系统>(以下称“本书”)内容为基础，对程序的整个过程进行梳理。本书内容对整个计算机系统做了系统性导引,每部分内容都是单独的一门课.学习深度根据自己需要来定

引入

接续理解计算机系统_线程(八):并行-CSDN博客,内容包括12.7.1～12.7.3

概念浅析

本书P716～P719讲了线程安全问题,笔者个人感觉不太好理解,从使用的角度对几个概念梳理.

1.同步和共享是紧密相连的.

凡是说同步问题,必然牵涉到共享数据.再直白一点,函数体内部有全局变量.

2.线程不安全函数=同步+无锁

3.线程安全函数=同步+有锁

4.可重入函数=不同步

如图

同步再分析

从函数,使用的角度再分析同步

1>从函数角度来看,同步属于"程序副作用"(以前提过).同步可看作是多线程下的程序副作用.

2>站在使用者的角度,同步应尽量避免(本书P716第1段:同步从根本上来说是很难的问题,他引出了在普通顺序程序中不会出现的问题.---黑体字是原话),在前一贴并行的讨论中,也是选择了绕开同步.

当同步不可避免时,需要考虑线程安全(加锁)

线程安全

概念:当且仅当被多个并发线程反复地调用时,他会一直产生正确的结果.这就是线程安全函数

笔者用了个简单的视角来看待线程安全的函数:"同步加有锁"---当一个函数的定义中有全局变量,并且在访问全局变量时加上了锁(互斥锁),那他就是线程安全的函数.显然这种看法并不严谨(两点限制:一是目前除了锁以外没有保证线程安全的写法;二是笔者对于线程安全的知识仅来自于本书),除去以上两点限制,笔者的看法是可用的.

本书P716开始介绍了四种线程不安全函数类,都可以概括在内,简单如下理解:

第1类:不保护共享变量的函数

线程函数中使用了共享变量,没加锁.---基础情况

第2类:保持跨越多个调用的状态的函数

本书举了一个例子,如图

线程函数调用的函数中,使用了共享变量.---和1的情况差不多,只不过相当于包装了一层

即使不考虑线程安全,这样写代码(程序副作用)也是比较"忌讳"的.原因是全局变量随时处于被更改的状态,不知道代码当前状态下的全局变量是哪一个了.解决办法在P718可重入性里讲了--传入指针,随时保持全局变量的更新.

本书P716:使得像rand这样的函数线程安全的唯一方式是重写他,使得他不再使用任何static数据,而是依靠调用者在参数中传递状态信息.这样做的缺点是,程序员现在还要被迫修改调用程序中的代码.---黑体字是原话

---解读:笔者认为书中做法和线程安全无关,他说的意思是把程序副作用变为可重入函数,代码如下:

//函数定义
unsigned rand(int replace_data){
    replace_data=replace_data*1103515245+12543;
    return (unsigned)(replace_data>>16)%32768;
}

unsigned srand(unsigned new_seed){
    return new_seed;
}

//以下为调用
int random=srand(rand(1));

和全局变量脱离关系(用的是局部变量),和线程安全更加无关了.

第3类:返回指向静态变量的指针的函数.

某些函数,例如ctime和gethostbyname,将计算结果放在一个static变量中,然后返回一个指向这个变量的指针.有两种方法来处理这类线程不安全函数.一种选择重写函数.一种选择就是使用加锁-复制技术.----黑体字是原话

---解读:实际上这是一种特别的例子.返回值既return了,又从形参返回.解决办法还是加锁.

第4类,调用线程不安全函数的函数.

这4类线程不安全的函数,解决办法都是加锁.举的例子中有些比较特殊,不用过度解读.