本文转载自微信公众号「后端技术指南针」,图解腾讯题作者指南针氪金入口 。打工道多转载本文请联系后端技术指南针公众号。线程 1. 骚动的面试周五 小黑是大白前同事,现在俩人在不同的图解腾讯题公司,但是打工道多都做后端开发工作。 虽然两个人都在北京,线程但是面试距离不算近,一个在望京,图解腾讯题一个在中关村,打工道多算是线程北京几大IT聚集圈之二了。 两个人日常除了工作,面试业余活动并不多,图解腾讯题当然头发也不多,打工道多宇宙中心五道口成了二人的线程集结地。 眨了5次眼,又到周五了,仿佛空气都弥漫着明天放假的欢快气息,当然还有骚动的大白和小黑: 大白看着时间差不多了,检查完上线监控报警,没啥问题,背上电脑走出了写字楼。 中关村到五道口还是比较近的,香港云服务器扫上低碳环保的青桔单车,一路向北到北大东门转弯来到了五道口地区。 小黑也坐上13号线,人贴人差点挤成肉饼,美食召唤下他还是在8点准时到了老地方。 大白:黑哥,你啥时候面的腾讯?挂了?你咋不找我内推我们公司呀! 小黑:还没挂,等GM面呢,你们公司手撕红黑树,整不了啊。 大白:就你这样,这么喜欢穿红卫衣和黑裤子,不问你红黑树才怪。话说腾讯都问啥了? 小黑:腾讯的面试整体感觉还是不错的,面试很宽泛,从操作系统、网络到系统设计、常用组件都会问,并且不偏不怪。 大白:那确实不错,是本着去挖掘和探测候选人技术边界,有啥奈斯的问题吗?讲讲啊 小黑:有个问题算是我的盲区了,给了几个Linux系统函数,亿华云让我看哪些是线程安全的,哪些是可重入的,并解释下为啥。 大白:哦哦,这是考察对线程安全函数和可重入函数的理解。那你咋回答的? 小黑:卧槽,我说我不太会呀,然后就jump下一题了。要不你给我讲讲?我先干一个! 小黑说完,吨吨吨,一大杯啤酒下肚了,大白见状扶了扶好几年没换的眼镜,开始和小黑讨论什么是线程安全和可重入。 2. 多线程和并发 在使用C++开发的服务端程序中多线程还是主流,一般来说会有个线程池来处理接收的请求,这样可以有效提供服务器的并发能力和CPU的利用率。 但是,多线程也是站群服务器一把双刃剑。 单线程模式下,一切都是那么单调而稳定,所有的资源都是自己的,我的资源我做主。 多线程模式下,一个进程下装载了多个线程,每个线程除了部分资源是独享外,多个线程对大部分系统资源是共享的。 多个线程共享的进程资源: 每个线程独享的资源: 敲黑板划重点: 1.进程是系统进行资源分配和调度的基本单位,线程是CPU调度和分派的基本单位; 2.进程是线程的载体,进程有独立地址空间,所有线程共享所在进程的地址空间; 3.进程是系统资源的大股东,而线程基本上不拥有系统资源,只占用少量在运行中必不可少的资源,比如程序计数器、一组寄存器和调用栈; 同一个进程中的多个线程有点像合租,大家共用大部分资源,自己独占一小部分资源,相互影响,然而但单进程单线程就是整租,自己独占所有资源,谁也不影响。 掌握多线程中资源共享和相互影响的特点之后,再来看看线程安全和可重入就容易很多。 3. 什么是线程安全 计算机中所谓的安全大多是指结果的正确且可预测性。 前面我们知道,多线程运行起来虽然可以提高并发能力,但是多个线程会共享很多资源,比如写全局数据,这种情况下就需要额外干预,否则将引发错乱的结果。 线程安全是在拥有共享数据的多条线程并行执行的进程中,可以正常且正确的执行,不会出现数据污染等意外情况,反之则称为线程不安全。 通俗一点讲,线程安全就怎么跑都不乱,线程不安全就是一跑就可能五花八门。 所以可能产生线程不安全根本原因在于:共享数据且共享数据可变。 这些共享数据包括全局变量、局部静态变量等,每个线程都可能对这个数据进行操作,并且操作结果会影响其他线程。 我们还经常提到另外一个术语:线程安全函数/线程安全类。 线程安全函数的一些特征: 从图中可以看到: 在编写多线程程序时,如果涉及多个线程操作一个公共函数,如果该函数本身不是线程安全的。 例如当一个函数F是线程安全函数,但是F调用线程不安全函数G时,同样需要对G进行加锁处理,否则函数F也将不安全。 在《深入理解计算机系统》一书中深入指出了线程不安全函数的分类: 前面介绍的几个例子大部分都是全局变量的不加锁控制相关的,还有两种就是: 在localtime中将结果存放在timeinfo中,这个全局变量可以被任意的线程操作,因此将引发线程不安全。 对于Linux中线程不安全的函数可以查阅: 4. 可重入函数 在理解了线程安全的相关定义和形成原因之后,我们来看下什么是可重入。 先来看看可重入的相关定义: 一个程序可以在任意时刻被中断,然后系统去执行另外一段代码,结束后又调用继续原来的子程序不会出错,则称其为可重入(reentrant或re-entrant)。 从根本上来说: 可重入函数又分为两大类: 可重入函数需要满足以下几个条件: 从本质上来说,可重入函数实现了算法和数据的分离,函数内部的计算不依赖于外部,不影响也不受外部影响,是一种高效且安全的函数。 可重入函数都是线程安全函数,线程安全不一定是可重入函数。 不可重入函数可以遵守可重入规则去改造,从而变为可重入函数。 5. 小结 本文从多线程并发编程的一些特征进行阐述,引出了多线程下资源的共享本质。 正因为临界资源和竞态条件的存在,就产生了线程安全问题,在编写多线程程序时一定要考虑线程不安全带来的问题。 在理解线程安全的概念之后进一步引出了可重入函数。 从本质上来说,都是并发环境下由于共享资源带来的问题。 就这样,小黑听完之后虽然一知半解,但也频频点头,一看表快10点了,两个打工人结完账,消失在了去13号线五道口站的夜色中。