本文内容摘自机械工业出版社《Java 并发编程的艺术》书中的第 1 章,作者方腾飞、魏鹏、程晓明。
并发编程是为了能够让程序运行的更快,但是并不是启动更多的线程就能够让程序最大限度的并发执行。在进行并发编程时,如果希望通过多线程执行任务让程序运行得更快,会面临很多问题,比如上下文切换的问题、死锁等问题。本文会对上下文切换做个简单的讲解。
上下文切换
即使是单核处理器也支持多线程执行代码, CPU通过给每个线程分配CPU时间片来实现这个机制。时间片是CPU分配给各个线程的时间,因为时间片非常短,所以ICPU通过不停地切换线程执行,让我们感觉多个线程是同时执行的时间片一般是几十毫秒(ms)。
CPU通过时间片分配算法来循环执行任务,当前任务执行-一个时间片后会切换到下一个任务。但是,在切换前会保存上一个任务的状态,以便下次切换回这个任务时,可以再加载这个任务的状态。所以任务从保存到再加载的过程就是一次上下文切换。
这就像我们同时读两本书,当我们在读一本英文的技术书时,发现某个单词不认识,于是便打开中英文字典,但是在放下英文技术书之前,大脑必须先记住这本书读到了多少页的第多少行,等查完单词之后,能够继续读这本书。这样的切换是会影响读书效率的,同样上下文切换也会影响多线程的执行速度。
多线程一定快吗
下面的代码演示串行和并发执行并累加操作的时间,请分析:下面的代码并发执行一定比串行执行快吗?
public class ConcurrencyTest {
private static final long count = 10000;
public static void main(String[] args) throws InterruptedException {
concurrency();
serial();
}
private static void concurrency() throws InterruptedException {
long start = System.currentTimeMillis();
Thread thread = new Thread(() -> {
int a = 0;
for (int i = 0; i < count; i++) {
a += 5;
}
});
thread.start();
int b = 0;
for (int i = 0; i < count; i++) {
b--;
}
thread.join();
long time = System.currentTimeMillis() - start;
System.out.println("concurrency :" + time + "ms,b=" + b);
}
private static void serial() {
long start = System.currentTimeMillis();
int a = 0;
for (int i = 0; i < count; i++) {
a += 5;
}
int b = 0;
for (int i = 0; i < count; i++) {
b--;
}
long time = System.currentTimeMillis() - start;
System.out.println("serial :" + time + "ms,b=" + b + ",a=" + a);
}
}
上述问题的答案是“不一定”,测试结果如表所示(我电脑 Jdk8执行的结果,与书中大有不同)。
循环次数 | 串行执行耗时/ms | 并发执行耗时/ms |
---|---|---|
10亿 | 783 | 486 |
1亿 | 79 | 94 |
1千万 | 11 | 56 |
1百万 | 4 | 54 |
10万 | 2 | 52 |
1万 | 1 | 45 |
从表中可以发现,当并发执行累加操作不超过10亿次时,速度会比串行执行累加操作要慢。那么,为什么并发执行的速度会比串行慢呢?这是因为线程有创建和上下文切换的开销。
如何减少上下文切换
减少上下文切换的方法有无锁并发编程、CAS 算法、使用最少线程和使用协程。
- 无锁并发编程:多线程竞争锁时,会引起上下文切换,所以多线程处理数据时,可以用一些办法来避免使用锁,如将数据的 ID 按照 Hash 算法取模分段,不同的线程处理不同段的数据。
- CAS 算法:Java 的 Atomic 包使用 CAS 算法来更新数据,而不需要加锁。
- 使用最少线程:避免创建不需要的线程,比如任务很少,但是创建了很多线程来处理,这样会造成大量线程都处于等待状态。
- 协程:在单线程里实现多任务的调度,并在单线程里维持多个任务间的切换。
评论区