一、名词解释

1、进程 (Process)

进程是具有一定独立功能的程序关于某个数据集合上的一次运行活动,进程是系统进行资源分配和调度的一个独立单位。每个进程都有自己的独立内存空间,不同进程通过进程间通信来通信。由于进程比较重量级,开销大,占据独立的内存,所以上下文进程间的切换开销(栈、寄存器、虚拟内存、文件句柄等)比较大,但相对比较稳定安全。

 

2、线程 (Thread)

线程是指进程内的一个执行单元,也是进程内的可调度实体。线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。线程间通信主要通过共享内存,上下文切换很快,资源开销较少,但相比进程不够稳定,容易丢失数据。

 

3、协程 (coroutine)

协程(coroutine)是一种程序运行的方式即在单线程里多个函数并发地执行.

协程是一种用户态的轻量级线程协程的调度完全由用户控制。从技术的角度来说,“协程就是你可以暂停执行的函数”。协程拥有自己的寄存器上下文和栈。协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈,直接操作栈则基本没有内核切换的开销,可以不加锁的访问全局变量,所以上下文的切换非常快

 

二、线程与进程的区别

1) 地址空间

线程是进程内的一个执行单元,进程内至少有一个线程

它们共享进程的地址空间,而进程有自己独立的地址空间

2) 资源拥有

进程是资源分配和拥有的单位,同一个进程内的线程共享进程的资源

3) 线程是处理器调度的基本单位,但进程不是

4) 二者均可并发执行

并发: 任务数大于CPU的核数,多个任务轮流抢占CPU资源执行,由于CPU切换速度特别快,看起来像是一起运行,其实是假象,某一时刻一个CPU核只有一个线程在执行。

并行: 任务数小于或者等于CPU的核数,那么多个任务是真正意义一起执行。

进程、多线程、IO多路复用(通过一种机制,可以监视多个描述符,一旦某个描述符就绪(一般是读就绪或者写就绪),能够通知程序进行相应的读写操作,例如 select、poll、epoll、kqueue)

例如:Linux系统函数 fork() 可在父进程中创建一个子进程,在父进程接到新请求时,复制出一个子进程来处理,即父进程监控请求,子进程处理,实现并发处理。注意:必须是Linux系统,windows不能用fork。

5) 每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口,但是线程不能够独立执行,必须依存在应用程序中,由应用程序提供多个线程执行控制

 

三、协程与线程的区别

1) 一个线程可以多个协程,一个进程也可以单独拥有多个协程。

2) 线程和进程都是同步机制(内核态实现的mutex同步),而协程则是异步(用户态)

3) 协程能保留上一次调用时的状态,每次过程重入时,就相当于进入上一次调用的状态。

4)线程是抢占式,而协程是非抢占式的,所以需要用户自己释放使用权来切换到其他协程,因此同一时间其实只有一个协程拥有运行权,相当于单线程的能力。

5)协程并不是取代线程, 而且抽象于线程之上, 线程是被分割的CPU资源, 协程是组织好的代码流程, 协程需要线程来承载运行, 线程是协程的资源, 但协程不会直接使用线程, 协程直接利用的是执行器(Interceptor), 执行器可以关联任意线程或线程池, 可以使当前线程, UI线程, 或新建新程.。

6)线程是协程的资源。协程通过Interceptor来间接使用线程这个资源。

 

进程、线程、协程

1)先有进程,然后进程可以创建线程,线程是依附在进程里面的, 线程里面可以包含多个协程

2)进程之间不共享全局变量,线程之间共享全局变量,但是要注意资源竞争的问题

3)多进程开发比单进程多线程开发稳定性要强,但是多进程开发比多线程开发资源开销要大

4)多线程开发线程之间执行是无序的,协程之间执行按照一定顺序交替执行

5)协程以后主要用在网络爬虫和网络请求,开辟一个协程大概需要5k空间,开辟一个线程需要512k空间, 开辟一个进程占用资源最多

 

 

参考推荐:

Java 四种线程池

Java 线程同步的七种方法

Java ThreadLocal 原理及应用

PHP 多线程的应用实例