CPU密集型任务用进程池,IO密集型用线程池;混合场景可组合使用,小任务宜同步执行,资源受限时需合理设置池大小。
选线程池还是进程池,关键看任务类型:CPU密集型用进程池,IO密集型用线程池。
如果任务大量时间花在等待网络响应、文件读写、数据库查询等操作上,属于IO密集型。这类任务线程切换开销小,GIL影响不大,用ThreadPoolExecutor更轻量、启动快、内存占用低。比如并发请求100个网页,用线程池通常比进程池快2–3倍。
如果任务主要做数学运算、图像处理、加密解密、大规模列表推导等,属于CPU密集型。Python的GIL会限制多线程真正并行,此时ProcessPoo 
functools.partial或封装成可序列化函数实际项目常同时存在IO和CPU操作。例如“下载图片→本地缩略图处理”,可先用线程池并发下载,再将下载好的文件路径交给进程池做CPU密集的图像处理。避免在线程中直接调用CPU-heavy函数,否则会阻塞整个线程池。
subprocess.run()启动新进程——管理复杂且易出错任务平均执行时间低于10ms,或总并发数不到5,用同步执行反而更稳。盲目上池子可能因调度开销得不偿失。另外,进程池数量不宜超过os.cpu_count(),线程池一般控制在min(32, os.cpu_count() * 4)以内,避免系统级线程/进程竞争。
concurrent.futures.as_completed()观察各任务耗时分布,识别瓶颈类型asyncio + aiohttp,比线程池更省内存