Python多线程适用于I/O密集型任务(如HTTP请求、文件读写),因GIL在I/O时释放;对CPU密集型任务无效,应改用multiprocessing或asyncio。
Python多线程在I/O密集型任务中能有效提升效率,但对CPU密集型任务几乎无效——这是由全局解释器锁(GIL)决定的,不是代码写得不够好。
多线程适合等待时间长、计算少的场景,比如:发HTTP请求、读写文件、数据库查询、接收网络数据等。这些操作会主动释放GIL,让其他线程运行。
threading或concurrent.futures.ThreadPoolExecutor可缩短总耗时近10倍(取决于网络延迟和线程数)线程数不是越多越好。操作系统和Python都有资源上限,过多线程反而引发竞争、上下文切换频繁,拖慢整体速度。
ThreadPoolExecutor自带的max_workers控制并发数,避免手动管理线程生命周期多个线程同时读写同一变量(如列表results.append(x))可能丢失数据或报错,必须加锁或换线程安全结构。
threading.Lock()保护临界区,例如计数器更新或结果收集queue.Queue天生线程安全,适合生产者-消费者模式with lock:包裹写操作,或改用concurrent.futures.as_completed()按完成顺序取结果如果发现多线程提速不明显,先确认是不是CPU瓶颈;是的话,就该换方案了。
multiprocessing(绕过GIL)或多进程+concurrent.futures.ProcessPoolExecutor
asyncio+aiohttp),内存占用更低、并发数更高celery或dask这类任务调度框架,而非裸线程多线程不是银弹,关键是匹配任务特征。看清是等资源,还是拼算力,再选工具。