Python协程的核心是事件循环、状态机与上下文切换的协同机制,通过await主动让出控制权实现单线程高并发I/O,适用于API请求、异步Web服务等场景,不适用于CPU密集任务。
Python协程的核心不在语法糖,而在事件循环、状态机和上下文切换的协同机制。理解async/await背后如何让单线程“看起来”并发执行,比记住装饰器或库调用更重要。这一讲聚焦两个支点:一是协程对象如何被调度,二是实际开发中哪些场景必须用协程而非多线程。
当你写async def fetch_data(),Python生成的是一个coroutine对象,它本身不运行,只是封装了函数体、局部变量、当前执行位置(类似程序计数器)和状态(PENDING / RUNNING / DONE)。真正驱动它的是事件循环(如asyncio.run()内部的BaseEventLoop)。
await一个可等待对象(Awaitable),协程主动让出控制权,把自身挂起,并把后续逻辑注册为回调或放入就绪队列协程优势只在高并发I/O密集型场景放大。CPU密集任务用协程反而拖慢(因为无法并行,还多了调度成本)。
concurrent.futures.ProcessPoolExecutor)await,解析部分用loop.run_in_executor()扔给线程池,避免阻塞事件循环很多API有调用频率限制(如每秒5次)。同步实现容易误超限;用协程+信号量+延迟调度,能精准控速且不阻塞其他请求。
asyncio.Semaphore(5)控制并发请求数asyncio.sleep(1)在每批请求后强制间隔,比time.sleep()不阻塞整个循环aiohttp.ClientSession
print(f"[{asyncio.current_task()}] started")观察任务调度顺序,比日志更直观初学者常混淆这四个概念,它们是协程调度链上的不同环节:
async def定义,未被调度前只是个对象,需await或asyncio.create_task()才进入执行队列cancel()、done()等控制asyncio.ensure_future()可把协程转成Task/Future统一处理await右边的对象,包括coroutine、Task、Future,甚至自定义类只要实现__await__方法