Python的I/O阻塞本质是操作系统同步阻塞模型所致,并非Python或GIL造成;open()、recv()等调用底层系统调用,数据未就绪时线程被内核挂起;GIL在I/O时会释放,不影响并发;默认阻塞的包括文件、socket、subprocess和标准流,可通过非阻塞模式、超时、asyncio或多线程规避。
Python 的 I/O 阻塞,本质不是 Python 本身造成的,而是底层操作系统对文件、网络、终端等资源的访问方式决定的——默认采用 同步阻塞(synchronous blocking) 模型。
Python 的 open()、read()、recv() 等函数最终会调用操作系统的系统调用(如 read(2)、recvfrom(2))。当数据尚未就绪(比如磁盘还没读完、网卡缓冲区为空、键盘还没按键),内核会让当前线程进入睡眠状态,交出 CPU,直到事件就绪或超时。这个“等待”过程就是阻塞的根源。
例如:
socket.recv(1024) 时,若对端没发数据,内核不返回,Python 线程就卡住;sys.stdin 读取时,实际是读 /dev/tty,没有输入就一直等。很多人误以为 GIL(全局解释器锁)导致 I/O 阻塞。其实相反:I/O 阻塞时,CPython 会 主动释放 GIL,让其他线程可以运行。GIL 只限制 CPU 密集型代码的并行,不影响 I/O 等待期间的线程切换。真正让程序“卡住”的,是线程在系统调用中休眠,而非被 GIL 锁住。
绝大多数标准 I/O 接口默认阻塞:
f = open("data.txt"); f.read()(普通文件、管道、终端);s = socket.socket(); s.recv(1024)(除非设为非阻塞);subprocess.Popen().communicate();input()、sys.stdin.readline()。例外:某些特殊文件描述符(如 `epoll`、`kqueue` 对象)或显式配置为非阻塞(os.set_blocking(fd, False))则不会阻塞。
核心思路是绕过“等数据来了再继续”的默认行为:
s
ocket.setblocking(False)),再配合轮询或事件循环;timeout 参数(如 socket.settimeout(5) 或 open() 不支持,但 socket 和 subprocess 支持);asyncio + await,底层调用 epoll/kqueue/IOCP 实现单线程并发;关键点:阻塞与否由操作系统决定,Python 只是忠实传递语义;改写行为必须显式干预(设非阻塞、加超时、换异步 API)。