17370845950

numpy 如何用 np.lib.stride_tricks.sliding_window_view 实现滑动窗口
np.lib.stride_tricks.sliding_window_view是NumPy 1.20+官方滑动窗口工具,返回共享内存的只读视图;一维需指定window_shape,多维必须用axis明确滑动轴,不支持非1步长或直接赋值。

滑动窗口的基本用法:从一维数组开始

np.lib.stride_tricks.sliding_window_view 是 NumPy 1.20+ 引入的官方滑动窗口工具,比手动 as_strided 更安全、语义更清晰。它不复制数据,而是返回一个视图(view),底层共享原数组内存。

对一维数组,只需指定窗口长度:

import numpy as np
x = np.array([1, 2, 3, 4, 5])
windowed = np.lib.stride_tricks.sliding_window_view(x, window_shape=3)
# 结果 shape: (3, 3) → [[1,2,3], [2,3,4], [3,4,5]]

注意:window_shape 必须 ≤ 原数组长度,否则报 ValueError: window shap

e cannot be larger than the array

多维数组的滑动:明确指定 axis 参数

二维或更高维时,默认在**所有轴上滑动**,这通常不是你想要的。必须用 axis 显式控制滑动方向。

常见场景:

  • 图像局部均值:在最后两个轴(H, W)上滑动,axis=(-2, -1)
  • 时间序列批处理:在第 0 轴(时间步)滑动,axis=0
  • 对某列做滑窗统计:在列维度滑动需先转置或用 axis=1

示例(按行滑动,每行取长度为 2 的窗口):

x2d = np.array([[1,2,3,4],
                [5,6,7,8]])
w2d = np.lib.stride_tricks.sliding_window_view(x2d, window_shape=2, axis=1)
# shape: (2, 3, 2) → 每行生成 3 个窗口

漏掉 axis 会导致意外的高维输出,比如对 (2,4) 数组直接用 window_shape=2,会得到 (2,3,2,2) —— 因为它在两个轴都滑了。

性能与内存:视图 ≠ 零开销

虽然返回的是视图,但新数组的 stridesshape 可能导致缓存不友好。尤其当窗口大、步长大、原始数组稀疏时,实际访问效率可能低于显式循环。

关键限制:

  • 不能对结果直接赋值(它是只读视图),改写会触发 ValueError: assignment destination is read-only
  • 无法用于 np.ndarray 子类(如 torch.Tensorjax.Array),仅支持原生 NumPy 数组
  • 不支持非整数步长(即“跳跃滑窗”需额外切片,如 w[::2]

若需可写或自定义步长,得回退到 as_strided(但要自己校验内存边界,风险更高)。

替代方案对比:什么时候不该用 sliding_window_view

它很简洁,但不是万能的:

  • 需要重叠率 ≠ 1(例如步长=3,窗口=5)?sliding_window_view 只支持步长=1;得组合 [::step] 切片或用 skimage.util.view_as_windows
  • 输入是 list / pandas.Series?必须先转 np.array,否则报 AttributeError: 'list' object has no attribute 'ndim'
  • 做归约操作(如每窗口求均值)?直接链式调用更高效:windows.mean(axis=-1),别先转成 Python list 再算

最易被忽略的一点:该函数不检查窗口是否超出边界——它只检查 window_shape 是否超长,但如果你传入 axis=1 而数组该轴长度为 0,错误信息会非常模糊,建议提前 assert x.shape[axis] >= window_shape