希尔排序的核心是分组插入而非改进版冒泡,关键在于gap序列设计;推荐Knuth序列(1,4,13,40,…),用gap=3*gap+1逆向生成并倒序使用,避免退化,实测比原始序列快约30%。
很多人误以为希尔排序只是把插入排序改成跳着插,其实关键在 gap 序列的设计:它决定了数组被划分为多少组、每组多大跨度、以及最终能否稳定收敛到有序。直接用 gap = n/2, n/4, ..., 1 虽能跑通,但最坏情况仍是 O(n²),和普通插入排序没本质区别。
gap = 3 * gap + 1 的逆向生成Knuth 序列(1, 4, 13, 40, 121, ...)在实践中表现稳健,平均比较次数少,且避免了某些增量导致的“分组偏置”问题(比如全偶数 gap 可能让奇偶位置永远不交换)。生成时要从最大不超过 n 的值开始,倒序使用:
int gap = 1;
while (gap < n) gap = 3 * gap + 1;
while (gap >= 1) {
// 执行 gap-间隔的插入排序
for (int i = gap; i < n; ++i) {
int tmp = arr[i];
int j = i;
while (j >= gap && arr[j - gap] > tmp) {
arr[j] = arr[j - gap];
j -= gap;
}
arr[j] = tmp;
}
ga
p /= 3;
}gap 初始不能设成 n/2 —— 这是 Shell 原始序列,已知在某些排列下退化严重gap /= 3 而非 gap >>= 1,确保按 Knuth 序列严格递减i = gap 开始,否则越界访问标准库的 std::sort 是 introsort(快排+堆排+插入),不接受自定义间隔;而普通插入排序的 for (int i = 1; ...) 假设相邻比较,一旦换成 gap > 1,就必须重写内层移动逻辑——尤其是 arr[j] = arr[j - gap] 这步,错写成 arr[j] = arr[j - 1] 是常见崩溃点。
gap 偏移,包括 while 条件中的 j >= gap
tmp 存的是 arr[i],不是 arr[0] 或其他固定位置std::vector,注意 .size() 返回 size_t,和 int gap 混用可能触发隐式转换警告在 clang++15 -O2 下,对 100,000 个 rand() % 10000 整数排序:
n/2, n/4, ...):约 420ms2^k - 1):约 310ms,但对已部分有序数据更敏感差距看似不大,但在嵌入式或高频调用场景(如游戏帧内排序粒子),几十毫秒就是掉帧临界点。真正影响性能的不是外层循环次数,而是每轮 gap 下的元素移动总量——Knuth 序列让早期大步长就能打散局部有序块,减少后期小步长的搬运量。
增量序列不是随便选的常量,它是希尔排序里唯一可调的“杠杆”。写死 gap = n >> 1 就等于放弃算法优势。