多协程分段排序通过均分数组、并发排序各段并归并实现加速:先按CPU核心数分段并行排序,再用k路归并(最小堆或sort.Slice)高效合并,兼顾性能与内存安全。
核心思路是把待排序的切片按长度均分为若干段,每段启动一个 goroutine 独立调用 sort.Slice 或自定义排序逻辑。注意分段数不宜过多(一般不超过 CPU 核心数的 2 倍),避免调度开销抵消并发收益。
示例做法:
chunkSize := len(data) / numWorkers,余数部分可追加到最后一个 chunkmake([]int, 0, chunkSize) 预分配子切片,避免复制时扩容
收子切片指针或副本(若只读+排序,传副本更安全)sync.WaitGroup 等待全部排序完成不额外拷贝数据,而是让每个 goroutine 对原数组的某一段做原地排序,再通过 channel 通知主协程该段已完成。主协程按顺序等待各段就绪,最后执行合并步骤。
关键点:
data[start:end] 直接传递子区间,排序函数内调用 sort.Ints(data[start:end])
start、end 变量值(避免闭包引用循环变量)done := make(chan int, numWorkers) 接收完成索引,确保合并顺序可控分段排好后,不能简单两两合并(时间复杂度退化为 O(n log k),k 是段数)。推荐使用最小堆实现 k 路归并,或直接用 slice 合并 + sort(适合段数少、单段小的场景)。
轻量级方案(推荐用于 ≤16 段):
sort.Slice 排序一次merge(dst, a, b) 两两归并,但控制合并顺序(如用归并树)高性能方案(大数据量、段数多):
container/heap 实现最小堆,每个节点存 (value, segmentID, index)一个健壮的并发排序函数需覆盖:
最终输出仍是原切片(若要求原地),或返回新排序切片(更安全,避免意外共享)。