17370845950

C++ 怎么生成不重复随机数 C++ shuffle算法打乱数组顺序教程【算法】
必须用 std::random_device 初始化 std::mt19937 引擎再传给 std::shuffle,否则结果固定;生成不重复随机数应先构造候选集再打乱取前 k 个;std::random_shuffle 已移除,小数组或嵌入式环境宜手动实现。

std::shuffle 打乱数组前必须先初始化随机数引擎

直接调用 std::shuffle 却没配好随机数生成器,结果每次运行都得到相同“随机”顺序——这是最常踩的坑。C++11 起 std::shuffle 不再接受 rand(),必须传入一个符合 UniformRandomBitGenerator 要求的引擎(如 std::mt19937),且该引擎需用真随机种子初始化。

推荐做法是用 std::random_device 生成种子:

std::random_device rd;
std::mt19937 g(rd());  // 引擎必须带括号调用,否则是声明而非实例化
std::vector v = {1, 2, 3, 4, 5};
std::shuffle(v.begin(), v.end(), g);
  • std::random_device 在多数系统上读取硬件熵源,但 Windows 下某些旧 MSVC 版本可能退化为伪随机,可加 rd.entropy() > 0 判断是否可用
  • 别用 time(nullptr) 做种子——秒级精度在快速重跑时必然重复
  • std::mt19937 是平衡速度与质量的首选;若需加密安全,请换用 std::random_device 直接生成(但不适用于 shuffle

生成不重复随机数本质是“打乱后取前 N 个”

没有“生成不重复随机数”的独立函数,正确路径是:先构造完整候选集(如 1~100),再用 std::shuffle 打乱,最后取前 k 个元素。这比边生成边查重高效得多,时间复杂度 O(n),且无概率性失败风险。

例如生成 5 个不重复的 1~20 之间的整数:

std::vector candidates(20);
std::iota(candidates.begin(), candidates.end(), 1); // 填充 1,2,...,20
std::shuffle(candidates.begin(), candidates.end(), g);
std::vector result(candidates.begin(), candidates.begin() + 5);
  • 若范围很大(如 1~1e9)但只要几个数,就别建大数组——改用 std::setstd::unordered_set 插入检查,但注意最坏情况可能卡住
  • std::iota 需要 #include ,别漏掉
  • std::vector::assign 或构造函数切片比手写循环取值更安全

std::shufflestd::random_shuffle 的兼容性陷阱

std::random_shuffle 已在 C++17 中被移除,所有新代码必须用 std::shuffle。老项目升级时若还留着 random_shuffle,编译会报

错:error: 'random_shuffle' is not a member of 'std'

  • 旧写法 std::random_shuffle(v.begin(), v.end()) 默认用 rand(),不仅不可移植,且 rand() 在多数实现中低比特位周期极短
  • 即使保留 rand(),也不能直接塞进 std::shuffle ——它要求引擎支持 operator()() 返回无符号整型,而 rand 返回 int 且范围不对
  • GCC 9+、Clang 10+ 默认启用 -Wdeprecated-declarations,调用 random_shuffle 会警告

小数组或嵌入式环境慎用 std::shuffle

std::shuffle 底层是 Fisher–Yates 算法,需遍历整个容器并做 O(n) 次随机访问和交换。对只有 3~5 个元素的数组,手动写个简单交换逻辑反而更清晰、无依赖、易审计。

例如打乱长度为 3 的数组:

std::array a = {1, 2, 3};
std::shuffle(a.begin(), a.end(), g); // 合理
// 或更轻量:
std::swap(a[0], a[rd() % 3]);
std::swap(a[1], a[1 + (rd() % 2)]);
  • 嵌入式平台若禁用 STL 或堆分配,std::vectorstd::shuffle 就不合适,优先用原始数组 + 自实现 Fisher–Yates
  • std::shufflestd::list 效率极差(随机访问 O(n)),此时应复制到 vector、打乱、再写回
  • 多线程环境下,确保每个线程使用独立的随机引擎实例,共享同一 std::mt19937 会导致数据竞争
真正容易被忽略的是:打乱操作本身不是目的,而是服务于“抽样无偏”这个前提。如果后续逻辑依赖这些数的分布特性(比如模拟、测试用例生成),引擎质量、种子来源、容器初始状态三者缺一不可。