std::set自动去重并升序排列,因其底层为红黑树,插入时依据operator
std::set 底层是红黑树(RB-tree),插入时自动按 operator 比较,重复元素直接忽略,且始终维持有序。这意味着你不用手动调用 sort 或 unique,只要用 insert 或初始化列表塞进去,结果天然去重+升序。
注意:去重基于「等价」而非「相等」——两个元素 a 和 b 被视为重复,当且仅当 !(a 。所以自定义类型必须正确定义 operator,不能只重载 operator==。
int、string)默认支持,开箱即用std::set>
vector 所有元素:用迭代器区间构造,比循环 insert 更高效最常见需求:把一个乱序、含重复的 vector 变成有序无重集合。别先 sort + unique,那是为 vector 设计的老套路;对 set 来说,一步到位更自然。
std::vectorv = {3, 1, 4, 1, 5, 9, 2, 6, 5}; std::set s(v.begin(), v.end()); // 直接构造,O(n log n) // s 现在是 {1, 2, 3, 4, 5, 6, 9}
vector:std::vector(s.begin(), s.end())
s.insert(v.begin(), v.end()) —— 这是成员函数,但语义和构造一样;不过构造更简洁、意图更清晰insert 差不多,但比逐个 push_back 后再 sort+unique 少一次遍历比如有个结构体 立即学习“C++免费学习笔记(深入)”; 有人想取「排序后第 3 个元素」,写 Person,按 id 去重排序,但忘了定义 operator,编译会报错:「no match for ‘operatorstruct Person {
int id;
std::string name;
};
// 必须加这个,否则 set
id, 相同时按
idname),写成:return a.id != b.id ? a.id
lambda 定义比较器只能用于模板参数(如 set),不能用于非模板友元函数,容易混淆set 不支持随机访问,别误用下标
s[2],编译直接失败——std::set 没有 operator[],也不支持 + 运算符随机跳转。
实际用 std::next(s.begin(), k),时间复杂度 O(k),不是 O(1)vector 再索引for 最安全:for (const auto& x : s) { ... }
s.erase(value),不是 s.erase(iterator),除非你已经有迭代器set 做去重排序,核心就三点:确认类型可比较、用构造代替手写去重逻辑、别把它当数组用。最容易卡住的地方,其实是自定义类型的比较函数没写对,或者误以为 set 支持下标访问。