用C++从零实现简单关系型数据库,核心是表结构(类封装字段/行)、文本文件持久化(CSV格式)、基础SQL查询(SELECT WHERE)、可选索引与事务,全程标准库实现,重在理解关系模型本质。
用C++从零实现一个“简单的关系型数据库”,核心不是复刻 MySQL,而是理解关系模型的关键要素:表结构、行存储、SQL-like 查询(哪怕只支持 SELECT WHERE)、索引加速(可选)、事务与持久化。它完全可以基于标准 C++ 和文件 I/O 完成,无需第三方库——重点在于设计清晰、代码可控、便于调试和扩展。
每张表对应一个 C++ 类,封装字段名、类型、数据行容器。不追求动态类型,用 std::variant 或统一用 std::string 存储所有值(简化起见,推荐后者)。
例如:Student 表含 id(int)、name(string)、score(float),可定义为:
std::vector<:vector>> 存所有行(每行是字符串向量)std::vector<:string> 存列名(如 {"id", "name", "score"})std::vector<:string> 存列类型标识(如 {"INT", "TEXT", "RE
AL"}),用于后续类型检查或转换不用二进制,用纯文本更易调试。推荐 CSV 风格,但需处理逗号/换行转义(简单做法:双引号包裹字段,内部双引号写成两个)。
文件结构示例(student.tbl):
读取时按行分割,跳过首行(表头),再用 CSV 解析器(自己写 20 行以内)拆出字段;写入时反向操作即可。
关键点:
save_to_file() —— 暂不考虑缓存或 WALstd::ofstream 写入,std::ifstream 读取,注意打开模式(std::ios::out | std::ios::trunc 写,std::ios::in 读)不实现完整 SQL 解析器,先支持形如 SELECT * FROM student WHERE score > 85 的子集。
步骤:
student),加载对应表对象score)、比较符(>)、值(85),转成 std::function 过滤器std::stof 等转为目标类型后比较提示:WHERE 只支持单条件;多条件(AND)可后续扩展为组合 lambda。
让项目真正“可用”,加这几个点就明显不同:
id 是否重复(遍历已有行),失败则报错save() 时才刷盘std::map<:string std::vector>>(值 → 行号列表),WHERE 查找提速while (std::getline(std::cin, line)) 做 REPL,支持 .tables、.schema student 等元命令基本上就这些。不复杂但容易忽略:做好错误提示(比如 WHERE 列不存在时明确报错)、统一编码(全用 UTF-8)、避免裸 new/delete(全用栈对象或智能指针)。写完你会发现,数据库原理一下子落地了——它就是带结构的文件 + 带逻辑的内存操作。