17370845950

新闻动态

c++怎么实现字符串的模糊搜索_c++ 编辑距离算法Levenstein实现【案例】

Levenshtein距离用动态规划二维表实现，dpi表示s1前i字符到s2前j字符的最小编辑距离，初始化边界后按相等/不等转移，时间O(mn)，空间可优化至O(min(m,n))。

Levenshtein 距离函数怎么写（C++ 基础实现）

直接用动态规划填二维表是最清晰、最易调试的写法。核心是定义 dp[i][j] 表示 s1.substr(0, i) 到 s2.substr(0, j) 的最小编辑距离，状态转移只依赖左、上、左上三个格子。

注意边界初始化：空字符串到长度为 j 的字符串需要 j 次插入；同理，长度为 i 到空字符串需 i 次删除。

int levenshtein(const std::string& s1, const std::string& s2) {
    int m = s1.size(), n = s2.size();
    std::vector> dp(m + 1, std::vector(n + 1));
for (int i = 0; i <= m; ++i) dp[i][0] = i;
for (int j = 0; j <= n; ++j) dp[0][j] = j;

for (int i = 1; i <= m; ++i) {
    for (int j = 1; j <= n; ++j) {
        if (s1[i-1] == s2[j-1]) {
            dp[i][j] = dp[i-1][j-1];
        } else {
            dp[i][j] = 1 + std::min({
                dp[i-1][j],    // 删除
                dp[i][j-1],    // 插入
                dp[i-1][j-1]   // 替换
            });
        }
    }
}
return dp[m][n];
}
如何用 Levenshtein 实现模糊搜索（带阈值匹配）
编辑距离本身不是“搜索”，而是衡量相似度的工具。模糊搜索的关键在于：对候选字符串批量调用 levenshtein()，再按距离排序或过滤。

阈值建议设为 std::min(s1.size(), s2.size()) / 3 或固定小整数（如 1~3），避免长串误匹配
若候选集很大（>1000 条），别暴力遍历——先用长度差预筛：abs((int)s1.size() - (int)s2.size()) > threshold 直接跳过
区分大小写？确保输入前统一调用 std::tolower 转换，否则 "Apple" 和 "apple" 距离为 1（首字母替换），而非 0


为什么不用 std::string::find 或正则做模糊匹配
std::string::find 只支持精确子串匹配，不处理错字、漏字、顺序颠倒；std::regex 虽可写通配模式（如 "a.*b.*c"），但无法量化“多像”，也不能自然表达“替换一个字符”这种语义。
例如搜索 "recieve"（拼错）想命中 "receive"：



find("receive") 失败（不相等）
正则 R"([rR][eE][cC][eE][iI][vV][eE])" 仍要求完全匹配，没解决错位
Levenshtein 返回 1，明确告诉你：“只差一次修改”

性能和内存要注意什么（尤其嵌入式或高频调用场景）
原版二维 DP 时间 O(m×n)，空间 O(m×n)。实际工程中容易成为瓶颈：

空间可优化到 O(min(m,n))：只需保存上一行和当前行，用两个一维 std::vector 轮换
提前终止：如果某一行中所有值都 > 阈值，可立即返回“超限”，无需算完
避免临时 std::string 构造：传参用 const std::string&，内部别做 s1 + "x" 这类拼接
短字符串（≤8 字节）可考虑 SSE 加速版本，但 C++ 标准库无内置，需手写或引入第三方（如 simd-string）

真正卡住的往往不是算法本身，而是反复构造 std::vector 和频繁内存分配。如果搜索逻辑固定且候选集不变，把距离矩阵预计算好、查表会更快。 
	



# app 
# 工具 
# 算法 
# 设为 
# 为什么 
# 而非 
# 字节 
# 这类 
# 更快 
# apple 
# 只需 
# c++ 
# String 
# int 
# 标准库 
# 字符串 
# 空字符串 
# 遍历 
# const 
# 长度为 
# 要注意 
# 告诉你 
# Regex 
 







相关栏目：
    【
        行业资讯    】
    【
        网络运营    】
    【
        GEO优化    】
    【
        营销推广    】
    【
        SEO优化    】
    【
        技术教程    】
    【
        代码知识    】
    【
        AI推广    】






相关推荐：
Python生成器表达式内存优化_惰性计算说明【指导】 
Win11如何关闭小娜Cortana Win11禁用Cortana语音助手【优化】 
mac怎么分屏_MAC双屏显示与分屏操作技巧【指南】 
Python面向对象实战讲解_类与设计模式深入理解 
php订单日志怎么按状态筛选_php筛选不同状态订单日志教程【教程】 
Windows音频驱动无声音原因解析_声卡驱动错误修复步骤 
如何在Golang中使用log包输出不同级别日志_Golang log日志管理与分类 
c++怎么处理多线程死锁_c++ lock_guard与unique_lock锁管理【技巧】 
如何高效获取循环末次生成的 NumPy 数组最后一个元素（无需额外循环） 
php怎么捕获异常_trycatch结构处理运行时错误的技巧【方法】 
Win11怎么关闭防火墙通知_屏蔽Win11安全中心安全警告弹窗【技巧】 
php8.4如何实现队列任务_php8.4redis队列简单实现方法【教程】 
如何在 Pandas 中按元素交集合并两列字符串 
Mac怎么设置登录项_Mac管理开机自启动程序【教程】 
php在Linux怎么部署_LNMP环境搭建PHP服务的详细指南【指南】 
如何在Golang中理解指针比较_Golang地址比较与相等判断 
Win11怎么禁用键盘自带键盘_Win11笔记本禁用内置键盘方法【教程】 
Win10怎么卸载爱奇艺_Win10彻底卸载爱奇艺方法【步骤】 
Win10怎样卸载自带Edge_Win10卸载Edge浏览器步骤【教程】 
如何使用Golang捕获并记录协程panic_保证主程序稳定运行 
Python安全爬虫设计_IP代理池与验证码识别策略解析 
Mac如何使用听写功能_Mac语音输入打字【效率技巧】 
Win11怎么更改文件夹图标_自定义Win11文件夹外观样式【详解】 
C++中的std::shared_from_this有什么用？C++安全获取this的shared_ptr【智能指针】 
Windows蓝屏错误0x0000001E怎么修复_KMODEEXCEPTIONNOTHANDLED排查 
如何用列表一次性对 DataFrame 的指定列应用字典映射 
如何使用Golang读取日志文件_Golang bufio Scanner日志处理示例 
Win11如何设置开机自动联网 Win11宽带连接自动拨号【步骤】 
Win11怎么设置单手模式_Win11触控键盘布局调整教程【技巧】 
如何使用Golang sort排序切片_Golang sort排序方法示例 
如何在 Go 中正确反序列化 XML 多节点数组（解决仅解析首个元素的问题） 
如何使用正则表达式批量替换重复的“-”模式为固定字符串 
php文件怎么变mp4保存_php输出视频流保存为mp4操作【操作】 
如何在Golang中实现RPC异步返回_Golang RPC异步处理与回调方法 
如何在 Go 结构体中正确初始化 map 字段 
PHP cURL GET请求：正确设置请求头与身份认证的完整教程 
Win11怎么查看局域网电脑_Windows 11网络邻居发现设置【技巧】 
c# 如何深拷贝和浅拷贝 
Windows10系统怎么查看运行时间_Win10 CPU正常运行时间查询 
windows系统如何安装cab更新补丁_windows手动安装更新包教程 
php怎么下载安装后无法解析php文件_服务器配置检查【解答】 
mac怎么看硬盘大小_MAC查看磁盘存储空间与文件占用【详解】 
Win11时间不对怎么同步_Win11自动校准互联网时间【设置】 
php增删改查需要哪些扩展_开启mysqli或pdo扩展方法【说明】 
Windows服务启动类型恢复方法_错误修改导致的系统服务异常 
Linux如何安装JDK11_Linux环境变量配置与Java开发环境搭建【教程】 
Win11怎么关闭系统提示音_Windows11声音方案设为无声教程 
Win11怎么关闭专注助手 Win11关闭免打扰模式设置【操作】 
Win11如何设置系统声音_Win11系统声音调整教程【攻略】 
如何使用Golang写入二进制文件_Golang io Write二进制写入示例

17370845950

Levenshtein 距离函数怎么写（C++ 基础实现）

关于我们

服务项目

广告推广

案例欣赏