字符串匹配:字符串hash,后缀数组,高度数组,AC自动机,KMP

参考博客:
https://www.cnblogs.com/jinkun113/p/4743694.html
https://mp.weixin.qq.com/s?src=11&timestamp=1586784093&ver=2276&signature=fIW2gkvXML6aFFC8i0vzAaI4AcLhTZDETqQhNeAt4UvGMqmW5X3FlLEGbp5xbEKsJxl-juGPgj1vqk6-V8WHau0QZZzuaOabSvlTj4f8R1v6sVSwpBVeiVe6xW4Oc5Hc&new=1

一、字符串hash

字符串hash+二分入门题
二维字符串哈希
寻找字符串s中字符串t出现的位置或次数的问题属于字符串匹配问题。我们在接下来的讨论中假设s的长度为n,T的长度为m。 最朴素的想法是,枚举所有起始位置,再直接检查是否匹配,复杂度为 O ( m n ) O(mn) O(mn)的算法。还有几个更为高效的算法。而在此我们只介绍实现起来较为容易,而在一些稍作变化的问题中同样适用,并且可以简单地推广到二维情况的哈希算法(散列算法)

将哈希算法用于字符算匹配的原理非常简单。对于每个起始位置,我们不是 O ( m ) O(m) O(m)地直接比较字符串是否匹配,而是 O ( l ) O(l) O(l)地比较长度为 m m m的字符串子串的哈希值与 T T T的哈希值是否相等。虽然即使哈希值相等字符串也未必相等,但如果哈希值是随机分布的话,不同的字符串哈希值相等的概率是很低的,可以当作这种情况不会发生

但是,如果我们采用 O ( m ) O(m) O(m)的算法计算长度为m的字符串子串的哈希值的话,那复杂度还是 O ( m n ) O(mn) O(mn),这里我们要使用一个叫做滚动哈希的优化技巧。选取两个合适的互素常数 b b b h ( l < b < h ) h(l<b<h) h(l<b<h)叫,假设字符串 C = c 1 c 2 . . . c m C=c_1c_2...c_m C=c1c2...cm,定义哈希函数

H ( C ) = ( c 1 b m − 1 + c 2 b m − 2 + . . . + c m b 0 ) % h H(C)=(c_1b^{m-1}+c_2b^{m-2}+...+c_mb^0)\%h H(C)=(c1bm1+c2bm2+...+cm

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值