目录

2156:查找给定哈希值的子串(2062 分)

力扣第 278 场周赛第 3 题

题目

给定整数 pm ,一个长度为 k 且下标从 0 开始的字符串 s 的哈希值按照如下函数计算:

  • hash(s, p, m) = (val(s[0]) * p0 + val(s[1]) * p1 + ... + val(s[k-1]) * pk-1) mod m.

其中 val(s[i]) 表示 s[i] 在字母表中的下标,从 val('a') = 1val('z') = 26

给你一个字符串 s 和整数 powermodulokhashValue 。请你返回 s第一个 长度为 k子串 sub ,满足 hash(sub, power, modulo) == hashValue

测试数据保证一定 存在 至少一个这样的子串。

子串 定义为一个字符串中连续非空字符组成的序列。

示例 1:

输入:s = "leetcode", power = 7, modulo = 20, k = 2, hashValue = 0
输出:"ee"
解释:"ee" 的哈希值为 hash("ee", 7, 20) = (5 * 1 + 5 * 7) mod 20 = 40 mod 20 = 0 。
"ee" 是长度为 2 的第一个哈希值为 0 的子串,所以我们返回 "ee" 。

示例 2:

输入:s = "fbxzaad", power = 31, modulo = 100, k = 3, hashValue = 32
输出:"fbx"
解释:"fbx" 的哈希值为 hash("fbx", 31, 100) = (6 * 1 + 2 * 31 + 24 * 312) mod 100 = 23132 mod 100 = 32 。
"bxz" 的哈希值为 hash("bxz", 31, 100) = (2 * 1 + 24 * 31 + 26 * 312) mod 100 = 25732 mod 100 = 32 。
"fbx" 是长度为 3 的第一个哈希值为 32 的子串,所以我们返回 "fbx" 。
注意,"bxz" 的哈希值也为 32 ,但是它在字符串中比 "fbx" 更晚出现。

提示:

  • 1 <= k <= s.length <= 2 * 104
  • 1 <= power, modulo <= 109
  • 0 <= hashValue < modulo
  • s 只包含小写英文字母。
  • 测试数据保证一定 存在 满足条件的子串。

分析

典型的滚动哈希。

注意这里定义的哈希值在前面的是低位,和一般的滚动哈希相反。 因此考虑将 s 反向,找最后一个满足要求的子串,然后再反向返回即可。

解答

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
def subStrHash(self, s: str, power: int, modulo: int, k: int, hashValue: int) -> str:
    end, s = None, s[::-1]
    w, bL = 0, pow(power, k, modulo)
    for j, char in enumerate(s):
        w = w*power+ord(char)-ord('a')+1
        if j>=k:
            w -= (ord(s[j-k])-ord('a')+1)*bL
        w %= modulo
        if j>=k-1 and w == hashValue:
            end = j
    return s[end+1-k:end+1][::-1]

244 ms