250926 thinking 子序列判断

发表于2025-09-26|更新于2025-09-26|data structure & algorithm

|总字数:516

1. 介绍

引例：
有一个字符串t。现有若干字符集合$s_i$，需要判断对于每一个$s_i$，它的每一个元素是否在t中出现。

一种方式是，对于t中的所有字符建立一个map。然后对于一个$s_i$中的每一个元素c，若map[c]都判断为存在，则$s_i$的每一个元素都在t中出现，否则不是。

现在将问题换为“有一个字符串t。现有一个字符串集合$s$，需要判断对于每一个元素$e_i$，它是否是t的子序列。”

这个时候，不仅仅要考虑字符的存在与否了，还要考虑字符之间的相对位置关系。

比方说，t=aaabbb，e=ba。判断e是否是t的子序列时，我们还要判断在t的b后面的元素中是否还有a。

我们使用的map得能够“屏蔽”在t的某个元素前面的所有元素的存在性。

于是使用nxt，nxt[i][c]: t中下标不小于i的元素中出现c的最小下标。

2. 解释

将nxt[t.length][c]初始化一个很大的值BIG，作为判断存在依据。

其他nxt[i][c]构建：

for i in t.length-1 to 0; do
    copy nxt[i+1] to nxt[i]
    nxt[i][t[i]] = i
end loop

对于一个字符串$e_i$判断:

idx := 0
for c in e_i; do
    idx = nxt[idx][c]
    if idx == BIG; then
        c does not exist in t[idx:]=> e_i is not a substring of t.
    else 
        idx++ # for next search should begin at idx+1
    fi
end loop

3. 例题

匹配子序列的单词数

给出go的解法示例

func numMatchingSubseq(s string, words []string) int {
    nxt := make([][26]int,len(s)+1)
    for i := range nxt[len(s)]{
        nxt[len(s)][i] = 2147483647
    }

    for i:=len(s)-1;i>=0;i--{
        nxt[i] = nxt[i+1] //nxt是数组的slice,nxt[i]是数组类型。数组是值类型，可以直接这样赋值
        nxt[i][s[i]-'a']=i
    }

    ans := 0
    for _,str := range words{
        idx := 0
        for _,c := range str{
            idx = nxt[idx][c-'a']
            if(idx==2147483647){
                ans--
                break
            }
            idx++
        }
        ans++
    }
    return ans
}

文章作者: Eliano

文章链接: https://eliano64.github.io/2025/09/26/250926-thinking-%E5%AD%90%E5%BA%8F%E5%88%97%E5%88%A4%E6%96%AD/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Elian's blog page！

data structure & algorithm string go

相关推荐

250824 thinking Trie

字典树（Trie）是一种树形数据结构，用于高效地存储和检索字符串数据集中的键。每个节点有26个子节点，子节点的序号分别代表26个字母。因此，从根节点到某个节点的路径表示一个字符串。有时候，每个节点会有一个标记，用于表示是否为一个字符串的结束。如果一个节点的标记为true，那么从根节点到该节点的路径表示的字符串就是一个单词。 C++示例以下是一个简单的C++实现，支持插入、搜索和前缀搜索。 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748class Node {public: int end; vector<unique_ptr<Node>> son; Node():end(0),son(26){};};class Trie {public: unique_ptr<Node> root; Trie() { ...

250926 thinking 0-1背包dp

本文的内容是0-1背包的空间优化、倒序遍历，以及至多/恰好/至少变体。一些基本概念不再赘述。 1. 空间优化由于它的递推表达式： $$dp[i][c] = \max{, dp[i-1][c],; dp[i-1][c-w[i]] + v[i] ,}$$ dp[i][c]: 遍历到第 i 个物品时，若总容量为 c 时能获得的最大价值可以发现每次更新值时，都是 i-1 更新 i 的，所以完全可以写为： $$dp[c] = \max{, dp[c],; dp[c-w[i]] + v[i] ,}$$ 2. 倒序遍历在使用一维数组进行空间优化时，容量 c 必须“倒序遍历”（从最大容量 C 递减到 w[i]）。 Why? 若正序遍历（c 从小到大），在同一轮 i 的更新中，dp[c-w[i]] 已经被本轮 i 更新过，会导致同一物品 i 被复用多次，等价成“完全背包”的效果；倒序遍历能保证本轮计算依赖的是“上一轮 i-1 的结果”，从而保持 0-1 约束。更形式化的解释：维护不变式“在处理物品 i 时，所有用于计算的 dp[*] 均来自...

250926 thinking 差分

1. 简介对于一个数组a，构造的这样的一个数组d称为a的差分数组： d[i] = \begin{cases} 0, & \text{if } i = 0 \\ a[i] - a[i-1], & \text{otherwise} \end{cases} 2. 性质对d构造前缀和数组得到a 对于a的一个下标区间[i,j)对应的元素统一加上一个数c后，则对应的d的变化为：d[i](now)=>d[i](prev)+c d[j](now)=>d[j](prev)-c。也就是说，差分数组的构造可以将一个区间的变化映射为两个元素的变化。在实际操作时，还要注意j==a.length，此时超出d索引范围（因为在前面的构造中d.length==a.length）。因此为了方便，通常让d.length=a.length+1，即设置一个dummy。 3. 例题3355.零数组变换I go参考解法：（by 灵神） 1234567891011121314151617func isZeroArray(nums []int,...

250926 thinking 翻转链表

1. 操作以这道题为实例。对链表的某一部分进行翻转时，需要记录以下这几个节点： p0: 发生翻转区域的前置节点，这个是为了区域翻转后的连接（循环结束，p0.next为翻转后区间的最后一个元素）。为了统一处理（因为原链表有的翻转区域没有前置节点），先构造dummy=ListNode{next: head}。这样的话，翻转后的链表的头节点即为dummy.next。p0可能为dummy。 cur: 当前遍历到的节点，循环结束，cur为区域后的第一个元素 pre: 当前遍历到的节点的原链表中的上一个节点，在翻转后就是next。在最初翻转前为nullptr,循环结束，pre为翻转后的区域的第一个元素 nxt: 当前遍历到的节点的原链表中的下一个节点，下一个cur，在翻转后它的next就是pre。操作如下： 123456789101112cur := p0.nextpre := nullptrfor cur in area; do nxt := cur.next cur.next = pre pre = cur cur = nxtend...

251112 thinking binary constraint matching

1. 抽象受到力扣1. 两数之和以及类似问题的启发，抽象出如下模板：给定一个整数数组arr,令$x,y \in arr$,且$x,y$不能是同一个元素。若$f(x,y)=K$，给定$f,K$，求所有满足条件的${x,y}$。伪代码如下 123456789101112131415//input : arr, f, K//output : all pairs of x, y in arr such that f(x, y) = K//assumption : f(x,y)=k <=> g(x)=h(y), and g,h both are well-defined functionsalgorithm binary-constraint-matching(arr, K, f): hash table := empty hash table, value -> list ans := empty set for each x in arr; do if h(x) in hash table; then ...

250721 thinking 二分查找

1. 总结二分查找的原理非常简单，但是一些细节例如是 l<r还是 l<=r、更新 r时是 r=mid还是 r=mid-1（l同理）等地方却有些让人头疼，实际写来如果不注意就可能会造成死循环。于是总结一种模板：定义域为[lo, hi)的单增的f(x), 找出最小的ans, 使得f(ans)>0成立。单减同理，甚至可以进行预处理先转化为单增的情况。伪代码如下： 12345678910111213141516algorithm binary-search(lo,hi) while the search area has elments do: mid <- lo + (hi-lo)/2; if f(mid) satisfied: // the answer may occur here ans := mid; hi <- mid; // the search area could have no elments when in the next loop, so return ans; ...