792. 匹配子序列的单词数 : 常规预处理优化匹配过程

news2025/8/12 18:32:20

题目描述

这是 LeetCode 上的 792. 匹配子序列的单词数 ,难度为 中等

Tag : 「二分」、「哈希表」

给定字符串 s 和字符串数组 words, 返回  words[i] 中是 s 的子序列的单词个数 。

字符串的 子序列 是从原始字符串中生成的新字符串,可以从中删去一些字符(可以是""),而不改变其余字符的相对顺序。

例如, “ace” 是 “abcde” 的子序列。

示例 1:

输入: s = "abcde", words = ["a","bb","acd","ace"]

输出: 3

解释: 有三个是 s 的子序列的单词: "a", "acd", "ace"。
复制代码

示例 2:

输入: s = "dsahjpjauf", words = ["ahjpjau","ja","ahbwzgqnuk","tnmlanowax"]

输出: 2
复制代码

提示:

  • 1 <= s.length <= 5 \times 10^41<=s.length<=5×104
  • 1 <= words.length <= 50001<=words.length<=5000
  • 1 <= words[i].length <= 501<=words[i].length<=50
  • words[i] 和 s 都只由小写字母组成。

预处理 + 哈希表 + 二分

朴素判定某个字符串是为另一字符串的子序列的复杂度为 O(n + m)O(n+m),对于本题共有 50005000 个字符串需要判定,每个字符串最多长为 5050,因此整体计算量为 (5 \times 10^4 + 50) \times 5000 \approx 2.5 \times 10^8(5×104+50)×5000≈2.5×108,会超时。

不可避免的是,我们要对每个 words[i]words[i] 进行检查,因此优化的思路可放在如何优化单个 words[i]words[i] 的判定操作。

朴素的判定过程需要使用双指针扫描两个字符串,其中对于原串的扫描,会有大量的字符会被跳过(无效匹配),即只有两指针对应的字符相同时,匹配串指针才会后移。

我们考虑如何优化这部分无效匹配。

对于任意一个 w = words[i]w=words[i] 而言,假设我们当前匹配到 w[j]w[j] 位置,此时我们已经明确下一个待匹配的字符为 w[j + 1]w[j+1],因此我们可以直接在 s 中字符为 w[j + 1]w[j+1] 的位置中找候选。

具体的,我们可以使用哈希表 map 对 s 进行预处理:以字符 c = s[i]c=s[i] 为哈希表的 key,对应的下标 ii 集合为 value,由于我们从前往后处理 s 进行预处理,因此对于所有的 value 均满足递增性质。

举个 🌰 : 对于 s = abcabc 而言,预处理的哈希表为 {a=[0,3], b=[1,4], c=[2,5]}

最后考虑如何判定某个 w = words[i]w=words[i] 是否满足要求:待匹配字符串 w 长度为 m,我们从前往后对 w 进行判定,假设当前判待匹配位置为 w[i]w[i],我们使用变量 idx 代表能够满足匹配 w[0:i]w[0:i] 的最小下标(贪心思路)。

对于匹配的 w[i]w[i] 字符,可以等价为在 map[w[i]] 中找到第一个大于 idx 的下标,含义在原串 s 中找到字符为 w[i] 且下标大于 idx 的最小值,由于我们所有的 map[X] 均满足单调递增,该过程可使用「二分」进行。

Java 代码:

class Solution {
    public int numMatchingSubseq(String s, String[] words) {
        int n = s.length(), ans = 0;
        Map<Character, List<Integer>> map = new HashMap<>();
        for (int i = 0; i < n; i++) {
            List<Integer> list = map.getOrDefault(s.charAt(i), new ArrayList<>());
            list.add(i);
            map.put(s.charAt(i), list);
        }
        for (String w : words) {
            boolean ok = true;
            int m = w.length(), idx = -1;
            for (int i = 0; i < m && ok; i++) {
                List<Integer> list = map.getOrDefault(w.charAt(i), new ArrayList<>());
                int l = 0, r = list.size() - 1;
                while (l < r) {
                    int mid = l + r >> 1;
                    if (list.get(mid) > idx) r = mid;
                    else l = mid + 1;
                }
                if (r < 0 || list.get(r) <= idx) ok = false;
                else idx = list.get(r);
            }
            if (ok) ans++;
        }
        return ans;
    }
}
复制代码

TypeScript 代码:

function numMatchingSubseq(s: string, words: string[]): number {
    let n = s.length, ans = 0
    const map = new Map<String, Array<number>>()
    for (let i = 0; i < n; i++) {
        if (!map.has(s[i])) map.set(s[i], new Array<number>())
        map.get(s[i]).push(i)
    }
    for (const w of words) {
        let ok = true
        let m = w.length, idx = -1
        for (let i = 0; i < m && ok; i++) {
            if (!map.has(w[i])) {
                ok = false
            } else {
                const list = map.get(w[i])
                let l = 0, r = list.length - 1
                while (l < r) {
                    const mid = l + r >> 1
                    if (list[mid] > idx) r = mid
                    else l = mid + 1
                }
                if (r < 0 || list[r] <= idx) ok = false
                else idx = list[r]
            }
        }
        if (ok) ans++
    }
    return ans
}
复制代码

Python3 代码:

class Solution:
    def numMatchingSubseq(self, s: str, words: List[str]) -> int:
        dmap = defaultdict(list)
        for i, c in enumerate(s):
            dmap[c].append(i)
        ans = 0
        for w in words:
            ok = True
            idx = -1
            for i in range(len(w)):
                idxs = dmap[w[i]]
                l, r = 0, len(idxs) - 1
                while l < r :
                    mid = l + r >> 1
                    if dmap[w[i]][mid] > idx:
                        r = mid
                    else:
                        l = mid + 1
                if r < 0 or dmap[w[i]][r] <= idx:
                    ok = False
                    break
                else:
                    idx = dmap[w[i]][r]
            ans += 1 if ok else 0
        return ans
复制代码
  • 时间复杂度:令 n 为 s 长度,m 为 words 长度,l = 50 为 words[i]words[i] 长度的最大值。构造 map 的复杂度为 O(n)O(n);统计符合要求的 words[i]words[i] 的数量复杂度为 O(m \times l \times \log{n})O(m×l×logn)。整体复杂度为 O(n + m \times l \times \log{n})O(n+m×l×logn)
  • 空间复杂度:O(n)O(n)

最后

这是我们「刷穿 LeetCode」系列文章的第 No.792 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。

在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/15074.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

初学者设计PCB,如何检查光绘文件的断头线

设计一款完整的PCB线路板&#xff0c;需要经过很多个繁琐而且复杂的工序。一般主要包括明确产品需求、硬件系统设计、器件选型、PCB绘制、PCB生产打样、焊接调试等步骤。 一般设计师都会有自己积累的设计质量检查清单&#xff0c;其中的条目部分来源于公司或部门的规范、另一部…

Linux开发工具VI/VIM

Linux开发工具VI/VIM 文章目录Linux开发工具VI/VIM一、Linux 软件包管理器 yum语法安装和卸载sl&#xff08;小火车跑动&#xff09;软件包二、编辑器VI/VIM1.基本介绍2.基础使用接下来介绍vim使用正常模式命令集末行模式命令集三、VIM优化总结一、Linux 软件包管理器 yum yum…

大学生个人网页模板 简单网页制作作业成品 极简风格个人介绍HTML网页设计(舞蹈培训网页)

⛵ 源码获取 文末联系 ✈ Web前端开发技术 描述 网页设计题材&#xff0c;DIVCSS 布局制作,HTMLCSS网页设计期末课程大作业 | 校园篮球网页设计 | 足球体育运动 | 体育游泳运动 | 兵乓球 | 网球 | 等网站的设计与制作 | HTML期末大学生网页设计作业&#xff0c;Web大学生网页 H…

大学生《Web课程谁》期末网页制作 HTML+CSS+JavaScript 网页设计实例 瑜伽网站企业网站制作

&#x1f389;精彩专栏推荐 &#x1f4ad;文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 &#x1f482; 作者主页: 【主页——&#x1f680;获取更多优质源码】 &#x1f393; web前端期末大作业&#xff1a; 【&#x1f4da;毕设项目精品实战案例 (10…

单商户商城系统功能拆解32—营销中心—消费奖励

单商户商城系统&#xff0c;也称为B2C自营电商模式单店商城系统。可以快速帮助个人、机构和企业搭建自己的私域交易线上商城。 单商户商城系统完美契合私域流量变现闭环交易使用。通常拥有丰富的营销玩法&#xff0c;例如拼团&#xff0c;秒杀&#xff0c;砍价&#xff0c;包邮…

Word论文排版教程

设置样式 要求&#xff1a; 以下以修改“大标题”为例&#xff0c;其他以此类推 1、大标题 再点击右下角的“段落” 2、标题4… 我们发现word默认只显示了三级标题的样式&#xff0c;如果我们还要更多的样式&#xff1a; &#xff08;选择“所有样式”即可&#xff09; …

智能微型断路器应该怎么选型?

安科瑞 华楠 智能微型断路器应用于户内建筑物及类似场 所的工业、商业、民用建筑及基础设施等领域低压终端配电网络。 选型分类——智能微型断路器 类型 型号 功能 智能小型断路器 ASCB1-63-C16/32/63-1P 可实时监测单相电压、电流、功率、电能和温度等参量&#xff1b;…

Android aar 打包事项

我们在开发中难免会遇到把现有的module变成库文件SDK的情况&#xff0c;aar包中不仅可以包含代码&#xff0c;也可以包含资源文件&#xff0c;是一种常用的库文件方式。打包的事项主要有以下几点&#xff1a; 在root project工程下的build.gradle文件中引入"com.kezong:f…

自动驾驶入门:规划

目录 概念 基本原理 将地图转化为数据结构图 路径查找算法 A* A*在现实中的应用 地图级轨迹生成 Frenet 坐标系 速度- 路径解耦规划 路径生成与选择 ST图 速度规划 优化 路径-速度规划的轨迹生成 Lattice规划 ST轨迹的终止状态 SL轨迹的终止状态 Lattice规划的…

JVM——虚拟机类加载机制

类加载时机 加载loading 加载.class文件的方法 类连接阶段 验证阶段 准备阶段 解析阶段 初始化 简而言之&#xff0c;为类的静态变量赋予正确的初始值。如果前面的步骤都没有问题&#xff0c;那么表示类可以顺利装载到系统中&#xff0c;此时才会开始执行Java字节码。即&…

微信小程序 python电影票务系统-nodejs电影票预订系统

目 录 1绪论 1 1.1项目研究的背景 1 1.2开发意义 1 1.3项目研究现状及内容 5 1.4论文结构 5 2开发技术介绍 7 2.1 B/S架构 7 2.2 MySQL 介绍 7 2.3 MySQL环境配置 7 2.4 Java语言简介 8 2.5微信小程序技术 8 3系统分析 9 3.1可行性分析 9 3.1.1技术可行性 9 3.1.2经济可行性 9 …

沉睡者IT - 听我给你科普什么是WEB3.0?

推荐关注新博主&#xff0c;点击上面关注吧 ↑↑ 不出意外的话&#xff0c;今年下半年最火的概念大概率是web三点零了。 如果说去年元宇宙霸占了科技和金融圈的榜一的话&#xff0c;今年的榜一估计会变成web三点零。 什么是web三点零&#xff1f; 真的没有那么玄乎啊&#xf…

木马特征值免杀

文章目录木马特征值免杀一. 木马特征值免杀0x01. 灰鸽子配置生成木马0x02. 使用MyCCL复合特征码定位器反复缩小目标进行定位0x03. 直到定位到很小的区间0x04. 用工具将文件偏移地址0009B9C3转换成内存地址0049C5C30x05. 使用OD跳转特征值语句的执行顺序以实现免杀0x06. 将修改后…

微信录屏怎么录?微信聊天记录怎么录制下来

微信作为我们日常使用的沟通工具&#xff0c;里面保留着许多的信息。在有些时候&#xff0c;我们可能会遇到需要用录屏功能&#xff0c;将微信里的信息分享出去的场景。可是微信自身是不带录屏功能的&#xff0c;微信录屏怎么录&#xff1f;我们究竟要怎么将信息给录制下来呢&a…

万字博客带你了解Spring Framework 的全貌

1.写在前面 我之前出过一个系列介绍的是spring的源码的系列&#xff0c;但是由于当时个人的水平有限&#xff0c;有些地方介绍的也是模棱两可的&#xff0c;打算重启这块内容&#xff0c;上次只是介绍其中的一部分&#xff0c;例如国际化&#xff0c;事件等等这块的源码都没有…

IC设计职位介绍|如何成为一名合格的数字前端设计工程师?

近年来IC行业火热&#xff0c;但因为一些原因&#xff0c;今年以来行业唱衰的人越来越多。尽管全球芯片市场过剩&#xff0c;但我国的半导体行业发展很可观&#xff0c;目前政策倾向国产芯片的发展&#xff0c;所以半导体人才非常稀缺。我国半导体产业终究要崛起&#xff0c;因…

js逆向基础篇-某电商网站-xx街

提示!本文章仅供学习交流,严禁用于任何商业和非法用途,如有侵权,可联系本文作者删除! 网站链接:aHR0cHM6Ly9tLm1vZ3UuY29tLw== 案例分析: 本文分析的参数为下图中圈出来的: 直接复制参数名mw-sign,然后Ctrl+Shift+F打开全局搜索,之后将参数名复制到搜索栏,然后回车…

深入讲解Linux上TCP的几个内核参数调优

生产内核&#xff08;production kernel&#xff09;&#xff1a;产品或者线上服务器当前运行的内核。 捕获内核&#xff08;capture kernel&#xff09;&#xff1a;系统崩溃时&#xff0c;使用kexec启动的内核&#xff0c;该内核用于捕获生产内核当前内存中的运行状态和数据…

收藏10000+,网络安全行业应该考哪些证?

证书是网安从业者知识水平能力的一个体现&#xff0c;考证同时也是拓展自身知识的一个方法。事实证明&#xff0c;有相关证书会让你的职业生涯锦上添花。 市面上的安全证书是非常多的&#xff0c;从大的角度来讲可以分为国际证书和国内证书两大类&#xff0c;国际证书简单来…

抖店订单发货回传的实际开发笔记

目录 前言 一、订单发货接口 二、商家对接接口步骤 1.业务逻辑分析 2.业务逻辑代码 总结 前言 主要是以前有对接过抖店开放平台&#xff0c;所以现在想要记录一下&#xff0c;做一个笔记&#xff0c;好好归纳一下&#xff0c;当时对接订单发货接口&#xff0c;是怎么实现的…