字符串匹配算法(C/Java实现)

news2025/7/2 13:43:47

目录

  • BF算法
    • C语言实现
    • Java实现
  • KMP算法
    • Java实现
    • C语言实现
    • next[]数组的优化

BF算法

BF算法,即暴力(Brute Force)算法,是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符;若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果。

该算法最坏情况下要进行M*(N-M+1)次比较,时间复杂度为O(MN)。

image-20221017113326969

C语言实现

#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include <assert.h>
#include<string.h>
//字符串匹配算法 BF KMP
//str 主串  sub 子串
//返回值:返回子串在主串中的下标,如果不存在就返回-1
int BF(char* str,char* sub)
{
	assert(str != NULL && sub != NULL);
	if (str == NULL || sub == NULL)
	{
		return -1;
	}
	int lenStr = strlen(str);
	int lenSub = strlen(sub);
	int i = 0;
	int j = 0;
	while (i < lenStr && j < lenSub)
	{
		if (str[i] == sub[j])
		{
			i++;
			j++;
		}
		else
		{
			i = i - j + 1;
			j = 0;
		}
	}
	if (j >= lenSub)//j走完了子串
	{
		return i - j;
	}
	return -1;
}
int main()
{
	printf("%d\n", BF("ababcabcdabcde", "abcd"));//5
	printf("%d\n", BF("ababcabcdabcde", "abcdef"));//-1
	printf("%d\n", BF("ababcabcdabcde", "ab"));//0
	return 0;
}

Java实现

public class Test {
    public static int BF(String str,String sub){
        if(str==null||sub==null){
            return -1;
        }
        int lenStr=str.length();
        int lenSub=sub.length();
        if(lenStr==0||lenSub==0){
            return -1;
        }
        int i=0;//遍历主串
        int j=0;//遍历子串
        while(i<lenStr&&j<lenSub){
            if(str.charAt(i)==sub.charAt(j)){
                i++;
                j++;
            }else{
                i=i-j+1;
                j=0;
            }
        }
        if(j>=lenSub){
            return i-j;
        }
        return -1;
    }
    public static void main(String[] args) {
        System.out.println(BF("ababcabcdabcde","abcd"));//5
        System.out.println(BF("ababcabcdabcde","abcdef"));//-1
        System.out.println(BF("ababcabcdabcde","ab"));//0

    }
}

KMP算法

在这里插入图片描述

KMP算法是一种改进的字符串匹配算法。KMP算法的核心是利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的。具体实现就是通过一个next()函数实现,本身包含了模式串的局部匹配信息。KMP算法的时间复杂度O(m+n)。

为了减少匹配次数,匹配失败时i,j的回退位置变了

KMP的精髓就是next数组:也就是用next[j]=k来表示。如果匹配失败,子串j要移动到k的位置重新开始匹配。

k的值是这样求的:在范围[0,j-1]内找到匹配成功部分的两个相等的真子串(不包括本身)。k=真子串的长度

不管什么数据,next[0]=-1;next[1]=0;

image-20221104214008302

练习1:对于"ababcabcdabcde",求其next[]数组?

-1 0 0 1 2 0 1 2 0 0 1 2 0 0

(发现0,1,2增加是均匀增加的)

练习2:对“abcabcabcabcdabcde",求其next[]数组?

-1 0 0 0 1 2 3 4 5 6 7 8 9 0 1 2 3 0

接下来的问题是,已知next[i]=k,怎么求next[i+1]=?

image-20221104204146646

Java实现

public class Test {
    //构建next[]数组
    public static void getNext(int[] next,String sub,int lenSub){
        next[0]=-1;
        next[1]=0;
        int i=2;
        int k=0;
        while(i<lenSub){
            if(k==-1||next[i-1]==next[k]){
                next[i]=k+1;
                i++;
                k++;
            }
            else{
                k=next[k];
            }
        }
    }
    public static int kmp(String str,String sub,int pos){
        if(str==null||sub==null) return -1;
        int lenStr=str.length();
        int lenSub=sub.length();
        if(lenStr==0||lenSub==0) return -1;
        int i=pos;//遍历主串
        int j=0;//遍历子串
        int[] next=new int[lenSub];
        getNext(next,sub,lenSub);
        while(i<lenStr&&j<lenSub){
            if(j==-1||str.charAt(i)==sub.charAt(j)){
                i++;
                j++;
            }
            else{
                j=next[j];//匹配失败回退
            }
        }
        if(j>=lenSub){
            return i-j;
        }
        return -1;
    }
    public static void main(String[] args) {
        System.out.println(kmp("ababcabcdabcde","abcd",0));
        System.out.println(kmp("ababcabcdabcde","abcdf",0));
        System.out.println(kmp("ababcabcdabcde","ab",0));
    }
}

C语言实现

#define _CRT_SECURE_NO_WARNINGS
#include <stdio.h>
#include <stdlib.h>
#include <assert.h>
#include <string.h>
void getNext(char* sub, int* next, int lenSub)
{
	next[0] = -1;
	next[1] = 0;
	int i = 2;
	int k = 0;
	while (i < lenSub)
	{
		if (k==-1||sub[i - 1] == sub[k])
		{
			next[i] = k + 1;
			i++;
			k++;
		}
		else
		{
			k = next[k];
		}
	}
}
int KMP(char* str,char* sub,int pos)
{
	assert(str != NULL && sub != NULL);
	int lenStr = strlen(str);
	int lenSub = strlen(sub);
	if (lenStr == 0 || lenSub == 0) return -1;
	int i = pos;//遍历主串
	int j = 0;//遍历字串
	int* next = (int*)malloc(sizeof(int) * lenSub);
	getNext(sub,next,lenSub);
	while (i < lenStr && j < lenSub)
	{
		if (j==-1||str[i] == sub[j])
		{

			i++;
			j++;
		}
		else
		{
			j = next[j];//匹配失败j回退
		}
	}
	if (j >= lenSub)
	{
		return i - j;
	}
    //主串走完了还没匹配成功
	return -1;
}
int main()
{
	printf("%d\n", KMP("ababcabcdabcde","abcd",0));//5
	printf("%d\n", KMP("ababcabcdabcde","abcdf",0));//-1
	printf("%d\n", KMP("ababcabcdabcde","ab",0));//0
	return 0;
}

next[]数组的优化

image-20221104213608388

练习:
image-20221104213352529

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/3305.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

R语言代做实现:混合正态分布EM最大期望估计法

全文链接&#xff1a;http://tecdat.cn/?p4815 原文出处&#xff1a;拓端数据部落公众号 因为近期在分析数据时用到了EM最大期望估计法这个算法&#xff0c;在参数估计中也用到的比较多。然而&#xff0c;发现国内在R软件上实现高斯混合分布的EM的实例并不多&#xff0c;大多…

Linux系统下实现开机自动加载驱动模块

在使用模块化加载驱动时&#xff0c;若系统内部存在同类别设备驱动&#xff0c;可能会出现无法加载我们添加的动态模块&#xff0c;比如Linux系统内置了CDC驱动&#xff0c;当我们使用兼容CDC和VCP驱动USB转串口芯片时&#xff0c;就会出现上电出现的是CDC串口&#xff0c;从而…

vue3 组件响应式v-model 失效,实践踩坑,一文搞懂组件响应式原理,对初学者友好

文章目录前情提要实战解析最后前情提要 vue3的v-model已经有了变化&#xff0c;假如你还不知道其中细节&#xff0c;看完这篇文章你就完全明白了&#xff0c;我以踩坑的场景来进行解析。起因是在我的项目中需要一个输入框组件&#xff0c;这个组件用来根据输入异步查询系统内已…

Python编程 基础数据类型

作者简介&#xff1a;一名在校计算机学生、每天分享Python的学习经验、和学习笔记。 座右铭&#xff1a;低头赶路&#xff0c;敬事如仪 个人主页&#xff1a;网络豆的主页​​​​​​ 目录 前言&#xff1a; 一.Python基础数据类型 1.为什么会有数据类型&#xff1f;&am…

公共云和私有云之间的区别

目前&#xff0c;越来越多的公司正在调整云服务来运行他们的应用程序。其实&#xff0c;有不同类型的云部署模型来满足客户的不同需求。云部署模型分为三种类型&#xff1a;公有云、私有云和混合云(公有云和私有云的混合)。在本文中&#xff0c;我们将对公共云和私有云之间的区…

【数据结构】单链表——单链表的定义及基本操作的实现(头插、尾插、头删、尾删、任意位置的插入与删除)

&#x1f9d1;‍&#x1f4bb;作者&#xff1a; 情话0.0 &#x1f4dd;专栏&#xff1a;《数据结构》 &#x1f466;个人简介&#xff1a;一名双非编程菜鸟&#xff0c;在这里分享自己的编程学习笔记&#xff0c;欢迎大家的指正与点赞&#xff0c;谢谢&#xff01; 单链表前言…

分享30个PHP源码,总有一款适合你

链接&#xff1a;https://pan.baidu.com/s/1dVbUn5YFMOze4J-K8sCAXQ?pwdeinu 提取码&#xff1a;einu 下面是文件的名字&#xff0c;我放了一些图片&#xff0c;文章里不是所有的图主要是放不下...&#xff0c;大家下载后可以看到。 Emlog for SAE 适合新浪sae使用的个人博客…

网关Gateway-快速上手

gateway网关官方文档: https://docs.spring.io/spring-cloud-gateway/docs/current/reference/html/# 网关的概念 网关作为流量的入口&#xff0c;常用的功能包括路由转发&#xff0c;权限校验&#xff0c;限流等。 Spring Cloud Gateway 是Spring Cloud官方推出的第二代网关…

Java:修改Jar的源码,并上传Nexus私有仓库,替换jar版本

第一步&#xff1a;修改jar包源代码 建一个全类名一模一样的类&#xff0c;然后把要修改的类的代码复制过去&#xff0c;然后编译生成class。然后拿编译后的class覆盖到jar中对应的位置 第二步&#xff1a;上传nexus jar文件&#xff0c;pom文件&#xff1a;在本地仓库中可以…

Linux操作系统~进程有哪些状态?

目录 R状态 S/D状态 什么是D状态 T状态 X状态 Z状态 什么是等待队列&#xff0c;什么是运行队列&#xff0c;什么是挂起/阻塞&#xff0c;什么叫唤醒进程 对比宏观上操作系统的三种状态 从操作系统宏观的概念上讲&#xff0c;进程有三种状态&#xff0c;就绪态&#xff0…

自动化测试和测试自动化你分的清楚吗?

目录 前言 两种自动化测试 为什么测试自动化对连续测试至关重要 使测试自动化成为现实 拥抱连续测试 总结 重点&#xff1a;配套学习资料和视频教学 前言 当我们谈论持续测试&#xff0c;以及持续交付和DevOps时&#xff0c;“自动化”一词就泛滥了。从根本上讲&#xf…

ES6之对象解构

对象和数组字面量是JavaScript中两种最常用的数据结构&#xff0c;由于JSON数据格式的普及&#xff0c;二者已经成为语言中最重要的一部分。在代码中&#xff0c;我们经常定义很多对象和数组&#xff0c;然后从去提取相关的信息片段&#xff0c;ES6为简化这种任务引入了新特性&…

猿代码浅谈MPI与OpenMP并行程序设计

一、什么是OpenMP&#xff1f; OpenMP是一种用于共享内存并行系统的多线程程序设计的库(Compiler Directive),特别适合于多核CPU上的并行程序开发设计。它支持的语言包括&#xff1a;C语言、C、Fortran;不过&#xff0c;用以上这些语言进行程序开发时&#xff0c;并非需要特别…

一文读懂qt界面设计(分裂器,布局,拉伸,各种属性设置)

可以先看看我这个文章&#xff1a;qt关于界面设计中的一些知识总结_我是标同学的博客-CSDN博客_qt 水平伸展 现在我们来正式开始讲解。 布局种类 qt中能称为布局管理器的有如下6个&#xff1a; 水平布局&#xff08;QHBoxLayout&#xff09;垂直布局&#xff08;QVBoxLayout…

数字电路基础04(查找表LUT)

文章目录 LUT(Look Up Table)为什么要用LUT?示例(3输入LUT)LUT(Look Up Table) 在FPGA中,利用LUT来实现组合逻辑的功能,将组合逻辑的输入输出结果,存储为真值表的形式,来代替传统的由逻辑门组成的组合逻辑电路LUT就是将组合逻辑转换成真值表LUT实际上是将输入数据作…

怎么清理c盘的垃圾文件?有什么好的清理方法推荐?

在使用电脑办公或者娱乐的时候&#xff0c;我们的电脑会产生很多临时文件&#xff0c;如果这些临时文件不被清理掉的话&#xff0c;就会导致电脑的运行速度越来越慢&#xff0c;为了能够让电脑的速度越来越快&#xff0c;很多人都会想要清理C盘&#xff0c;但是在清理C盘的时候…

机器视觉(三):摄像机标定技术

目录&#xff1a; 机器视觉&#xff08;二&#xff09;&#xff1a;机器视觉硬件技术 机器视觉&#xff08;三&#xff09;&#xff1a;摄像机标定技术 &#x1f30f;&#x1f9d0;以下为正文&#x1f984;&#x1fa90; 摄像机标定的目的&#xff1a;三维重建 空间物体表面…

ESP32使用MiroPython编程环境搭建

大家好&#xff01; 今天和大家聊一聊ESP32使用MrioPython编程的环境搭建过程。 目录 一、在ESP32上使用MiroPython的必要条件 二、安装Thonny 1.安装地址 2.安装过程 三、下载MiroPython 四、下载ESP32驱动 五、烧录MicroPython到ESP32 六、点亮ESP32设备LED灯 一、在…

无人机技术服务应用

无人机技术服务应用 随着无人机的迅速发展&#xff0c;无人机行业应用越来越丰富&#xff0c;如何实现无人机行业内高效的运营一直是我们关注的重点。当今无人机具有的优势很多&#xff0c;例如&#xff1a;携带方便、操作简单、反应迅速、载荷丰富、任务用途广泛、起飞降落对…

计算机网络【HTTP协议】

计算机网络【HTTP协议】&#x1f34e;一.HTTP协议概述&#x1f352;1.什么是HTTP协议&#x1f352;1.2 Fiddler&#xff08;抓包工具&#xff09;&#x1f34e;二.HTTP协议格式&#x1f352;2.1HTTP请求&#x1f349;2.1.1 HTTP请求格式&#x1f349;2.1.2 HTTP请求格式URL&…