数据结构——D/串

数据结构——D/串

news2026/3/8 2:29:39

一、串的定义和基本操作

1. 串的定义

1）串的概念

组成结构: 串是由零个或多个字符组成的有限序列，记为
S=′a1a2⋯an′S='a_1a_2\cdots a_n'S=′a1a2⋯an′
（
n≥0n \geq 0n≥0
），其中
SSS
是串名，
aia_iai
可以是字母、数字或其他字符
长度特性: 串中字符的个数
nnn
称为串的长度，
n=0n=0n=0
时的串称为空串（用
∅\emptyset∅
表示）
边界符说明: 单引号或双引号只是边界符，不计入串长度（如"Hello World!"长度为11）
编程语言差异: Java/C使用双引号，Python使用单引号表示字符串

2）子串

定义: 字符串中任意连续字符组成的子序列（包括空串）
示例特性: 从主串"iPhone 11 Pro Max"中，"11 Pro"、"Pro"等都是其子串
包含关系: 空串是任何字符串的子串

3）字符

位置编号: 字符在主串中的位置从1开始计数（与线性表位序一致）
空格处理: 空格也是有效字符（如"11 Pro"中空格是第3个字符）
存储大小: 每个字符占1字节（8比特），跨考同学需特别注意

4）子串在主串中的位置

定位规则: 以子串第一个字符在主串中的位置作为子串位置
示例说明: 子串"11 Pro"在主串"iPhone 11 Pro Max"中的位置是8（'1'的位置）

5）空串和空格串的区别

空串: 长度为零的串（如
M=′′M=''M=′′
）
空格串: 包含空格字符的串（如
N=' '
长度为3）
存储差异: 空串不占存储空间，空格串占用与空格数对应的存储空间

2. 串与线性表的区别

元素限制:
- 线性表：元素可为任意数据类型
- 串：元素限定为字符（中英文字符、数字、标点等）
操作对象:
- 线性表：以单个元素为操作单位
- 串：通常以子串为操作单位（如搜索引擎处理字符串）
实际应用: 字符串操作更符合人类语言处理需求（需多个字符组合表达语义）

3. 串的基本操作

1）判空操作

实现方式: 判断字符串长度是否为0
返回值: 空串返回true，非空返回false

2）销毁串

与清空区别:
- 清空：仅逻辑清空，保留存储空间
- 销毁：回收存储空间，不可再次使用
内存管理: 销毁操作涉及动态内存释放机制

3）串的连接

操作示例:
SSS
="iPhone"，
WWW
="Pro"连接后
TTT
="iPhonePro"
存储考虑: 频繁连接需设计可扩展的存储结构

4）求子串

参数指定: 需要起始位置和子串长度
边界处理: 需验证参数有效性（如起始位置+长度不超过主串长度）

5）定位操作

功能描述: 查找子串在主串中首次出现的位置
返回值: 找到返回位置序号（从1开始），未找到返回0
算法核心: 依赖子串匹配算法实现

6）比较操作

比较规则:
- 逐字符比较ASCII码值
- 先出现较大字符的串更大
- 全相同则较长串更大
返回值约定:
- S>TS>TS>T
  返回正值
- S=TS=TS=T
  返回0
- S<TS<TS<T
  返回负值
字典序原理: 基于字符在编码表中的二进制值比较（如'a'<'o'因ASCII码97<111）

4. 字符集编码

1）字符与二进制数的对应关系

存储原理: 计算机只能存储二进制数，所有字符必须通过编码规则转换为二进制形式存储
映射关系: 每个字符对应唯一的二进制数，如字母'a'存储为高四位0110加低四位0001的组合

2）ASCII编码示例

编码结构: ASCII码使用8位二进制数（1字节）表示，分为非打印控制字符（0-31）和可打印字符（32-127）
输入方式: 可通过ALT+小键盘数字键输入，如ALT+65输入大写字母'A'

3）字符比较与二进制数的关系

比较机制: 计算机直接比较字符对应的二进制数值大小，如'c'（01100011）>'a'（01100001）
实际应用: 英文字典排序本质是二进制数的升序排列

4）空格串与空串的区别

空格串: 对应二进制00100000，占用1字节存储空间
空串: 无实际字符内容，不占用存储空间（NULL）

5）字符集的概念

集合定义: 特定语言所有字符的集合，如ASCII包含英文字母、标点符号等128个字符
扩展需求: 中文等语言字符量远超256个，需要更大字符集

6）不同字符集的编码需求

容量限制: 8位二进制仅能表示256种状态，无法满足中文需求
解决方案: Unicode字符集包含全球文字符号，如中文"任"字需要更长的二进制编码

7）编码规则与字符集映射

数学模型: 字符集为定义域（x），编码规则为映射函数（f），二进制数为值域（y）
编码方案: 同一字符集可有多种编码规则（如UTF-8、UTF-16），对应不同二进制表示

8）编码方案的选择与字符空间占用

空间差异: ASCII每个字符占1字节，UTF-8中文字符占3字节
考研重点: 只需掌握英文字符的1字节存储情况

5. 拓展乱码问题

1）乱码问题的产生原因

核心原因: 文件存储与读取使用不同编码规则，如存储用
y=f(x)y=f(x)y=f(x)
而读取用
y=g(x)y=g(x)y=g(x)
实例说明: "码"字在规则A中编码为0101...，在规则B中可能解码为完全不同的字符

2）从函数角度理解乱码问题

数学模型: 正确解码需使用原编码规则的反函数
x=f−1(y)x=f^{-1}(y)x=f−1(y)
错误本质: 实际使用了错误的逆映射
g−1(y)g^{-1}(y)g−1(y)
导致字符解析失败

3）字符串基本概念回顾

术语定义:
- 串长：字符串包含的字符数量
- 子串：主串中连续字符组成的片段
- 位置：字符/子串在主串中的序号（从1开始）

4）字符串比较与字符集编码

比较规则: 按字符编码值逐位比较，类似字典序排列
操作重点: 子串定位算法（如Index(S,T)）是后续学习的核心内容

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2405577.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

AI+预测3D新模型百十个定位预测+胆码预测+去和尾2025年6月8日第102弹

AI+预测3D新模型百十个定位预测+胆码预测+去和尾2025年6月8日第102弹

从今天开始，咱们还是暂时基于旧的模型进行预测，好了，废话不多说，按照老办法，重点8-9码定位，配合三胆下1或下2，杀1-2个和尾，再杀4-5个和值，可以做到100-300注左右。 (1)定…

阅读更多...

【第九篇】 SpringBoot测试补充篇

简介本文介绍了SpringBoot测试中的五项关键技术：测试类专用属性加载、测试类专用Bean配置、表现层测试方法、测试类事务回滚控制、配置文件随机数据设置）。这些技术可以有效隔离测试环境，确保测试数据不影响生产环境，同时提供了…

阅读更多...

springcloud SpringAmqp消息队列简单使用

springcloud SpringAmqp消息队列简单使用

这期只是针对springBoot/Cloud 在使用SpringAmqp消息队列的时候遇到的坑。前提如果没有安装RabbitMQ是无法连接成功的！所以前提是你要安装好RabbitMQ。 docker 安装命令 # 拉取docker镜像 docker pull rabbitmq:management# 创建容器 docker run -id --namera…

阅读更多...

Framework开发之IMS逻辑浅析1--关键线程及作用

Framework开发之IMS逻辑浅析1--关键线程及作用

关键线程:EventHub,InputReader,InputDispatcher EventHub: 由于Android继承Linux,Linux的思想是一切皆文件,而输入的类型不止一种(触碰，写字笔，键盘等)，每种类型都对应一种驱动设备，而每个硬件驱动设备又对应Linux的一个目录文件…

阅读更多...

系统思考：跳出症状看全局

系统思考：跳出症状看全局

明天将为华为全球采购认证管理部的伙伴们带来一场关于系统思考的深度课程！通过经典的啤酒游戏经营决策沙盘，一起沉浸式体验如何从全局视角看待问题，发现单点最优并不等于全局最优。这不仅是一次简单的课程，更是一次洞察系统背后…

阅读更多...

DeepSeek R1 V2 深度探索：开源AI编码新利器，效能与创意并进

DeepSeek R1 V2 深度探索：开源AI编码新利器，效能与创意并进

最近，AI界迎来了一位神秘的“突袭者”——DeepSeek团队悄无声息地发布了其推理模型DeepSeek R1的重磅升级版V2（具体型号R1-0528）。这款基于MIT许可的开源模型，在原版R1的基础上进行了多项令人瞩目的改进，正以其强大的潜…

阅读更多...

surfer15安装

surfer15安装

安装文件安装包和破解文件安装破解及汉化打开软件

阅读更多...

Python训练营---DAY48

Python训练营---DAY48

DAY 48 随机函数与广播机制知识点回顾： 随机张量的生成：torch.randn函数卷积和池化的计算公式（可以不掌握，会自动计算的）pytorch的广播机制：加法和乘法的广播机制 ps：numpy运算也有类似的广播机…

阅读更多...

debian12拒绝海外ip连接

debian12拒绝海外ip连接

确保 nftables 已安装： Debian 12 默认使用 nftables 作为防火墙框架。检查是否安装： sudo apt update sudo apt install nftables启用并启动 nftables 服务 sudo systemctl enable nftables sudo systemctl start nftables下载maxmind数据库将文件解…

阅读更多...

70年使用权的IntelliJ IDEA Ultimate安装教程

70年使用权的IntelliJ IDEA Ultimate安装教程

安装Java环境下载Java Development Kit (JDK) 从Oracle官网或OpenJDK。推荐选择JDK 11或更高版本。运行下载的安装程序，按照提示完成安装。注意记录JDK的安装路径（如C:\Program Files\Java\jdk-11.0.15）。配置环境变量： 右键…

阅读更多...

MySQL的日志

MySQL的日志

就相当于人的日记本，记录每天发生的事，可以对数据进行追踪一、错误日志也就是存放错误信息的二、二进制日志-binlog 在低版本的MySQL中，二进制日志是不会默认开启的存放除了查询语句的其他语句三、查询日志查询日志会记录客户端的所…

阅读更多...

低功耗高安全：蓝牙模块在安防系统中的应用方案

低功耗高安全：蓝牙模块在安防系统中的应用方案

随着物联网(IoT)和智能家居的快速发展，安防行业正迎来前所未有的技术革新。蓝牙模块作为一种低功耗、高稳定性的无线通信技术，凭借其低成本、易部署和智能化管理等优势，在安防领域发挥着越来越重要的作用。本文将探讨蓝牙模块在安防系统中的应…

阅读更多...

C++定长内存块的实现

C++定长内存块的实现

内存池内存池是指程序预先从操作系统申请一块足够大内存 ，此后，当程序中需要申请内存的时候，不是直接向操作系统申请，而是直接从内存池中获取 ； 同理，当 **程序释放内存 **的时候，并不真正将…

阅读更多...

Unity使用代码分析Roslyn Analyzers

Unity使用代码分析Roslyn Analyzers

一、创建项目（注意这里不要选netstandard2.1会有报错） 二、NuGet上安装Microsoft.CodeAnalysis.CSharp 三、实现[Partial]特性标注的类，结构体，record必须要partial关键字修饰需要继承DiagnosticAnalyzer 注意一定要加特性Diagn…

阅读更多...

大数据CSV导入MySQL

大数据CSV导入MySQL

CSV Import MySQL 源码主要特性技术栈快速开始1. 环境要求2. 构建项目3. 使用方式交互式模式命令行模式编程方式使用核心组件1. CsvService2. DatabaseService3. CsvImportService 数据类型映射性能优化1. 连接池优化2. 批量操作优化3. MySQL配置优化配置说明application.yml…

阅读更多...

MySQL 索引优化（Explain执行计划）详细讲解

MySQL 索引优化（Explain执行计划）详细讲解

🤟致敬读者 🟩感谢阅读🟦笑口常开🟪生日快乐⬛早点睡觉 📘博主相关 🟧博主信息🟨博客首页🟫专栏推荐🟥活动信息文章目录 MySQL 索引优化（Explain执行计划…

阅读更多...

Cad 反应器 cad c#二次开发

Cad 反应器 cad c#二次开发

在 AutoCAD C# 二次开发中，DocumentCollectionEventHandler 是一个委托（delegate），用于处理与 AutoCAD 文档集合（DocumentCollection）相关的事件。它属于 AutoCAD .NET API 的事件处理机制，本质…

阅读更多...

【websocket】安装与使用

【websocket】安装与使用

websocket安装与使用 1. 介绍2. 安装3. websocketpp常用接口4. Websocketpp使用4.1 服务端4.2 客户端 1. 介绍 WebSocket 是从 HTML5 开始支持的一种网页端和服务端保持长连接的消息推送机制。传统的 web 程序都是属于 “一问一答” 的形式，即客户端给服务器发送…

阅读更多...

【大模型】LogRAG：基于检索增强生成的半监督日志异常检测

【大模型】LogRAG：基于检索增强生成的半监督日志异常检测

文章目录 A 论文出处B 背景B.1 背景介绍B.2 问题提出B.3 创新点 C 模型结构D 实验设计D.1 数据集/评估指标D.2 SOTAD.3 实验结果 E 个人总结E.1 优点E.2 不足 A 论文出处论文题目：LogRAG: Semi-Supervised Log-based Anomaly Detection with Retrieval-Augmented …

阅读更多...

基于SpringBoot实现的大创管理系统设计与实现【源码+文档】

基于SpringBoot实现的大创管理系统设计与实现【源码+文档】

基于SpringBootVue实现的大创管理系统采用前后端分离架构方式，系统设计了管理员、学生、指导老师、院系管理员两种角色，系统实现了用户登录与注册、个人中心、学生管理、指导老师管理、院系管理员管理、优秀项目管理、项目类型管理、项目信息管理、项目申…

阅读更多...

推荐文章

最新文章