shell之通配符及正则表达式,grep参数

news2025/5/31 19:17:59

通配符与正则表达式

通配符(Globbing)

通配符是由 Shell 处理的特殊字符,用于路径或文件名匹配。当 Shell 在命令参数中遇到通配符时,会将其扩展为匹配的文件路径;若没有匹配项,则作为普通字符传递给命令。

Shell 中的通配符列表
通配符描述示例
*匹配任意长度的字符(包括 0 个)ls *.txt:匹配所有 .txt 文件
?匹配单个任意字符ls file?.txt:匹配 file1.txtfileA.txt 等
[charset]匹配字符集中的任意单个字符ls [abc].txt:匹配 a.txtb.txtc.txt
[^charset]匹配不在字符集中的任意单个字符ls [^0-9].txt:匹配非数字开头的 .txt 文件
[a-z]匹配指定范围内的单个字符(小写字母)ls [a-c]file:匹配 afilebfilecfile
[[:class:]]匹配 POSIX 字符类中的字符ls [[:digit:]]*:匹配数字开头的文件

POSIX 字符类(需用 [[:class:]] 表示)

水平空白字符([:blank:]

定义:仅包含在同一行内起分隔作用的空白字符。
包含字符

  • 空格():ASCII 32(十进制),用于单词分隔。
  • 制表符(\t:ASCII 9,用于文本对齐(水平跳格)

垂直空白字符([:space:])

定义:用于换行或分页的空白字符,会导致文本显示位置移动到新行或新页。
包含字符

  • 换行符(\n:ASCII 10,用于换行(如 Unix/Linux 系统的行尾符)。
  • 回车符(\r:ASCII 13,用于回到行首(如 Windows 系统的行尾符为 \r\n)。
  • 换页符(\f:ASCII 12,用于分页(如打印时换页)。
  • 垂直制表符(\v:ASCII 11,用于垂直跳格(很少使用)。
字符类描述等价写法
[:alnum:]字母或数字[A-Za-z0-9]
[:alpha:]字母(大小写)[A-Za-z]
[:digit:]数字[0-9]
[:lower:]小写字母[a-z]
[:upper:]大写字母[A-Z]
[:space:]空白字符(空格、制表符、换行符等)
[:punct:]标点符号
通配符实例文件自己chuang
  1. 匹配以 menu0 开头的文件

    ls menu0*  # 输出:menu01.sh menu02.sh menu03.sh menu04.sh
    
  2. 匹配以 m 开头且后接单个字符的文件

    ls m?  # 输出:m1 m2 m3(假设存在这些文件)
    
  3. 匹配以 m 或 n 开头的文件

    ls [mn]*  # 匹配 `m*` 和 `n*` 的文件
    
  4. 匹配字母开头的文件(不区分大小写)

    ls [a-Z]*  # 注意:`[a-Z]` 实际包含 ASCII 字符范围,可能包含非字母(如 `[`、`\` 等),推荐用 `[[:alpha:]]`
    ls [[:alpha:]]*  # 正确匹配所有字母开头的文件
    
  5. 匹配数字开头的文件

    ls [[:digit:]]*  # 等价于 `ls [0-9]*`
    
  6. 匹配字母或数字开头的文件

    ls [[:alnum:]]*  # 匹配 `[0-9A-Za-z]*`
    

grep的常用参数

选项功能描述
-n显示行号
-o只显示匹配的内容
-q静默模式,无输出,通过$?判断执行是否成功(即是否过滤到想要内容)
-l匹配成功则只打印文件名,失败不打印,常与-r一起用,如grep -rl 'root' /etc
-A <n>匹配成功时,将匹配行及其后n行一起打印出来
-B <n>匹配成功时,将匹配行及其前n行一起打印出来
-C <n>匹配成功时,将匹配行及其前后n行一起打印出来
--color高亮颜色显示匹配到的字符串
-c匹配成功时,打印匹配到的行数
-E等同于egrep,启用扩展正则表达式
-i忽略大小写
-v取反,打印不匹配的行
-w匹配单词
-r递归搜索,不仅搜索当前目录,还搜索各级子目录
-s不显示关于不存在或无法读取文件的错误信息

正则表达式(Regular Expression, RE)

正则表达式是用于文本内容匹配的模式,常用于 grepsedawk 等工具中,针对文件内容而非文件名。

正则表达式基础概念
  • 作用:通过特殊字符组合,实现字符串的搜索、替换、删除等操作。
  • 优势:简化文本处理逻辑,减少代码量。
  • 分类
    • 基本正则表达式(BRE):支持基础元字符,需转义部分符号(如 {})。
    • 扩展正则表达式(ERE):支持更多元字符(如 +?),无需转义 {} 等符号。
基本正则表达式(BRE)元字符
元字符描述示例
^匹配行首grep ^root /etc/passwd:匹配以 root 开头的行
$匹配行尾grep bash$ /etc/passwd:匹配以 bash 结尾的行
.匹配单个任意字符grep r.t /etc/passwd:匹配 r 和 t 之间有一个字符的行(如 rotrxt
*匹配前一个字符 0 次或多次grep r.*t /etc/passwd:匹配 r 和 t 之间有任意字符的行
[]匹配字符集中的任意单个字符grep r[a-z]t /etc/passwd:匹配 r 和 t 之间为小写字母的行
[^]匹配不在字符集中的任意单个字符grep r[^a-z]t /etc/passwd:匹配 r 和 t 之间为非小写字母的行
\{n,m\}匹配前一个字符 n 到 m 次(需转义)grep 'r\{3\}t' /etc/passwd:匹配 r 重复 3 次后接 t 的行

POSIX 字符类(在正则中同样适用)

grep [[:digit:]]\{3,4\} /etc/passwd  # 匹配 3-4 位数字
扩展正则表达式(ERE)元字符

需通过 egrep 或 grep -E 使用,无需转义特殊符号。

元字符描述示例与匹配结果
+匹配前一个字符 1 次或多次(至少出现 1 次)。egrep 'r+t' /etc/passwd
匹配 rtrrtrrrt 等(r 至少出现 1 次后接 t)。
?匹配前一个字符 0 次或 1 次(可选出现)。egrep 'colou?r' /etc/passwd
匹配 color 或 colouru 可选:u可出现0次或者1次)。
{n}匹配前一个字符 恰好 n 次egrep 'r{3}t' /etc/passwd
匹配 rrrtr 连续出现 3 次)。
{n,}匹配前一个字符 至少 n 次egrep 'r{2,}t' /etc/passwd
匹配 rrtrrrtrrrrrt 等(r 至少出现 2 次)。
{n,m}匹配前一个字符 n 到 m 次之间(包含 n 和 m)。egrep 'r{2,4}t' /etc/passwd
匹配 rrtrrrtrrrrtr 出现 2-4 次)。
(pattern1|pattern2)匹配多个模式中的 任意一个(使用竖线 | 分隔)。egrep '^(root|admin)' /etc/passwd
匹配以 root 或 admin 开头的行。
正则表达式工具对比
工具正则类型说明
grep基本正则表达式(BRE)需转义 {} 等符号
egrep扩展正则表达式(ERE)直接使用 +?{} 等符号
fgrep不支持正则按字面匹配字符串
 正则表达式实例
  1. 匹配以 bash 结尾的行

    grep bash$ /etc/passwd  # 基本正则
    egrep bash$ /etc/passwd  # 扩展正则(等价)
    
  2. 匹配 3-4 位数字

    grep '[[:digit:]]\{3,4\}' /etc/passwd  # BRE,需转义 {}
    egrep '[[:digit:]]{3,4}' /etc/passwd  # ERE,无需转义
    
  3. 匹配以空白字符开头、非空白字符后跟的行

    grep "^[[:space:]]\+[^[:space:]]" /etc/grub2.cfg  # BRE,`\+` 表示 `+`
    egrep "^[[:space:]]+[^[:space:]]" /etc/grub2.cfg  # ERE,直接用 `+`
    
  4. 匹配包含 Failed 或 FAILED 的行(不区分大小写)

    grep -i 'failed' /var/log/secure  # 基本正则,`-i` 忽略大小写
    egrep -i 'failed|FAILED' /var/log/secure  # 扩展正则,匹配任意模式
    

通配符与正则表达式对比

特性通配符正则表达式
处理者Shell(路径扩展)命令(如 grep
作用对象文件名或路径文本内容
元字符差异*?[].*+() 等
典型场景ls *.txtrm data_*grep "pattern" filesed -e "s/regex/replace/"

7.4 练习与答案(扩展)

练习 1:显示 /etc/passwd 中以不区分大小的 h 开头的行
grep -i ^h /etc/passwd  # `-i` 忽略大小写,`^h` 匹配行首
练习 2:显示 /etc/passwd 中以 sh 结尾的行
grep sh$ /etc/passwd  # `$` 匹配行尾
练习 3:显示 /etc/fstab 中以 # 开头、后跟一个或多个空白字符和非空白字符的行
grep "^#[[:space:]]\+[^[:space:]]" /etc/fstab  # BRE,`\+` 表示一个或多个空白字符
egrep "^#[[:space:]]+[^[:space:]]" /etc/fstab  # ERE,直接用 `+`
练习 4:查找 /etc/rc.d/rc.local 中包含以 to 开始并以 to 结尾的字串的行
grep "to.*to" /etc/rc.d/rc.local  # `.*` 匹配任意字符
练习 5:查找 /etc/passwd中包含sbin行,或者以s开头,以n结尾的单词的行
1、grep -w 'sbin' /etc/passwd  # `\<` 和 `\>` 表示单词边界


-w 会强制 grep 仅匹配独立的完整单词,而非单词的一部分。具体规则:
单词边界:单词必须被非单词字符(如空格、标点符号、换行符)包围。
单词字符:通常指字母、数字和下划线(即 [A-Za-z0-9_])。

选项 / 元字符	功能	示例匹配
-w	匹配完整单词,自动添加单词边界检查	grep -w 'foo' → 匹配 foo,但不匹配 foobar
\< 和 \>	正则表达式中的单词边界元字符	grep '\<foo\>' → 同上,但需手动添加元字符





2、grep -Eo '\bs[a-z]*n\b' /etc/passwd  # 仅匹配小写字母
-o 是只显示匹配内容
\b:显式定义单词边界

grep -Ew 's[a-z]*n' /etc/passwd

注意:如果你要匹配以s开头,以n结尾单词的行,根据grep版本的问题,.*进行贪婪匹配,会尽可能多的去匹配,达不到预期的效果,所以我们把任意字符改为任意数量的小写字母。
练习 6:查找 ifconfig 结果中 1-255 之间的整数
ifconfig | egrep -w "[1-9]|[1-9][0-9]|1[0-9]{2}|2[0-4][0-9]|25[0-5]"
练习 7:显示 /var/log/secure 中包含 Failed 或 FAILED 的行
grep -i 'failed' /var/log/secure  # 简化写法,匹配大小写
练习 8:在 /etc/passwd 中取出默认 Shell 为 bash 的行
grep '/bin/bash$' /etc/passwd  # 匹配行尾的 `/bin/bash`
练习 9:以长格式列出 /etc/ 下以 ns 开头、.conf 结尾的文件
ls -l /etc/ns*.conf  # 通配符直接用于文件名匹配
练习 10:高亮显示 passwd 文件中用户名和加密密码
grep -o '^[^:]*:[^:]*' /etc/passwd  # 匹配冒号分隔的字段


相当于匹配用户名和加密密码

总结

  • 通配符:专注于文件名匹配,由 Shell 处理,语法简单(如 *?)。
  • 正则表达式:用于文本内容匹配,支持复杂模式(如 ^$.*),需结合工具(grepegrep)使用。
  • 关键区别:作用对象不同(文件名 vs. 文本内容),元字符语法有差异。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2391747.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Knife4j框架的使用

文章目录 引入依赖配置Knife4j使用Knife4j 访问 SpringBoot 生成的文档 Knife4j 是基于 Swagger 的增强工具&#xff0c;对 Swagger 进行了拓展和优化&#xff0c;从而有更美观的界面设计和更强的功能 引入依赖 Spring Boot 2.7.18 版本 <dependency> <groupId>c…

深兰科技陈海波率队考察南京,加速AI医诊大模型区域落地应用

近日&#xff0c;深兰科技创始人、董事长陈海波受邀率队赴南京市&#xff0c;先后考察了南京江宁滨江经济开发区与鼓楼区&#xff0c;就推进深兰AI医诊大模型在南京的落地应用&#xff0c;与当地政府及相关部门进行了深入交流与合作探讨。 此次考察聚焦于深兰科技自主研发的AI医…

【芯片设计中的交通网络革命:Crossbar与NoC架构的博弈C架构的博弈】

在芯片设计领域&#xff0c;总线架构如同城市交通网&#xff0c;决定了数据流的通行效率。随着AI芯片、车载芯片等复杂场景的爆发式增长&#xff0c;传统总线架构正面临前所未有的挑战。本文将深入解析两大主流互连架构——Crossbar与NoC的优劣&#xff0c;揭示芯片"交通网…

deepseek告诉您http与https有何区别?

有用户经常问什么是Http , 什么是Https &#xff1f; 两者有什么区别&#xff0c;下面为大家介绍一下两者的区别 一、什么是HTTP HTTP是一种无状态的应用层协议&#xff0c;用于在客户端浏览器和服务器之间传输网页信息&#xff0c;默认使用80端口 二、HTTP协议的特点 HTTP协议…

mac将自己网络暴露到公网

安装服务 brew tap probezy/core && brew install cpolar// 安装cpolar sudo cpolar service install // 启动服务 sudo cpolar service start访问管理网站 http://127.0.0.1:9200/#/tunnels/list 菜单“隧道列表” 》 编辑 自定义暴露的端口 再到在线列表中查看公网…

拓扑排序算法剖析与py/cpp/Java语言实现

拓扑排序算法深度剖析与py/cpp/Java语言实现 一、拓扑排序算法的基本概念1.1 有向无环图&#xff08;DAG&#xff09;1.2 拓扑排序的定义1.3 拓扑排序的性质 二、拓扑排序算法的原理与流程2.1 核心原理2.2 算法流程 三、拓扑排序算法的代码实现3.1 Python实现3.2 C实现3.3 Java…

罗马-华为

SPA应用:single-page application:单页应用SPA是一种网络应用程序或网站的模型,它通过动态重写当前页面来与用户交互,这种方法避免了页面之间切换打断用户体验在单页应用中 集成 ROMA Connect 主要包含四个组件:数据集成( FDI )、服务集成( APIC )、消息集成 ( MQS …

切片器导航-大量报告页查看的更好方式

切片器导航-大量报告页查看的更好方式 现在很多报告使用的是按钮导航&#xff0c;即使用书签按钮来制作页面导航的方式。但是当我们的报告有几十页甚至上百页的时候&#xff0c;使用书签按钮来制作页面导航&#xff0c;无论是对于报表制作者还是报告使用者来说都是一种很繁琐的…

ubuntu 22.04安装k8s高可用集群

文章目录 1.环境准备&#xff08;所有节点&#xff09;1.1 关闭无用服务1.2 环境和网络1.3 apt源1.4 系统优化1.5 安装nfs客户端 2. 装containerd&#xff08;所有节点&#xff09;3. master的高可用方案&#xff08;master上操作&#xff09;3.1 安装以及配置haproxy&#xff…

使用java实现word转pdf,html以及rtf转word,pdf,html

word,rtf的转换有以下方案&#xff0c;想要免费最靠谱的是LibreOffice方案, LibreOffice 是一款 免费、开源、跨平台 的办公软件套件&#xff0c;旨在为用户提供高效、全面的办公工具&#xff0c;适用于个人、企业和教育机构。它支持多种操作系统&#xff08;Windows、macOS、…

使用LSTM进行时间序列分析

LSTM&#xff08;长短期记忆网络&#xff0c;Long Short-Term Memory&#xff09;是一种特殊的循环神经网络&#xff08;RNN&#xff09;&#xff0c;专门用于处理时间序列数据。由于其独特的结构设计&#xff0c;LSTM能够有效地捕捉时间序列中的长期依赖关系&#xff0c;这使得…

【密码学——基础理论与应用】李子臣编著 第十三章 数字签名 课后习题

题目 逐题解析 13.1 知道p83,q41,h2,g4,x57,y77。 我看到答案&#xff0c;“消息M56”的意思居然是杂凑值&#xff0c;也就是传统公式的H(M)。 选择k23&#xff0c;那么r(g^k mod p) mod q 51 mod 4110,sk(H(M)xr) mod q29 ws mod q17,u1(mw) mod q9&#xff0c;u2(rw) m…

k8s中kubeSphere的安装使用+阿里云私有镜像仓库配置完整步骤

一、实验目的 1、掌握kubeSphere 的安装部署 2、掌握kubesphere 使用外部镜像仓库&#xff1b; 2、熟悉图像化部署任务&#xff1a;产生pod---定义服务--验证访问 本次实验旨在通过 KubeSphere 平台部署基于自定义镜像&#xff08;nginx:1.26.0 &#xff09;的有状态副本集…

Agilent安捷伦Cary3500 UV vis光谱仪Cary60分光光度计Cary1003004000500060007000 UV visible

Agilent安捷伦Cary3500 UV vis光谱仪Cary60分光光度计Cary1003004000500060007000 UV visible

arcgis js 4.x 的geometryEngine计算距离、面积、缓冲区等报错、失败

在arcgis js 4.x版本中geometryEngine.geodesicArea计算面积时&#xff0c;有时会失败&#xff0c;失败的主要原因是&#xff0c;当前底图的坐标系不是WGS84大地坐标系&#xff08;代号4326&#xff09;或者web墨卡托投影&#xff08;代号102113, 102100, 3857这三种之一&#…

SpringAI 大模型应用开发篇-纯 Prompt 开发(舔狗模拟器)、Function Calling(智能客服)、RAG (知识库 ChatPDF)

🔥博客主页: 【小扳_-CSDN博客】 ❤感谢大家点赞👍收藏⭐评论✍ 文章目录 1.0 大模型应用开发技术框架 2.0 纯 Prompt 模式 2.1 核心策略 2.2 减少模型"幻觉"的技巧 2.3 提示词攻击防范 2.4 纯 Prompt 大模型开发(舔狗模拟器) 3.0 Function Calling 模式 3.1 …

Unsupervised Learning-Word Embedding

传统的1 of N 的encoding无法让意义相近的词汇产生联系,word class可以将相近的词汇放到一起 但是word class不能表示class间的关系,所以引入了word embedding(词嵌入) 我们生成词向量是一种无监督的过程(没有label 自编码器是一种人工神经网络&#xff0c;主要用于无监督学习…

远控安全进阶之战:TeamViewer/ToDesk/向日葵设备安全策略对比

【作者主页】Francek Chen 【文章摘要】在数字化时代&#xff0c;卓越的远程控制软件需兼顾功能与体验&#xff0c;包括流畅连接、高清画质、低门槛UI设计、毫秒级延迟及多功能性&#xff0c;同时要有独树一帜的远控安全技术&#xff0c;通过前瞻性安全策略阻挡网络风险&#x…

变量的计算

不同类型变量之间的计算 数字型变量可以直接计算 在python中&#xff0c;数字型变量可以直接通过算术运算符计算bool型变量&#xff1a;True 对应数字1 &#xff1b;False 对应数字0、 字符串变量 使用 拼接字符串 使用 * 拼接指定倍数的相同字符串 变量的输入&#xff1a;&…

深入了解linux系统—— 库的制作和使用

什么是库&#xff1f; 库&#xff0c;简单来说就是现有的&#xff0c;成熟的代码&#xff1b; 就比如我们使用的C语言标准库&#xff0c;我们经常使用输入scanf和输出printf&#xff0c;都是库里面给我们实现好的&#xff0c;我们可以直接进行服用。 库呢又分为静态库和动态…