Grep
过滤来自一个文件或标准输入匹配模式内容。 除了grep外,还有egrep、fgrep。egrep是grep的扩展,相当于grep -E。fgrep相当于grep -f,用的少。 Usage: grep [OPTION]… PATTERN [FILE]…
支持的正则 描述 -E,–extended-regexp 模式是扩展正则表达式(ERE) -P,–perl-regexp 模式是Perl正则表达式 -e,–regexp=PATTERN 使用模式匹配,可指定多个模式匹配 -f,–file=FILE 从文件每一行获取匹配模式 -i,–ignore-case 忽略大小写 -w,–word-regexp 模式匹配整个单词 -x,–line-regexp 模式匹配整行 -v,–invert-match 打印不匹配的行
输出控制 描述 -m,–max-count=NUM 输出匹配的结果num数 -n,–line-number 打印行号 -H,–with-filename 打印每个匹配的文件名 -h,–no-filename 不输出文件名 -o,–only-matching 只打印匹配的内容 -q,–quiet 不输出正常信息 -s, --no-messages 不输出错误信息 -r,–recursive 递归目录 -c,–count 只打印每个文件匹配的行数 –include=FILE_PATTERN 只检索匹配的文件 –exclude=FILE_PATTERN 跳过匹配的文件 –exclude-from=FILE 跳过匹配的文件,来自文件模式 –exclude-dir=PATTERN 跳过匹配的目录
内容行控制 描述 -B,–before-context=NUM 打印匹配的前几行 -A,–after-context=NUM 打印匹配的后几行 -C,–context=NUM 打印匹配的前后几行 –color[=WHEN] 匹配的字体颜色
sed
流编辑器,过滤和替换文本。 工作原理:sed命令将当前处理的行读入模式空间进行处理,处理完把结果输出,并清空模式空间。然后再将下一行读入模式空间进行处理输出,以此类推,直到最后一行。还有一个空间叫保持空间,又称暂存空间,可以暂时存放一些处理的数据,但不能直接输出,只能放到模式空间输出。 这两个空间其实就是在内存中初始化的一个内存区域,存放正在处理的数据和临时存放的数据
Usage: sed [OPTION]… {script-only-if-no-other-script} [input-file]… sed [选项] ‘地址 命令’ file
选项 描述 -n 不打印模式空间 -e 执行脚本、表达式来处理 -f 执行动作从文件读取执行 -i 修改原文件 -r 使用扩展正则表达式
命令 描述 s/regexp/replacement/ 替换字符串 p 打印当前模式空间 P 打印模式空间的第一行 d 删除模式空间,开始下一个循环 D 删除模式空间的第一行,开始下一个循环 = 打印当前行号 a \text 当前行追加文本 i \text 当前行上面插入文本 c \text 所选行替换新文本 q 立即退出sed脚本 r 追加文本来自文件 : label label为b和t命令 b label 分支到脚本中带有标签的位置,如果分支不存在则分支到脚本的末尾 t label 如果s///是一个成功的替换,才跳转到标签 h H 复制/追加模式空间到保持空间 g G 复制/追加保持空间到模式空间 x 交换模式空间和保持空间内容 l 打印模式空间的行,并显示控制字符$ n N 读取/追加下一行输入到模式空间 w filename 写入当前模式空间到文件 ! 取反、否定 & 引用已匹配字符串
地址 描述 first~step 步长,每step行,从第first开始 $ 匹配最后一行 /regexp/ 正则表达式匹配行 number 只匹配指定行 addr1,addr2 开始匹配addr1行开始,直接addr2行结束 addr1,+N 从addr1行开始,向后的N行 addr1,~N 从addr1行开始,到N行结束
awk
awk是一个处理文本的编程语言工具,能用简短的程序处理标准输入或文件、数据排序、计算以及生成报表等等。 在Linux系统下默认awk是gawk,它是awk的GNU版本。可以通过命令查看应用的版本:ls -l /bin/awk 基本的命令语法:awk option ‘pattern {action}’ file 其中pattern表示AWK在数据中查找的内容,而action是在找到匹配内容时所执行的一系列命令。花括号用于根据特定的模式对一系列指令进行分组。 awk处理的工作方式与数据库类似,支持对记录和字段处理,这也是grep和sed不能实现的。 在awk中,缺省的情况下将文本文件中的一行视为一个记录,逐行放到内存中处理,而将一行中的某一部分作为记录中的一个字段。用1,2,3…数字的方式顺序的表示行(记录)中的不同字段。用$后跟数字,引用对应的字段,以逗号分隔,0表示整个行。
Pattern Description BEGIN{ } 给程序赋予初始状态,先执行的工作 END{ } 程序结束之后执行的一些扫尾工作 /regular expression/ 为每个输入记录匹配正则表达式 pattern && pattern 逻辑and,满足两个模式 pattern ! pattern 逻辑not,不满足模式 pattern1, pattern2 范围模式,匹配所有模式1的记录,直到匹配到模式2
find
功能:目录层次结构中搜索文件 格式:find path -option actions 常用选项: -name 文件名,支持(‘*’, ‘?’) -type 文件类型,d目录,f常规文件等 -perm 符合权限的文件,比如755 -atime -/+n 在n天以内/过去n天被访问过 -ctime -/+n 在n天以内/过去n天被修改过 -amin -/+n 在n天以内/过去n分钟被访问过 -cmin -/+n 在n天以内/过去n分钟被修改过 -size -/+n 文件大小小于/大于,b、k、M、G -maxdepth levels 目录层次显示的最大深度 -regex pattern 文件名匹配正则表达式模式 -inum 通过inode编号查找文件 动作: -detele 删除文件 -exec command {} ; 执行命令,花括号代表当前文件 -ls 列出当前文件,ls -dils格式 -print 完整的文件名并添加一个回车换行符 -print0 打印完整的文件名并不添加一个回车换行符 -printf format 打印格式 其他字符: ! 取反 -or/-o 逻辑或 -and 逻辑和