第4.3节：正则表达式详解-特殊字符

TYYSOFT

于 2025-08-18 17:00:08 发布

阅读量338

点赞数 1

CC 4.0 BY-SA版权

分类专栏：编程语言学习 # AWK编程语言文章标签：正则表达式编程语言 AWK

25 篇文章

订阅专栏

19 篇文章

订阅专栏

1 第4.3节：正则表达式详解-特殊字符

除了普通字符和转义字符外，正则表达式中还有类特殊字符，可以对正则表达式的行为进行修饰，下表是一些常用的正则表达式特殊字符及含义：

字符	说明
^	匹配输入字符串的开始位置。要匹配 “^” 字符本身，请使用 “\^”
$	匹配输入字符串的结尾位置。要匹配 “$” 字符本身，请使用 “\$”
( )	标记一个子表达式的开始和结束位置。要匹配小括号，请使用 “$” 和 “$”
[…]	用来自定义能够匹配 ‘多种字符’ 的表达式，[]中的…表示用户自定义字符。要匹配中括号，请使用 “\[” 和 “\]”
[^…]	这是一个`否定`逻辑，匹配任何字符但除了这里[]中定义的字符。
{ }	修饰匹配次数的符号。要匹配大括号，请使用 “\{” 和 “\}”
.	匹配除了换行符（\n）以外的任意一个字符。要匹配小数点本身，请使用 “\.”
?	修饰匹配次数为 0 次或 1 次。要匹配 “?” 字符本身，请使用 “\?”
+	修饰匹配次数为至少 1 次。要匹配 “+” 字符本身，请使用 “\+”
*	修饰匹配次数为 0 次或任意次。要匹配 “” 字符本身，请使用 “\”
\|	左右两边表达式之间 “或” 关系。匹配 "

文本样例：

sample
123
456
789abc
012345678
end

awk代码及运行结果：

$ awk '/^[[:digit:]]+/' sample1.txt
123
456
789abc
012345678

示例2：使用“$”筛选整行都是数字的文本
上述文本样例中，有部分行是数字+字符的，如果想筛选出全部是数字的行，该如何处理呢？此时可以使用“^”和“$”来联合约束文本内容：

awk代码及运行结果：

$ awk '/^[[:digit:]]+$/' sample1.txt
123
456
012345678

awk代码及运行结果：

$ awk '/^[[:digit:]]+$/{print gensub(/(.*)/, "TEL: \\1", "g")}' sample1.txt
TEL: 123
TEL: 456
TEL: 012345678

$ awk '/^[[:digit:]]{3}$/' sample1.txt
123
456

注意：正则表达式中的{3}表示匹配3个数字，其实，{}次数限定中有两个参数：{最少次数, 最多次数}，使用时有很多用法：