正规表示法

  • 作者:Moilk
  • 最后编辑:2015年11月07日
  • 标签: Linux
  • 特殊符号:
特殊符号 代表意义
[:alnum:] 代表英文大小写字符及数字,亦即0-9,A-Z,a-z
[:alpha:] 代表任何英文大小写字符,亦即 A-Z, a-z
[:blank:] 代表空格键与Tab按键两者
[:cntrl:] 代表键盘上面的控制按键,亦即包括CR,LF,Tab,Del..等等
[:digit:] 代表数字,亦即0-9
[:graph:] 除了空格符(空格键与Tab按键)外的其他所有按键
[:lower:] 代表小写字符,亦即a-z
[:print:] 代表任何可被打印出来的字符
[:punct:] 代表标点符号,亦即: “ ‘ ? ! ; : # $…
[:upper:] 代表大写字符,亦即A-Z
[:space:] 任何会产生空白的字符,包括空格键,Tab,CR等等
[:xdigit:] 代表16进位的数字类型,因此包括:0-9,A-F,a-f的数字与符号
  • 基础正规表示法字符汇整:
RE字符 意义与范例
^world 意义:待搜寻的字符串(world)在行首
范例:待搜寻行首为#开始的那一行,并列出行号</br>
grep -n ‘^#’ re.txt</br>
world$ 意义:待搜寻的字符串(word)在行尾
范例:将行尾为!的那行打印出来,并列出行号</br>
grep -n ‘!$’ re.txt </br>
. 意义:代表一定有一个任意字节的字符!
范例:搜寻的字串可以是 (eve) (eae) (eee) (e e), 但不能仅有 (ee) !亦即 e 与 e 中间一定仅有一个字节,而空白字节也是字节</br>
grep -n ‘e.e’ re.txt</br>
\ 意义:跳脱字符,将特殊符号的特殊意义去除
范例:搜寻含有单引号 ‘ 的那一行</br>
grep -n ' re.txt</br>
* 意义:重复零个到无穷多个的前一个 RE 字符
范例:找出含有 (es) (ess) (esss) 等等的字串,注意,因为 * 可以是 0 个,所以 es 也是符合带搜寻字串。另外,因为 * 为重复前一个 RE 字符的符号, 因此,在 * 之前必须要紧接著一个 RE 字符喔!例如任意字节则为 .* </br>
grep -n ‘ess*’ re.txt</br>
[list] 意义:字节集合的 RE 字符,里面列出想要撷取的字节
范例:搜寻含有 (gl) 或 (gd) 的那一行,需要特别留意的是,在 [] 当中谨代表一个待搜寻的字节, 例如 a[afl]y 代表搜寻的字串可以是 aay, afy, aly 即 [afl] 代表 a 或 f 或 l 的意思</br>
grep -n ‘g[ld]’ re.txt</br>
[n1-n2] 意义:字节集合的 RE 字符,里面列出想要撷取的字节范围
范例:搜寻含有任意数字的那一行!需特别留意,在字节集合 [] 中的减号 - 是有特殊意义的,他代表两个字节之间的所有连续字节!但这个连续与否与 ASCII 编码有关,因此,你的编码需要配置正确(在 bash 当中,需要确定 LANG 与 LANGUAGE 的变量是否正确!) 例如所有大写字节则为 [A-Z]</br>
grep -n ‘[A-Z]’ re.txt</br>
[^list] 意义:字节集合的 RE 字符,里面列出不要的字串或范围
范例:搜寻的字串可以是 (oog) (ood) 但不能是 (oot) ,那个 ^ 在 [] 内时,代表的意义是『反向选择』的意思。 例如,我不要大写字节,则为 [^A-Z]。但是,需要特别注意的是,如果以 grep -n [^A-Z] re.txt 来搜寻,却发现该文件内的所有行都被列出,为什么?因为这个 [^A-Z] 是非大写字节的意思, 因为每一行均有非大写字节,例如第一行的 “Open Source” 就有 p,e,n,o…. 等等的小写字</br>
grep -n ‘oo[^t]’ re.txt</br>
\{n,m\} 意义:连续 n 到 m 个的前一个 RE 字符
意义:若为 {n} 则是连续 n 个的前一个 RE 字符</br>
意义:若是 {n,} 则是连续 n 个以上的前一个 RE 字符</br>
范例:在 g 与 g 之间有 2 个到 3 个的 o 存在的字串,亦即 (goog)(gooog)</br>
grep -n ‘go{2,3}g’ re.txt</br>