linux學習日記九 正則表達式介紹
正則表達式就是處理字符串的方法,它以行為單位來進行字符串的處理行為,正則表達式通過一些特殊符號的輔助,可以讓用戶輕易達到查找、刪除、替換某特定字符串的處理程序。
正則表達式基本上就是一種“表示法”,只要工具程序支持這種表示法,那么該工具程序就可以利用正則表達式處理字符串。例如vi,grep,awk,sed等。
正則表達式和之前的bash通配符是兩個完全不同的東西,兩者毫無關系,這個要注意下。
# grep [-A] [-B] [--color=auto] ‘string’ filename
-A:后面加數(shù)字,為after的意思,除了列出該行,后續(xù)的n行也列出
-B:before的意思,不解釋
# dmesg | grep -n -A3 -B2 –color=auto ‘eth’ <== 內(nèi)核信息
====幾個基本的正則式特殊符號====
| 特殊符號 | 代表意義 |
| [:alnum:] | 代表英文大小寫字符以及數(shù)字,亦即 0-9, A-Z, a-z |
| [:alpha:] | 代表任何英文大小寫字符,亦即 A-Z, a-z |
| [:blank:] | 代表空白鍵與 [Tab] 按鍵兩者 |
| [:cntrl:] | 代表鍵盤上面的控制按鍵,亦即包括 CR, LF, Tab, Del.. 等等 |
| [:digit:] | 代表數(shù)字而已,亦即 0-9 |
| [:graph:] | 除了空白字元 (空白鍵與 [Tab] 按鍵) 外的其他所有按鍵 |
| [:lower:] | 代表小寫字元,亦即 a-z |
| [:print:] | 代表任何可以被列印出來的字元 |
| [:punct:] | 代表標點符號 (punctuation symbol),亦即:” ‘ ? ! ; : # $… |
| [:upper:] | 代表大寫字元,亦即 A-Z |
| [:space:] | 任何會產(chǎn)生空白的字元,包括空白鍵, [Tab], CR 等等 |
| [:xdigit:] | 代表 16 進制的數(shù)字類型,因此包括: 0-9, A-F, a-f 的數(shù)字與字符 |
====基礎正則式====
| RE 字符 | 意義與范例 |
| ^word | 意義:待搜尋的字串(word)在行首! 范例:搜尋行首為 # 開始的那一行,并列出行號
|
| word$ | 意義:待搜尋的字串(word)在行尾! 范例:將行尾為 ! 的那一行列印出來,并列出行號
|
| . | 意義:代表『一定有一個任意字元』的字符! 范例:搜尋的字串可以是 (eve) (eae) (eee) (e e), 但不能僅有 (ee) !亦即 e 與 e 中間『一定』僅有一個字元,而空白字元也是字元!
|
| \ | 意義:跳脫字符,將特殊字符的特殊意義去除! 范例:搜尋含有單引號 ‘ 的那一行!
|
| * | 意義:重復零個到無窮個的前一個字符 范例:找出含有 (es) (ess) (esss) 等等的字串,注意,因為 * 可以是 0 個,所以 es 也是符合的。另外,因為 * 為重復『前一個字符』的符號, 因此,在 * 之前必須要緊接著一個字符喔!例如任意字元則為 『.*』 !
|
| [list] | 意義:字元集合的 RE 字符,裡面列出想要擷取的字元! 范例:搜尋含有 (gl) 或 (gd) 的那一行,需要特別留意的是,在 [] 當中『謹代表一個待搜尋的字元』, 例如『 a[afl]y 』代表搜尋的字串可以是 aay, afy, aly 即 [afl] 代表 a 或 f 或 l 的意思!
|
| [n1-n2] | 意義:字元集合里,列出想要擷取的字元范圍! 范例:搜尋含有任意數(shù)字的那一行!需特別留意,在字元集合 [] 中的減號 – 是有特殊意義的,他代表兩個字元之間的所有連續(xù)字元!但這個連續(xù)與否與 ASCII 編碼有關,因此,你的編碼需要設定正確(在 bash當中,需要確定 LANG與LANGUAGE 的變量是否正確!) 例如所有大寫字元則為 [A-Z]
|
| [^list] | 意義:字元集合的 RE 字符,里面列出不要的字串或范圍! 范例:搜尋的字串可以是 (oog) (ood) 但不能是 (oot) ,那個 ^ 在 [] 內(nèi)時,代表的意義是『反向選擇』的意思。 例如,我不要大寫字元,則為 [^A-Z]。但是,需要特別注意的是,如果以 grep -n [^A-Z] regular_express.txt 來搜尋,卻發(fā)現(xiàn)該文件內(nèi)的所有行都被列出,為什么?因為這個 [^A-Z] 是『非大寫字元』的意思, 因為每一行均有非大寫字元,例如第一行的 “Open Source” 就有 p,e,n,o…. 等等的小寫字
|
| \{n,m\} | 意義:連續(xù) n 到 m 個的『前一個 RE 字符』 意義:若為 \{n\} 則是連續(xù) n 個的前一個 RE 字符, 意義:若是 \{n,\} 則是連續(xù) n 個以上的前一個 RE 字符! 范例:在 g 與 g 之間有 2 個到 3 個的 o 存在的字串,亦即 (goog)(gooog)
|
====分析工具sed====
sed本身是一個管道命令,可以分析stdin數(shù)據(jù)
# sed [-nefr] [動作]
-n:使用安靜模式(silent),在一般模式下,所有來自stdin數(shù)據(jù)都顯示出來,而-n后只顯示被sed特殊處理的那一行
-e:直接在命令行模式上進行sed的動作編輯
-f:直接將sed動作寫在一個文件內(nèi),-f filename 則可以執(zhí)行filename內(nèi)的sed動作
-r:sed的動作支持的是擴展型正則式語法(默認是基礎型)
-i:直接修改讀取的文件內(nèi)容,而不是由屏幕輸出
動作說明:[n1[,n2]] function
n1,n2:不見得存在,一般代表選擇進行動作的行數(shù),比如在10到20行間進行,則”10,20 [動作行為]‘
function的參數(shù):
a:新增,a的后面可以接字符串,而這些字符串會在新的一行出現(xiàn)(目前的下一行)
c:替換,c的后面接字符串,這些字符串可以替換n1,n2之間的行
d:刪除,后面不接任何參數(shù)
i:插入,i后面可接字符串,這些字符串會在新的一行出現(xiàn)(目前的上一行)
p:打印,也就是將某個選擇的數(shù)據(jù)打印出來。通常p會與參數(shù)sed -n 一起運行
s:替換,就是直接進行替換工作,通常這個s的動作可以搭配正則式例如:1,29s/old/new/g就是
注:sed后面接的動作,需要用兩個單引號”括住。
# nl /etc/passwd | sed ’2,5d’
# nl /etc/passwd | sed ’3,$d’
整行替換:
# nl /etc/passwd | sed ’2,5c No 2-5 number’
# nl /etc/passwd | sed -n ’5,7p’ 這個等價于 : head -n 7 | tail -n 5
sed的查找并替換,跟vim的很類似:
# sed ‘s/要被替換的字符串/新的字符串/g’
# nl /etc/passwd | sed ‘/^$/d’ <==刪除空白行
====擴展正則式====
====好用的數(shù)據(jù)處理工具awk====
相比于sed常常作用于一整行的處理,awk則運用于將一行分成數(shù)個字段來處理,適用于處理小型數(shù)據(jù)
# awk ‘條件類型1 {動作1} 條件類型2 {動作2} …’ filename
# awk -n 5 | awk ‘{print $t “\t” $3}’
awk處理流程:
1,讀入第一行,并將第一行的數(shù)據(jù)填入$0,$1,$2等變量中
2,依據(jù)條件類型限制,判斷是否需要進行后面的動作
3,做完所有的動作與條件類型
4,若還有后續(xù)的行的數(shù)據(jù),則重復上面的1~3的步驟,直到所有的數(shù)據(jù)都讀完為止
awk的內(nèi)置變量為:
* NF :每一行($0)擁有的字段總數(shù)
* NR :目前awk所處理的是第幾行數(shù)據(jù)
* FS :目前的分隔符,默認是空格鍵
# last -n 5 | awk ‘{print $1 “\t lines: ” NR “\t columns: ” NF}’
# cat /etc/passwd | awk ‘BEGIN {FS=”:”} $3 < 10 {print $1 “\t ” $3}’
====文件的比較命令diff====
# diff [-bBi] original_file new_file
-b:忽略一行中僅有多個空白的區(qū)別
-B:忽略空白行的區(qū)別
-i:忽略大小寫的不同
====補丁命令patch====
先用diff命令生成補丁文件:
# diff -Naur passwd.old passwd.new > paswd.patch
# patch -pN < patch_file <==更新
# patch -R -pN < patch_file <== 還原
-p:后面的N表示取消基層目錄的意思
-R:代表還原,將新的文件還原成原本的舊的版本
再開始把舊文件升級到新版本:
# patch -p0 < passwd.patch
把新版本還原:
# patch -R -p0 < passwd.patch
打印命令pr….
============END===============
相關文章

Fedora Linux 42 穩(wěn)定版發(fā)布: 帶來大量新功能和軟件更新
Fedora 42昨日發(fā)布,這是 Red Hat 贊助開發(fā)的杰出前沿 Linux 發(fā)行版的最新版,包含大量新功能和軟件更新,使其成為 2025 年上半年發(fā)布的一款出色的 Linux 操作系統(tǒng)之一,內(nèi)2025-04-16
如何在Linux查看硬盤信息? 查看Linux硬盤大小類型和硬件信息的5種方法
使用Linux系統(tǒng)的過程中,查看和了解硬盤信息是非常重要的工作,尤其是對于系統(tǒng)管理員而言,那么在Linux系統(tǒng)中如何查看硬盤信息?以下是具體內(nèi)容介紹2025-03-12
如何在 Linux 中查看 CPU 詳細信息? 3招輕松查看CPU型號、核心數(shù)和溫度
在日常運維工作中,獲取 CPU 信息是系統(tǒng)運維管理員常見的工作內(nèi)容,無論是為了性能調(diào)優(yōu)、硬件升級還是僅僅滿足好奇心2025-03-11
什么是 Arch Linux? 獨樹一幟的Arch Linux發(fā)行版分析
Arch Linux是為簡化,優(yōu)化,現(xiàn)代化,實用主義,用戶中心和多功能性而創(chuàng)建Linux發(fā)行版,究竟是什么讓 Arch 與眾不同?下面我們就來簡要解讀2025-02-19
如何在Linux環(huán)境下制作 Win11裝機U盤?
一直用的linux辦公,想要將筆記本電腦從 Linux 系統(tǒng)切換回 Windows 11,我們可以制作一個win11裝機u盤,詳細如下2025-02-17
Rsnapshot怎么用? 基于Rsync的強大Linux備份工具使用指南
Rsnapshot 不僅可以備份本地文件,還能通過 SSH 備份遠程文件,接下來詳細介紹如何安裝、配置和使用 Rsnapshot,包括創(chuàng)建每小時、每天、每周和每月的本地備份,以及如何進2025-02-06
Linux Kernel 6.13發(fā)布:附更新內(nèi)容及新特性解讀
Linux 內(nèi)核 6.13 正式發(fā)布,新版本引入了惰性搶占支持,簡化內(nèi)核搶占邏輯,通過減少與調(diào)度器相關的調(diào)用次數(shù),讓內(nèi)核在運行時表現(xiàn)更優(yōu),從而提高效率2025-01-23
五大特性引領創(chuàng)新! 深度操作系統(tǒng) deepin 25 Preview預覽版發(fā)布
今日,深度操作系統(tǒng)正式推出deepin 25 Preview版本,該版本集成了五大核心特性:磐石系統(tǒng)、全新DDE、Treeland窗口合成器、AI For OS以及Distrobox子系統(tǒng)2025-01-18
Linux Mint Xia 22.1重磅發(fā)布: 重要更新一覽
Beta 版 Linux Mint“Xia” 22.1 發(fā)布,新版本基于 Ubuntu 24.04,內(nèi)核版本為 Linux 6.8,這次更新帶來了諸多優(yōu)化和改進,進一步鞏固了 Mint 在 Linux 桌面操作系統(tǒng)領域的2025-01-16
LinuxMint怎么安裝? Linux Mint22下載安裝圖文教程
Linux Mint22發(fā)布以后,有很多新功能,很多朋友想要下載并安裝,該怎么操作呢?下面我們就來看看詳細安裝指南2025-01-16








