Bash中使用正則表達式進行文本處理指南

更新時間：2026年01月06日 10:58:29 作者：gis分享者

正則表達式是文本處理的瑞士軍刀,它們以緊湊的模式匹配功能廣泛應用于網絡安全領域,這篇文章主要介紹了Bash中使用正則表達式進行文本處理的相關資料,文中通過代碼介紹的非常詳細,需要的朋友可以參考下

前言

在 Bash 腳本中，可以使用正則表達式來進行文本處理，最常用的工具是 grep、sed 和 awk。

1.1 示例

舉個簡單的例子，假設你有一個文本文件 example.txt，你想查找包含特定模式的行。

你可以使用 grep：

grep 'pattern' example.txt

如果你想對文本進行替換，可以用 sed：

sed 's/old_pattern/new_pattern/g' example.txt

對于更復雜的文本處理，例如統(tǒng)計、格式化，你可以用 awk：

awk '/pattern/ {print $0}' example.txt

1.2 知識擴展

1）grep：

grep 是最基礎的文本搜索工具，它支持基本和擴展的正則表達式。

例子：

查找包含數字的行： grep ‘[0-9]’ example.txt
忽略大小寫查找：grep -i ‘pattern’ example.txt
查找并顯示行號：grep -n ‘pattern’ example.txt
遞歸查找：grep -r ‘pattern’ /path/to/directory

2）sed：

sed 是一個流編輯器，用于對文本進行篩選和替換。

例子：

替換文件中第一次出現的匹配：sed ‘s/pattern/replacement/’ example.txt
替換整個文件中的所有匹配：sed ‘s/pattern/replacement/g’ example.txt
刪除包含特定模式的行：sed ‘/pattern/d’ example.txt
在特定模式后添加文本：sed ‘/pattern/a\new text’ example.txt

3）awk：

awk 是一個強大的文本處理工具，適用于格式化報告和統(tǒng)計分析。

例子：

查找并打印匹配的行：awk ‘/pattern/ {print $0}’ example.txt
分隔特定字段并打?。篴wk -F: ‘{print $1}’ example.txt（假設文件以冒號分隔）
統(tǒng)計出現次數：awk ‘/pattern/ {count++} END {print count}’ example.txt

進階內容

1）復雜模式匹配

使用擴展正則表達式：通過添加 -E 參數，你可以讓 grep 使用擴展正則：grep -E ‘pattern1|pattern2’ example.txt。
同理，你也可以在 sed 中使用擴展正則：sed -E ‘s/old_pattern(new_pattern)/replacement/g’ example.txt

2）結合工具使用

你可以將這幾個工具組合使用，以實現更復雜的文本處理任務。例如，先用 grep 篩選，再用 awk 處理：

grep 'pattern' example.txt | awk '{print $1}'

1.3 實踐指南

一、核心處理方式

原生Bash正則匹配

if [[ "string" =~ ^regex_pattern$ ]]; then
    echo "匹配成功"
    echo "捕獲組：${BASH_REMATCH[1]}"
fi

高級參數擴展

var="2024-07-25_log.txt"
echo ${var//[^0-9]/}       # 刪除非數字字符 → 20240725
echo ${var/#*_/}           # 去除前綴保留文件名 → log.txt

二、常用工具鏈

工具	能力范圍	典型用例
grep	模式搜索過濾	`grep -E 'error
sed	流式編輯替換	sed -E ‘s/(\d{4})-(\d{2})/\2/\1/g’
awk	結構化字段處理	awk ‘/GET/ && $9==200 {print $7}’ log
perl	PCRE高級正則	perl -pe ‘s/\b\d+\b/NUM/g’

三、正則表達式類型

# 基礎正則（BRE）
grep '^From: .*@ctc.com$' emails.txt

# 擴展正則（ERE）
grep -E '[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z]{2,4}' contacts.txt

# Perl兼容正則（PCRE）
grep -P '\d{4}-\d{2}-\d{2}T\d{2}:\d{2}Z' timestamps.log

四、實戰(zhàn)案例

日志分析

# 提取HTTP狀態(tài)碼非200的請求
tail -f access.log | awk 'match($0, /HTTP\/1\.1" ([0-9]{3})/, arr) && arr[1] != 200'

數據清洗

# 標準化電話號碼格式
sed -E 's/(\+86)?[ ]*([0-9]{3})-?([0-9]{4})-?([0-9]{4})/\1 \2-\3-\4/' contacts.csv

安全檢測

# 檢測SQL注入特征
grep -P '(union\s+select|sleep\(\d+\)|benchmark\(|\b(and|or)\b.+=[^'"'"']*["'"'"]\s*["'"'"])' web_logs

五、性能優(yōu)化建議

優(yōu)先使用原生Bash操作避免子進程開銷
復雜匹配使用預編譯正則（如awk/perl）
大文件處理時結合LC_ALL=C提升ASCII處理速度
避免貪婪匹配.*改用精準限定符

六、調試技巧

# 可視化匹配過程
grep --color=auto -nE 'pattern' file

# 測試正則表達式
pcre2test  # 專用測試工具

總結

到此這篇關于Bash中使用正則表達式進行文本處理的文章就介紹到這了,更多相關Bash正則表達式文本處理內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

shell中數組的定義及操作
本文主要介紹了shell中數組的定義及操作，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2023-05-05
CentOS中使用Shell腳本實現每天自動備份網站文件和數據庫并上傳到FTP中
這篇文章主要介紹了CentOS中使用Shell腳本實現每天自動備份網站文件和數據庫并上傳到FTP中,本文腳本比較實用,其它Linux系統(tǒng)也可參考,需要的朋友可以參考下
2014-12-12
詳解Linux常用的四種壓縮命令
這篇文章主要詳細介紹了Linux常用的四種壓縮命令,tar命令,gzip命令,rar命令和zip命令,并通過代碼示例給大家講解的非常詳細,具有一定的參考價值,需要的朋友可以參考下
2024-03-03
Linux bash刪除文件中含“指定內容”的行功能示例
這篇文章主要介紹了Linux bash刪除文件中含“指定內容”的行功能,結合具體實例形式分析了Linux bash刪除文件指定內容的實現原理與相關操作技巧,需要的朋友可以參考下
2017-06-06
Shell腳本批量添加擴展名的兩種方法分享
這篇文章主要介紹了Shell腳本批量添加擴展名的兩種方法分享,本文講解了用rename命令修改后綴名、用for、sed和mv修改后綴名、用find和xargs添加后綴名等方法,需要的朋友可以參考下
2014-11-11
如何查看Linux提供的Shell解析器
這篇文章主要介紹了查看Linux提供的Shell解析器的相關知識，本文通過實例代碼給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
2023-06-06
Shell常用服務器日志分析命令總結
有時我們需要分析分析自己網站服務器日志,看看網站的訪問量?？纯从袥]有黑闊搞破壞！于是收集，整理一些服務器日志分析命令，大家可以試試
2022-06-06
通過實例深入理解linux shell數組
本文為大家介紹linxu shell中數組的相關知識，并舉了很多例子供參考，包括數組的復制，計算，刪除，替換等，是學習shell 數組的不可多得的好文章
2013-02-02
詳解shell腳本中的case條件語句介紹和使用案例
這篇文章主要介紹了詳解shell腳本中的case條件語句介紹和使用案例，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2020-04-04
shell腳本批量執(zhí)行指定路徑下sql腳本的實現
本文主要介紹了shell腳本批量執(zhí)行指定路徑下sql腳本的實現，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2023-02-02