linux 正則表達式grep實例分析

 更新時間:2020-05-11 14:32:34   作者:佚名   我要評論(0)

在很多技術領域(如:自然語言處理,數據存儲等),正則表達式可以很方便的提取我們想要的信息,所以正則表達式是一個很重要的知識點!
一、概念
正則表達式(Regul

在很多技術領域(如:自然語言處理,數據存儲等),正則表達式可以很方便的提取我們想要的信息,所以正則表達式是一個很重要的知識點!

一、概念

正則表達式(Regular Expression)是用于描述一組字符串特征的模式,用來匹配特定的字符串。通過特殊字符+普通字符來進行模式描述,從而達到文本匹配目的工具。

正則表達式目前被集成到了各種文本編輯器/文本處理工具當中

二、應用場景

(1)驗證:表單提交時,進行用戶名密碼的驗證。

(2)查找:從大量信息中快速提取指定內容,在一批url中,查找指定url。

(3)替換:將指定格式的文本進行正則匹配查找,找到之后進行特定替換。

三、基本要素

(1)字符類

(2)數量限定符

(3)位置限定符

(4)特殊符號

注意:正則表達式基本是與語言無關的,我們可以結合語言/工具與正則表達式進行文本處理,在后面的博客中,我將使用grep來進行驗證。(grep是一款Linux下按行匹配文本的工具,如下,使我們常使用的兩個選項)

-E:使用擴展正則匹配

--color:將匹配得到的內容進行語法高亮

1.字符類


舉例如下:

例1:


注意:1.grep采用的貪心匹配,它會匹配當前行中的所有匹配內容

2.echo $?表示是否匹配成功(如果成功返回值為0,不成功返回值為1)

例2:


例3:


例4:


例5:


2.數量限定符


舉例如下:

例1:


例2:


由此,我們可以看出,“前面的單元”默認是指?或+前面的字符

例3:


例4:


例5:


例6:


注意:該結果為匹配失敗,在相關文檔中并未出現,應該啊是錯誤或者廢棄的用法

例7:


3.位置限定符


舉例如下:

例1:


例2:


例3:


例4:


例5:


例6:


4.特殊符號


舉例如下:


假如我們去掉-E選項,會有什么現象呢?


此時,不難發現,去掉-E選項之后沒有進行正常的正則匹配,這種現象需要我們引入如下的兩個概念!

5.基本正則表達式&擴展正則表達式

區別:正則表達式的擴展正則(Extended規范)和基本正則(Basic規范)下,有些字符應該解釋為普通字符,要表示上述特殊含義則需要加“\”轉義字符。反之,在擴展規范下,應被理解為特殊含義,要取其字面值,也要對其進行“\”轉義。

因此,grep工具帶上-E選項,表示使用擴展正則來進行匹配,若沒有該選項,則表示使用基準正則來進行匹配。

對于上述的問題,我們舉例如下:

例1:


例2:當目標字符串當中本身就包含了字符,要想進行正則匹配,應該這樣做:


例3:


5.其他普通字符集及其替換


舉個例子:


綜上,正則表達式有以下三個分類:

(1)基本正則表達式:Basic即BPEs

(2)擴展正則表達式:Extended即EREs

(3)Perl的正則表達式:PREs

因此,當grep指令不跟任何參數時,表示要使用BREs,后面跟“-E”表示使用EREs,后面跟“-P”參數,表示使用PREs

四、貪婪模式與非貪婪模式

1.貪婪模式:正則表達式匹配時,會盡量多的匹配符合條件的內容

舉例如下:


注意:grep默認采用貪婪匹配,可能會對我們的測試結果造成干擾,大家可以上網使用“正則在線轉換工具”進行測試

2.非貪婪模式:正則表達式匹配時,會盡量少的匹配符合條件的內容,也就是說,一旦發現匹配符合要求,立馬就匹配成功,而不會繼續匹配下去(除非有g,開啟下一組匹配)

舉例如下:


五、零寬斷言

1.所謂斷言,是用來聲明一個應該為真的事實。在正則表達式中,只有當斷言為真時才會繼續進行匹配。

2.零寬斷言:像用于查找某些內容之前或者之后的東西,其中一些特殊字符如“\b、^、$”等用于指定一個位置,這個位置應滿足一定的條件。

3.分類:

(1)零寬度正預測先行斷言(?=exp)

它斷言自身出現的位置之后能匹配的表達式exp。如:\b\w+(?=ing\b),表示匹配以ing結尾的單詞的前面的部分(除ing以外的部分)。當我們要查找“I'm singing while you're dancing.”時,它會匹配sing和danc

舉例如下:


(2)零寬度正回顧后發斷言(?>=exp)

它斷言自身出現的位置的前面能匹配的表達式exp。如:(?<=\bre)\w+\b會匹配以re開頭的單詞的后半部分(除er以外的部分),例如:在查找“reading a book”時,它匹配ading

舉例如下:


六、簡單練習

1.手機號碼


2.非零的正整數


3.非零開頭的最多帶兩位小數的數字


4.由數字和26位字母組成的字符串


5.QQ號,從10000開始


6.IP地址

\d+\.\d+\.\d+\.\d+

7.判斷賬號是否合法

^[a-zA-Z0-9][a-zA-Z0-9_]{4,15}$

8.日期格式

^\d{4}-\d{1,2}-\d{1,2}

正則表達式的學習就到這里結束啦,如果有小伙伴沒有看明白的,可以上網查詢正則的更多知識點!

您可能感興趣的文章:

  • linux grep與正則表達式使用介紹
  • linux系統用戶管理與grep正則表達式示例教程
  • 淺談Linux grep與正則表達式
  • linux grep正則表達式與grep用法詳解
  • linux下關于正則表達式grep的一點總結

相關文章

  • linux 正則表達式grep實例分析

    linux 正則表達式grep實例分析

    在很多技術領域(如:自然語言處理,數據存儲等),正則表達式可以很方便的提取我們想要的信息,所以正則表達式是一個很重要的知識點! 一、概念 正則表達式(Regul
    2020-05-11
  • 正則表達式匹配閉合HTML標簽(支持嵌套)

    正則表達式匹配閉合HTML標簽(支持嵌套)

    任何復雜的正則表達式都是由簡單的子表達式組成的,要想寫出復雜的正則來,一方面需要有化繁為簡的功底,另外一方面,我們需要從正則引擎的角度去思考問題。關于正則
    2020-05-11
  • python 正則表達式語法學習筆記

    python 正則表達式語法學習筆記

    正則表達式(regular expression)描述了一種字符串匹配的模式(pattern),可以用來檢查一個串是否含有某種子串、將匹配的子串替換或者從某個串中取出符合某個條件的
    2020-05-11
  • linux下關于正則表達式grep的一點總結

    linux下關于正則表達式grep的一點總結

    正則表達式(Regular Expression)是用于描述一組字符串特征的模式,用來匹配特定的字符串。通過特殊字符+普通字符來進行模式描述,從而達到文本匹配目的工具。類似
    2020-05-11
  • 學會Python正則表達式,就看這20個例子(腳本之家修正版)

    學會Python正則表達式,就看這20個例子(腳本之家修正版)

    正則表達式是處理字符串的強大工具。作為一個概念而言,正則表達式對于Python來說并不是獨有的。但是,Python中的正則表達式在實際使用過程中還是有一些細小的差別。
    2020-05-11
  • 正則表達式[\s\S]*與[\w\W]* 什么意思

    正則表達式[\s\S]*與[\w\W]* 什么意思

    問: 例如:[a-z]表示從a到z之間的任意一個。 不是這樣的嗎?誰能給我解釋一下[ ]的所有用法?感謝 答: 是完全通配的意思,\s是指空白,包括空格、換行、tab縮進
    2020-05-11
  • layui 正則表達式驗證使用實例詳解

    layui 正則表達式驗證使用實例詳解

    前言 layui的正則表達式是在form表單中完成的。所以第一步要在你的html中加上指定的form 。 官方參考文檔:https://www.layui.com/doc/element/form.html 要保證引用
    2020-05-11
  • JAVA 正則表達式陳廣佳版本(超詳細)

    JAVA 正則表達式陳廣佳版本(超詳細)

    在Sun的Java JDK 1.40版本中,Java自帶了支持正則表達式的包,本文就拋磚引玉地介紹了如何使用java.util.regex包。   可粗略估計一下,除了偶爾用Linux的外,其他
    2020-05-11
  • 專門為初學者編寫的正則表達式入門教程

    專門為初學者編寫的正則表達式入門教程

    這是一篇翻譯文章。我學過很多次正則表達式,總是學了忘,忘了學,一到用的時候還是只能靠搜索引擎。 這回看到這個正則教程,感覺非常驚喜。嘗試翻譯了一遍,譯得不
    2020-05-11
  • JavaScript正則表達式迷你書之貪婪模式-學習筆記

    JavaScript正則表達式迷你書之貪婪模式-學習筆記

    貪婪模式: 在使用修飾匹配次數的特殊符號時,有幾種表示方法可以使同一個表達式能夠匹配不同的次數,比如:"{m,n}", "{m,}", "&#63;", "*", "+",具體匹配的次數隨
    2020-05-11

最新評論

买宝宝用品赚钱吗 江西11选五中奖规则 3d好运彩 重庆快乐10分软件 陕西11选5选号技巧 上海时时乐彩票app 河南481遗漏查询 浙江体彩20选5坐标 平民计划腾讯分分彩 中国最大的投资理财平台 快3甘肃 北京快彩开奖 山东11选5一定牛分布图 福彩快乐10分技巧 股票配资平台招商整套流程 排三跨度走势图带连线 手机版澳洲幸运8