淺談正則速記法的技巧

 更新時間:2019-04-17 21:42:55   作者:佚名   我要評論(0)

給你一篇文章,如何挑選出你想要的字符串呢?你可以從左到右從上到下,一個一個字符讀取出來,寫一大堆if做判斷。這樣太麻煩了,正則就是將以上過程抽象出來,

給你一篇文章,如何挑選出你想要的字符串呢?你可以從左到右從上到下,一個一個字符讀取出來,寫一大堆if做判斷。這樣太麻煩了,正則就是將以上過程抽象出來,用一些特定符號就能表示出大部分規則

對大部分人來說,正則主要是難記,其實只要對正則符號分類記憶,就會發現核心概念其實特別簡單

注:本文會假設你至少看過一遍正則的文檔,如果沒看過,可以看mdn(有中文翻譯),如果覺得mdn排版亂,推薦去https://devdocs.io/javascript/global_objects/regexp學習。本文所使用語言為javascript

元字符

/a/中的a就是一個元字符,一個元字符匹配一個實體字符,這里的“a”沒有特殊含義,就匹配一個英文a

/\d/就匹配0到9的所有數字,如果兩個連寫/\d\d/就可以匹配10到99的所有數字

/./可以匹配任何字符

集合

假如有一串字符串'0123456789',我只想匹配其中的'3','6','9',這時可以放在集合中/[369]/

執行后會發現只有3被匹配到,是因為集合中不管寫多少東西都代表一個元字符,集合也是一種元字符
你可能見過這樣都集合/[0-9a-zA-Z_]/它代表匹配所有數字,字母和下劃線,它與元字符/\w/的效果是一樣的,集合更靈活\w更方便

排除型集合

/[^0-9]/除了數字都匹配(我喜歡叫它否定集合)

或(多選)

假設我有一大堆書單,我希望從中匹配出naroto和one piece,那么可以這樣寫/naroto|one pice/ 豎線代表或,a或b,你也可以寫多個a|b|c|d,你當然可以寫出0|1|2...|9來匹配所有數字。但要注意和集合的區別,集合是一個元字符,不能匹配單詞,|兩邊可以是多個元字符

分組

我現在有一堆文件,我希望匹配出后綴是.css和.less的文件,你可以很自然的寫出/.css|.less/這樣的代碼。其實還有一個簡便寫法/.(c|le)ss/,分組可以將若干個元字符放在同一個作用域中做處理,通過分組我們可以寫出更簡練的代碼

分組還有一個特殊的用法,思考如何匹配'asd_asd_asd_asd_asd'這種字符串?

答案是/(asd)(_\1)+/,\1是個非常特殊的元字符,代表重復使用第一個分組的匹配結果,\2就代表第二個,以此類推,+加號表示重復一到多次(這個后面會講),需要注意的是計數從1開始,\0代表另外的意思(請看文檔)

量詞

一長串字符中我只想匹配連續的數字,但/\d/只會匹配一個,這時候可以使用量詞/\d{n,}/,n寫幾就是幾到多,比如{1,}就是1到多。{n}這種寫法表示n個相連,匹配2333可以寫成/23{3}/

還有幾個簡寫的量詞

  • +代表1到多,等于{1,}
  • *代表0到多,等于{0,}
  • ?代表0或1個,等于{0,1}

貪婪模式和非貪婪模式

量詞有個尷尬的地方,比如用/.*a/去匹配 '123a123a',本來希望得到'123a',實際卻得到'123a123a'。這是因為任何字符都滿足/./加上量詞會導致從頭匹配到尾,但因為我們還有其他元字符,所以這時正則引擎會回溯,將已經匹配的結果從后往前一個個拿出來,與剩下的元字符相匹配。
這種模式叫貪婪模式,它可能會產生預期之外的結果和不必要的性能浪費

解決方案是使用非貪婪模式,在量詞后面加?問號可以得到最小結果,現在使用/.*?a/去匹配就可以得到'123a'了。任何量詞后都可以使用非貪婪模式

環視

x(?=y)這個功能有很多種翻譯,比如零寬斷言,我個人感覺比較準確的是“正向肯定環視”
x(?!y)正向否定環視

x代表元字符,y也代表元字符,x(?=y)的意思是緊接著y的x,比如 '-1a--2b-',使用/\d(?=a)/去匹配,會得到1;/\d(?!a)/去匹配,會得到2。

這功能怎么用?舉個例子,有一段字符串'a(123)b',我只想要括號內的內容,但不想要括號
我需要匹配到右括號左邊的位置,那么我可以寫成/(?=\))/(注意括號需要轉義),我不想要左括號/[^(]/,我不關心括號內的內容/.*/,這時組合三個正則就變成了/[^(].*(?=\))/

實際上這個功能匹配的是位置,從匹配到的位置開始找元字符,所以你如果在環視后面加量詞是沒用的

其他

^$也是匹配位置的元字符,分別是匹配開頭和結尾,比如我們想匹配文件結尾是.js的文件可以寫成/.js$/。匹配http開頭的鏈接可以寫成/^http:\/\//

還有一些特殊的\u[\b]\0等,需要你自己看文檔

標識符

g:一個正則只會匹配一次,如果加上g標識符就會全局匹配, /\d/g,這個正則是不管兩個數字之間隔了什么,都會將所有數字匹配出來

i:不區分大小寫/^http:\/\//i就會匹配http://和HTTP://

核心概念就這么多,其他內容請詳細查看文檔

你以為這就結束了?其實還有后續噠!

我要繼續說環視

還有個神奇的逆向環視沒有講x(?<=y) ,因為這是18年才進正式標準的功能,雖然它可能比js年齡大,但js就是不支持你怕不怕!

前面那個/[^(].*(?=\))/可以改成/(?<=y).*(?=\))/

正則最大但坑就是,讓新手產生正則無所不能的想法,一個復雜字符串處理總以為可以通過一個神奇的正則來搞定。

正則不是萬能的!

還是之前的例子,給字符串'a(1\(2(3)'讓你取括號內的內容請問你怎么取?首先應該弄清需求,如果正則過于難寫,可以用js的字符串處理函數輔助正則,分部操作。另外正則的性能并不高,不是說很復雜的操作寫成一行正則性能就比其他方式快了,沒有測試就沒有發言權

正則理論上是有極限的,舉個例子,有字符串1xxxyyyy2讓你取{n}個x和{m}個y,n和m是不確定個數,寫成x{1,}y{1,}是沒問題的,但如果要求是x{n}y{n}就不行了,比如一個字符串有3個x,你就要取3個y,有4個x,你就要取4個y,單靠正則就無法完成了。

正則難,難在門檻高,門檻高在難記,之所以難記,其實還是因為反人類的符號讓你下意識的排斥它。熟悉正則,正式正則,學會正則,會給你帶來超乎想象的便利!

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。

您可能感興趣的文章:

  • 通俗解釋JavaScript正則表達式快速記憶

相關文章

  • 正則表達式匹配路由的實現代碼

    正則表達式匹配路由的實現代碼

    在 web 開發中,可能會出現限制用戶訪問規則的場景,那么這個時候就需要用到正則匹配,根據自己的規則去限定請求參數再進行訪問 具體實現步驟為: 導入轉換
    2019-04-17
  • PHP PDO數據庫操作預處理與注意事項

    PHP PDO數據庫操作預處理與注意事項

    PDO(PHP Database Object)擴展為PHP訪問數據庫定義了一個輕量級的、一致性的接口,它提供了一個數據訪問抽象層,這樣,無論使用什么數據庫,都可以通過一致
    2019-04-17
  • Laravel事件監聽器用法實例分析

    Laravel事件監聽器用法實例分析

    本文實例講述了Laravel事件監聽器用法。分享給大家供大家參考,具體如下: 這里講述最佳實踐方案,分以下步驟: 第一步:注冊事件和監聽器。 在EventServiceP
    2019-04-17
  • 淺談正則速記法的技巧

    淺談正則速記法的技巧

    給你一篇文章,如何挑選出你想要的字符串呢?你可以從左到右從上到下,一個一個字符讀取出來,寫一大堆if做判斷。這樣太麻煩了,正則就是將以上過程抽象出來,
    2019-04-17
  • PHP精確到毫秒秒殺倒計時實例詳解

    PHP精確到毫秒秒殺倒計時實例詳解

    精確到毫秒秒殺倒計時PHP源碼實例,前臺js活動展示倒計時,后臺計算倒計時時間。每0.1秒定時刷新活動倒計時時間。 PHP: // 注意:php的時間是以秒算。
    2019-04-17
  • Asp.net core中實現自動更新的Option的方法示例

    Asp.net core中實現自動更新的Option的方法示例

    Asp.net core可以監視json、xml等配置文件的變化, 自動刷新內存中的配置內容, 但如果想每隔1秒從zookeeper、consul獲取最新的配置信息, 需要自己實現. 閱讀了
    2019-04-17
  • JS 正則表達式從地址中提取省市縣

    JS 正則表達式從地址中提取省市縣

    直接上代碼,一看就懂, 一般國內地址返回Array前三項就是省市縣,若要擴展到社區、街道等可自行擴展。 var add1 = '四川省成都市都江堰市天馬鎮34號';
    2019-04-17
  • Laravel框架實現的使用smtp發送郵件功能示例

    Laravel框架實現的使用smtp發送郵件功能示例

    本文實例講述了Laravel框架實現的使用smtp發送郵件功能。分享給大家供大家參考,具體如下: 1、.env文件中配置 MAIL_DRIVER=smtp MAIL_HOST=smtp.郵箱后綴
    2019-04-17
  • 解決正則表達式\w和\d的疑惑

    解決正則表達式\w和\d的疑惑

    <&#63;php $string='April15,2003'; $pattern='/(\w+)(\d+),(\d+)/i'; $replacement='${1},${3}'; echo preg_replace($pattern,$replacement,$string); &#6
    2019-04-17
  • js正則表達式 匹配兩個特定字符間的內容示例

    js正則表達式 匹配兩個特定字符間的內容示例

    1、js截取兩個字符串之間的內容: var str = "aaabbbcccdddeeefff"; str = str.match(/aaa(\S*)fff/)[1]; alert(str);//結果bbbcccdddeee 2、js截取某個
    2019-04-17

最新評論

黑龙江新11选5开奖结果