這篇文章內容不會很深入,但是盡量做" />

深入淺析正則表達式 捕獲組

 更新時間:2019-06-25 03:00:47   作者:佚名   我要評論(0)

捕獲組(capturing group)是正則表達式里比較常用,也是比較重要的概念,我個人覺得掌握這部分的知識是非常重要的。


這篇文章內容不會很深入,但是盡量做

捕獲組(capturing group)是正則表達式里比較常用,也是比較重要的概念,我個人覺得掌握這部分的知識是非常重要的。

這篇文章內容不會很深入,但是盡量做到簡單易懂又全面。接下來的內容主要是圍繞以下7個點:

1: () 捕獲組
2: (?:) non capturing group
3: (?=) positive lookahead
4: (?!) negative lookahead
5: (?<=) positive lookbehind
6: (?<!) negative lookbehind
7: (?=), (?!), (?<=), (?<!)的捕獲

1: () 捕獲組

/go+/

以上的正則表達式表示一個字母g后面跟上一個或者多個字母o,他能匹配go或者goooo。但是如果我們想+不只是運用到字母o上,而是運用到go這個整體上怎么辦呢?辦法就是給go加括號:

/(go)+/

為了全局匹配以及不考慮大小寫,我們接下來會給我們的正則加上ig,這兩個flag:

let reg = /(go)+/ig;
'go is g gogo'.match(reg); //["go", "gogo"]

在上面的例子里面(go)就形成了一個捕獲組(capturing group)。接下來看一個使用捕獲組的例子來加深對它的理解:

let reg = /(\d{2}).(\d{2}).(\d{4})/;
let originString = '10.25.2017';
reg.test(originString); //true
RegExp.$1; //10
RegExp.$2; //25
RegExp.$2; //2017

在上面這個例子里,我們有三組括號,形成了三個捕獲組,正則表達式(在javaScript里就是我們的RegExp)會緩存捕獲組所匹配的串,以$n表示,n就代表這第幾個捕獲組。

假如現在我們有一個需求:把顯示格式為 10.25.2017 的時間改為 2017-10-25 格式。

我們知道String的replace()方法經常和正則表達式一起使用。在replace()方法里,我們可以直接使用捕獲組的結果:

let reg = /(\d{2}).(\d{2}).(\d{4})/;
let originString = '10.25.2017';
let newString = originString.replace(reg, '$3-$1-$2');
console.log(newString);//"2017-10-25"

2: (?:) non capturing group 非捕獲型分組

有的時候我們可能只想匹配分組,但是并不想緩存(不想捕獲)匹配到的結果,就可以在我們的分組模式前面加上?:。例如上面的時間的例子,我們不想捕獲第一個分組的結果,就可以這么做:

let reg = /(?:\d{2}).(\d{2}).(\d{4})/;
let originString = '10.25.2017';
reg.test(originString); //true
RegExp.$1; //25
RegExp.$2; //2017
originString.match(reg);// ["10.25.2017", "25", "2017", index: 0, input: "10.25.2017", groups: undefined]

從上面的例子可以看出,我們的正則表達式依然是匹配的(test()的結果依然為true),但是RegExp.$1不是數字10,而是25,因為我們在第一個括號里加了?:,10就不會被捕獲。match()的執行結果也會受?:的影響:match()的結果里不再有‘10'。

3: (?=) positive lookahead 正向前瞻型捕獲

有一個句子:1 apple costs 10?. 我們想要匹配?前面的價格(這里是一個數字),但是注意不能匹配到句子開頭的數字1。這種情況,就可以用到正向前瞻型捕獲:

let reg = /\d+(?=?)/g;
let reg1 = /\d+/g;
let str = '1 apple costs 10?';
str.match(reg); //["10"]
str.match(reg1); //["1", "10"]

上面的例子里面reg1就只需要匹配數字,對于數字后面跟什么并沒有要求,所以它能匹配到1,10。但是reg使用了前瞻型匹配,就只能匹配到10。
或許你已經能從上面的對比里了解到什么是正向前瞻型捕獲了,意思是:

/x(?=y)/ 匹配x, 但是必須在x的【后面】【是】y的情況下

4: (?!) negative lookahead 負向前瞻型捕獲

上面我們了解了什么是正向前瞻型匹配,從字面意思也能猜出來負向前瞻型捕獲就是:

/x(?!y)/ 匹配x, 但是必須在x的【后面】【不是】y的情況下

例如下面的例子,我們要匹配數字1,而不要?前面的2,就可以用到?!:

let reg = /\d+(?!?)/g;
let str = '1 apple costs 2?';
str.match(reg); ['1']

5: (?<=) positive lookbehind 正向后顧型捕獲

后顧型和前瞻型正好相反,意思就是:

/(?<=y)x/ 匹配x, 但是只在【前面】【有】y的情況下

來看一個例子:

let str = "1 turkey costs $2";
console.log( str.match(/(?<=\$)\d+/g) ); //["2"]

這里的要求是前面有$的數字,所以這里匹配到了數字2,而沒有1.

6: (?<!) negative lookbehind 負向后顧型捕獲

負向就是與正向相反,那么負向后顧型捕獲就是:

/(?<=y)x/ 匹配x, 但是只在【前面】【沒有】y的情況下

來看一個例子:

let str = "1 turkey costs $2";
console.log( str.match(/(?<!\$)\d+/g) ); //['1']

7: (?=), (?!), (?<=), (?<!)的捕獲

默認情況下上面的前瞻后顧4種都是默認不匹配捕獲組里面的內容的,也就是不匹配括號里的條件的。例如我們的正向前瞻/d+(?=?)/g,只會匹配到數字,并不會匹配到?。如果我們想要也匹配到?怎么辦呢?答案就是給?也包上一個括號:

let str = "1 turkey costs 2?";
let reg = /\d+(?=(?))/; 
str.match(reg); //["2", "?", index: 15, input: "1 turkey costs 2?", groups: undefined]

這樣就匹配到了數字2和它后面的?。

下面再來看看后顧型:

let str = "1 turkey costs $2";
let reg = /(?<=(\$|£))\d+/;
console.log( str.match(reg) ); //["2", "$", index: 16, input: "1 turkey costs $2", groups: undefined]

需要特別注意到的一點是,對于后顧型,雖然條件在匹配項的前面,但是匹配出來的結果順序依然是條件在匹配項的后面。所以這里match()出來的結果是2在$的前面。

總結

以上所述是小編給大家介紹的正則表達式 捕獲組,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對腳本之家網站的支持!
如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!

您可能感興趣的文章:

  • PHP正則表達式之捕獲組與非捕獲組
  • PHP之正則表達式捕獲組與非捕獲組(詳解)
  • 正則表達式之捕獲組/非捕獲組介紹

相關文章

  • 深入淺析正則表達式 捕獲組

    深入淺析正則表達式 捕獲組

    捕獲組(capturing group)是正則表達式里比較常用,也是比較重要的概念,我個人覺得掌握這部分的知識是非常重要的。 這篇文章內容不會很深入,但是盡量做
    2019-06-25
  • js中值引用和地址引用實例分析

    js中值引用和地址引用實例分析

    本文實例講述了js中值引用和地址引用。分享給大家供大家參考,具體如下: js中任何事務都是對象。包括基本數據類型(undefined,boolean,number,string,null)
    2019-06-25
  • 10種JavaScript最常見的錯誤(小結)

    10種JavaScript最常見的錯誤(小結)

    前言 查看了數千個項目后,發現了 10 個最常見的 JavaScript 錯誤。我們會告訴你什么原因導致了這些錯誤,以及如何防止這些錯誤發生。如果你能夠避免落入這些
    2019-06-25
  • JavaScript迭代器的含義及用法

    JavaScript迭代器的含義及用法

    什么是迭代器 迭代器就是為實現對不同集合進行統一遍歷操作的一種機制,只要給需要遍歷的數據結構部署Iterator接口,通過調用該接口,或者使用消耗該接口的
    2019-06-25
  • Javascript正則表達式驗證賬號、手機號、電話和郵箱的合法性

    Javascript正則表達式驗證賬號、手機號、電話和郵箱的合法性

    正則表達式是用于匹配字符串中字符組合的模式。在 JavaScript中,正則表達式也是對象。這些模式被用于 RegExp 的 exec 和 test 方法, 以及 String 的 match、
    2019-06-25
  • 正則表達式使用示例詳解

    正則表達式使用示例詳解

    正則表達式(Regular Expression)是一種文本模式,包括普通字符(例如,a 到 z 之間的字母)和特殊字符(稱為"元字符")。 正則表達式使用單個字符串來描述、匹
    2019-06-25
  • 一個正則表達式導致CPU 利用率居高不下

    一個正則表達式導致CPU 利用率居高不下

    前幾天線上一個項目監控信息突然報告異常,上到機器上后查看相關資源的使用情況,發現 CPU 利用率將近 100%。通過 Java 自帶的線程 Dump 工具,我們導出了出問
    2019-06-25
  • js類的繼承定義與用法分析

    js類的繼承定義與用法分析

    本文實例講述了js類的繼承定義與用法。分享給大家供大家參考,具體如下: 如何實現類的繼承呢? 有如下2個構造函數: function PeopleClass(){ this.type
    2019-06-25
  • 詳解正則表達式后面不要包含指定的字符串內容

    詳解正則表達式后面不要包含指定的字符串內容

    以前只會/<abc(&#63;!def).+>/.exec("<abcdef>\n<abczzz>"),匹配到<abczzz>,這種簡單的固定寫法,但實際使用次數幾乎趨近于0。 很多場景不能寫死abc,順理成
    2019-06-25
  • 開發過程最全的正則表達式匹配中英文、字母和數字

    開發過程最全的正則表達式匹配中英文、字母和數字

    在做項目的過程中,使用正則表達式來匹配一段文本中的特定種類字符,是比較常用的一種方式,下面是對常用的正則匹配做了一個歸納整理。 1、匹配中文:[\u4e00-
    2019-06-25

最新評論

黑龙江新11选5开奖结果