站長資訊網
最全最豐富的資訊網站

Java正則表達式學習教程

本教程旨在幫助你駕馭Java正則表達式,同時也幫助我復習正則表達式。

什么是正則表達式?

正則表達式定義了字符串的模式。正則表達式可以用來搜索、編輯或處理文本。正則表達式并不僅限于某一種語言,但是在每種語言中有細微的差別。Java正則表達式和Perl的是最為相似的。

Java正則表達式的類在 java.util.regex 包中,包括三個類:Pattern,Matcher PatternSyntaxException。

Pattern對象是正則表達式的已編譯版本。他沒有任何公共構造器,我們通過傳遞一個正則表達式參數給公共靜態方法 compile 來創建一個pattern對象。
Matcher是用來匹配輸入字符串和創建的 pattern 對象的正則引擎對象。這個類沒有任何公共構造器,我們用patten對象的matcher方法,使用輸入字符串作為參數來獲得一個Matcher對象。然后使用matches方法,通過返回的布爾值判斷輸入字符串是否與正則匹配。
如果正則表達式語法不正確將拋出PatternSyntaxException異常。
讓我們在一個簡單的例子里看看這些類是怎么用的吧

  package com.journaldev.util;     import java.util.regex.Matcher;  import java.util.regex.Pattern;     public class RegexExamples {       public static void main(String[] args) {      // using pattern with flags      Pattern pattern = Pattern.compile("ab", Pattern.CASE_INSENSITIVE);      Matcher matcher = pattern.matcher("ABcabdAb");      // using Matcher find(), group(), start() and end() methods      while (matcher.find()) {        System.out.println("Found the text "" + matcher.group()            + "" starting at " + matcher.start()            + " index and ending at index " + matcher.end());      }         // using Pattern split() method      pattern = Pattern.compile("\W");      String[] words = pattern.split("one@two#three:four$five");      for (String s : words) {        System.out.println("Split using Pattern.split(): " + s);      }         // using Matcher.replaceFirst() and replaceAll() methods      pattern = Pattern.compile("1*2");      matcher = pattern.matcher("11234512678");      System.out.println("Using replaceAll: " + matcher.replaceAll("_"));      System.out.println("Using replaceFirst: " + matcher.replaceFirst("_"));    }     }

既然正則表達式總是和字符串有關, Java 1.4對String類進行了擴展,提供了一個matches方法來匹配pattern。在方法內部使用Pattern和Matcher類來處理這些東西,但顯然這樣減少了代碼的行數。

Pattern類同樣有matches方法,可以讓正則和作為參數輸入的字符串匹配,輸出布爾值結果。

下述的代碼可以將輸入字符串和正則表達式進行匹配。

  String str = "bbb";  System.out.println("Using String matches method: "+str.matches(".bb"));  System.out.println("Using Pattern matches method: "+Pattern.matches(".bb", str));  

所以如果你的需要僅僅是檢查輸入字符串是否和pattern匹配,你可以通過調用String的matches方法省下時間。只有當你需要操作輸入字符串或者重用pattern的時候,你才需要使用Pattern和Matches類。

注意由正則定義的pattern是從左至右應用的,一旦一個原字符在一次匹配中使用過了,將不會再次使用。

例如,正則“121”只會匹配兩次字符串“31212142121″,就像這樣“_121____121″。
正則表達式通用匹配符號

Java正則表達式學習教程

Java正則表達式學習教程

Java正則表達式元字符

Java正則表達式學習教程

有兩種方法可以在正則表達式中像一般字符一樣使用元字符。

在元字符前添加反斜杠()
將元字符置于Q(開始引用)和E(結束引用)間
正則表達式量詞

量詞指定了字符匹配的發生次數。

Java正則表達式學習教程

量詞可以和character classes和capturing group一起使用。

例如,[abc]+表示a,b或c出現一次或者多次。

 (abc)+表示capturing group “abc”出現一次或多次。我們即將討論capturing group。

正則表達式capturing group

Capturing group是用來對付作為一個整體出現的多個字符。你可以通過使用()來建立一個group。輸入字符串中和capturing group相匹配的部分將保存在內存里,并且可以通過使用Backreference調用。

你可以使用matcher.groupCount方法來獲得一個正則pattern中capturing groups的數目。例如((a)(bc))包含3個capturing groups; ((a)(bc)), (a) 和 (bc)。

你可以使用在正則表達式中使用Backreference,一個反斜杠()接要調用的group號碼。

Capturing groups和Backreferences可能很令人困惑,所以我們通過一個例子來理解。

  System.out.println(Pattern.matches("(\w\d)\1", "a2a2")); //true    System.out.println(Pattern.matches("(\w\d)\1", "a2b2")); //false    System.out.println(Pattern.matches("(AB)(B\d)\2\1", "ABB2B2AB")); //true    System.out.println(Pattern.matches("(AB)(B\d)\2\1", "ABB2B3AB")); //false  

在第一個例子里,運行的時候第一個capturing group是(wd),在和輸入字符串“a2a2″匹配的時候獲取“a2″并保存到內存里。因此1是”a2”的引用,并且返回true。基于相同的原因,第二行代碼打印false。

試著自己理解第三行和第四行代碼。:)

現在我們來看看Pattern和Matcher類中一些重要的方法。

我們可以創建一個帶有標志的Pattern對象。例如Pattern.CASE_INSENSITIVE可以進行大小寫不敏感的匹配。Pattern類同樣提供了和String類相似的split(String) 方法

Pattern類toString()方法返回被編譯成這個pattern的正則表達式字符串。

Matcher類有start()和end()索引方法,他們可以顯示從輸入字符串中匹配到的準確位置。

Matcher類同樣提供了字符串操作方法replaceAll(String replacement)和replaceFirst(String replacement)。

現在我們在一個簡單的java類中看看這些函數是怎么用的。

  package com.journaldev.util;     import java.util.regex.Matcher;  import java.util.regex.Pattern;     public class RegexExamples {       public static void main(String[] args) {      // using pattern with flags      Pattern pattern = Pattern.compile("ab", Pattern.CASE_INSENSITIVE);      Matcher matcher = pattern.matcher("ABcabdAb");      // using Matcher find(), group(), start() and end() methods      while (matcher.find()) {        System.out.println("Found the text "" + matcher.group()            + "" starting at " + matcher.start()            + " index and ending at index " + matcher.end());      }         // using Pattern split() method      pattern = Pattern.compile("\W");      String[] words = pattern.split("one@two#three:four$five");      for (String s : words) {        System.out.println("Split using Pattern.split(): " + s);      }         // using Matcher.replaceFirst() and replaceAll() methods      pattern = Pattern.compile("1*2");      matcher = pattern.matcher("11234512678");      System.out.println("Using replaceAll: " + matcher.replaceAll("_"));      System.out.println("Using replaceFirst: " + matcher.replaceFirst("_"));    }     }  

上述程序的輸出:

  Found the text "AB" starting at 0 index and ending at index 2  Found the text "ab" starting at 3 index and ending at index 5  Found the text "Ab" starting at 6 index and ending at index 8  Split using Pattern.split(): one  Split using Pattern.split(): two  Split using Pattern.split(): three  Split using Pattern.split(): four  Split using Pattern.split(): five  Using replaceAll: _345_678  Using replaceFirst: _34512678

這是不是一個很全面的Java正則表達式學習教程,希望對大家的學習有所幫助。

贊(0)
分享到: 更多 (0)
網站地圖   滬ICP備18035694號-2    滬公網安備31011702889846號
四虎成人精品在永久免费| 一本色道久久综合亚洲精品蜜桃冫| 精品国内自产拍在线观看| 日韩视频在线观看| 国产日韩AV免费无码一区二区三区| 国产精品视频永久免费播放| 国产精品久久影院| 中文字幕亚洲综合精品一区| 久久久久久亚洲精品中文字幕| 伊人久久精品无码二区麻豆| 二区久久国产乱子伦免费精品| 国产精品高清在线观看| 国产2021久久精品| 一级A毛片免费观看久久精品| 欧美日韩视费观看视频| 最新日韩精品中文字幕| 日韩专区无码人妻| 亚洲性日韩精品一区二区三区| 国产在线精品二区赵丽颖| 国产成人精品实拍在线| 国产精品亚洲一区二区三区在线观看 | 国产精品无码专区在线观看| 色精品一区二区三区| 精品无码日韩一区二区三区不卡| 国产aⅴ精品一区二区三区久久| 国产精品入口麻豆完整版| 国产精品午夜在线播放a| 四虎精品久久久久影院| 日韩毛片在线免费观看| 日韩精品乱码AV一区二区| 日韩黄色免费观看| 九九免费精品视频在这里| 亚洲AV无码之日韩精品| 精品免费久久久久国产一区| 精品视频一区二区三区四区五区| 精品国产免费一区二区三区| 中文国产成人精品久久久| 亚洲国产美女精品久久久久∴| 久久精品一区二区三区不卡| 亚洲AV日韩精品久久久久| 97精品在线视频|