站長資訊網(wǎng)
最全最豐富的資訊網(wǎng)站

Java中使用正則表達式處理文本數(shù)據(jù)

本文將介紹如何在Java中使用正則表達式來處理文本數(shù)據(jù)。正則表達式就是一個字符串,但和普通的字符串不同的是,正則表達式是對一組相似字符串的抽象,如下面的幾個字符串:

a98b   c0912d   c10b   a12345678d   ab

我們仔細分析上面五個字符串,可以看出它們有一個共同特征,就是第一個字符必須是’a’或’c’,最后一個字符必須是’b’或’d’,而中間的字符是任意多個數(shù)字組成(包括0個數(shù)字)。因此,我們可以將這五個字符串的共同特點抽象出來,這就產(chǎn)生了一個正則表達式:[ac]\d*[bd]。而根據(jù)這個正則表達式,我們可以寫出無窮多個滿足條件的字符串。

在Java中使用正則表達式的方法非常多,最簡單的就是和字符串一起使用。在String中有四個方法可以使用正則表達式,它們是matches、split、replaceAll和replaceFirst。

一、matches方法

matches方法可以判斷當(dāng)前的字符串是否匹配給定的正則表達式。如果匹配,返回true,否則,返回false。matches方法的定義如下:

復(fù)制代碼 代碼如下:
public boolean matches(String regex)

如上面給出的正則表達式我們可以用如下程序驗證。

  <!---->String[] ss = new String[]{"a98b", "c0912d", "c10b", "a12345678d", "ab"};  for(String s: ss)   System.out.println(s.matches("[ac]\d*[bd]"));

輸出結(jié)果:

true
true
true
true
true

下面簡單解釋一下這個正則表達式的含義。如果我們學(xué)過編譯原理的詞法分析,就會很容易理解上面的正則表達式(因為正則表達式的表示方法和詞法分析中的表達式類似)。如在 […]中的相當(dāng)于或”|”,如[abcd]相當(dāng)于a|b|c|d,也就是a或b或c或d。如上面的正則表達式的開頭部分是[ac],就代表著字符串的開頭只能是a或c。[bd]表達字符串結(jié)尾只能是b或d。而中間的d表達0-9的數(shù)字,由于在正則表達式中有特殊含義,所以用\來表示。而*表示有0或無窮多個(這在詞法分析中叫*閉包),由于*跟在d后面,因此表達有0或無窮多個數(shù)字。

二、split方法

split方法使用正則表達式來分割字符串,并以String數(shù)組的形式返回分割結(jié)果。split有兩種重載形式,它們定義如下:

  <!---->public String[] split(String regex)  public String[] split(String regex, int limit)

如下面的代碼將使用split的第一種重載形式來分割HTTP請求頭的第一行,代碼如下:

  <!---->String s = "GET /index.html HTTP/1.1";  String ss[] = s.split(" +");  for(String str: ss)  System.out.println(str);

輸出結(jié)果:

GET
/index.html
HTTP/1.1

在使用split的第一種重載形式時應(yīng)注意,如果分割后的字符串最后有空串,將被忽略。如使用正則表達式d來分割字符串a(chǎn)0b1c3456時,得到的數(shù)組的長度為3,而不是7。

在split的第二種重載形式中有一個limit參數(shù),要分三種情況討論:

1. 大于0: 如limit的值為n,那么將對正則表達式使用n-1次,下面的代碼:

  <!---->String s = "a0b1c3456";  String ss[] = s.split("\d", 3);  for(String str: ss)    System.out.println(str);

輸出結(jié)果:

a
b
c3456

從輸出結(jié)果可以看出,程序只對” a0b1c3456″使用了兩次正則表達式,也就是在少掃描完字符’1’后,不管后面有沒有滿足條件的字符串,都將后面的字符串作為一個整體來作為返回數(shù)組的最后一個值。

2. 小于0: 不忽略結(jié)尾的空串。也就是上面的例子返回數(shù)組的長度應(yīng)該是7,而不是3。

3. 等于0:這是默認(rèn)值,相當(dāng)于split的第一種重載形式。

三、replaceAll 和 replaceFirst方法

為兩個方法的定義如下:

  public String replaceAll(String regex, String replacement)  public String replaceFirst(String regex, String replacement)

這兩個方法用replacement替換當(dāng)前字符串中和regex匹配的字符串。使用方法很簡單,這里不再詳述,感興趣的讀者可以參考相關(guān)的文檔。

贊(0)
分享到: 更多 (0)
網(wǎng)站地圖   滬ICP備18035694號-2    滬公網(wǎng)安備31011702889846號
亚洲 日韩 色 图网站| 久久久g0g0午夜无码精品| 一本久久a久久精品vr综合| 日韩不卡高清视频| 日韩免费码中文在线观看| 无码人妻精品中文字幕免费| 久久夜色精品国产www| 亚洲国产精品一区二区第一页免| 中文无码亚洲精品字幕| 久久精品国产99久久久古代| 久久精品九九亚洲精品| 久久久久无码精品亚洲日韩| 国产精品久线在线观看| 国产亚洲精品资源在线26u| 国产亚洲精品成人a v小说| 久久99精品国产麻豆蜜芽| 亚洲高清国产拍精品青青草原| 日韩一区二区a片免费观看| 日韩va中文字幕无码电影| 国产午夜精品福利| 国产午夜精品福利| 无码日韩精品一区二区人妻| 国产精品视频公开费视频| 精品国产麻豆免费网站| 日韩精品国产丝袜| 国产精品无码无片在线观看3D| 国产精品视_精品国产免费| 国产精品视频久久久久久 | 精品3d动漫视频一区在线观看| 欧洲MV日韩MV国产| 精品一区二区三区在线视频观看| 日韩影片在线观看| 老司机免费午夜精品视频| xxxxbbbb国产精品| 国产精品色视频ⅹxxx| 久久久久亚洲精品天堂久久久久久| 精品一区二区三区在线观看| 久久99精品国产麻豆蜜芽| 亚洲精品无码不卡在线播放HE| 国产精品无码午夜福利| 亚洲处破女AV日韩精品|