JAVA中的正则表达式基础用法

 一、什么是正则表达式

用于描述字符串内容格式,使用它通常用于匹配一个字符串的内容是否符合格式要求。

1.[ ]:表示一个字符,该字符可以是[]中指定的内容
       例如:
       [abc]:这个字符可以是a或b或c
       [a-z]:表示任意一个小写字母
       [a-zA-Z]:表示任意一个字母
       [a-zA-Z0-9]:表示任意一个字母数字
       [a-zA-Z0-9_]:表示任意一个数字字母下划线
       [^abc]:该字符只要不是a或b或c
2.预定义字符:
       点( . ) :表示任意一个字符,没有范围限制
       \d : 表示任意一个数字,等同于[0-9]
       \w : 表示任意一个单词字符,单词字符指字母/数字/下划线( _ )等同于[a-zA-Z0-9_]
       \s : 表示任意一个空白字符
       \D : 表示不是数字
       \W : 表示不是单词字符
       \S : 表示不是空白字符
3.量词:
       问号(?) : 表示前面的内容出现0-1次
         例如: [abc]? 可以匹配:a 或 b 或 c 或什么也不写
       加号(+) : 表示前面的内容最少出现1次
         例如: [abc]+ 可以匹配:b或aaaaaaaaaa...或abcabcbabcbabcba....
               但是不能匹配:什么都不写 或 出现内容之外的单词字符,如:abcfdfsbbaqbb34bbwer...
       星号(*) : 表示前面的内容出现任意次(0-多次)---匹配内容与+一致,只是可以一次都不写
         例如: [abc]* 可以匹配:b或aaaaaaaaaa...或abcabcba....或什么都不写
               但是不能匹配有出现内容之外的单词字符:abcfdfsbbaqbb34bbwer...
       {n} : 表示前面的内容出现n次
         例如: [abc]{3} 可以匹配:aaa 或 bbb 或 aab 或abc 或bbc
                但是不能匹配: aaaa 或 aad
       {n,m} : 表示前面的内容出现最少n次最多m次  
         例如: [abc]{3,5} 可以匹配:aaa 或  abcab 或者 abcc
             但是不能匹配:aaaaaa 或 aabbd
       {n,} : 表示前面的内容出现n次以上(含n次)
         例如: [abc]{3,} 可以匹配:aaa 或 aaaaa.... 或 abcbabbcbabcba....
                 但是不能匹配:aa 或 abbdaw...
     4.( ) 括号用于分组,是将括号内的内容看做是一个整体
        例如: (abc){3} 表示abc整体出现3次. 可以匹配abcabcabc
             但是不能匹配aaa 或abcabc
             (abc|def){3}表示abc或def整体出现3次.  | 表示或
             可以匹配: abcabcabc 或 defdefdef 或 abcdefabc
             但是不能匹配abcdef 或abcdfbdef


二.  String支持与正则表达式相关的方法:(常用方法)

boolean matches(String regex):匹配

String replaceAll(String regex,String s):替换

String[] split(String regex):拆分


   - matches():使用给定的正则表达式(regex)验证当前字符串的格式是否符合要求,符合则返回true,否则返回false

用法示例


     public class MatchesDemo {
         public static void main(String[] args) {
             String email = "xxx123@baidu.com";   //待验证邮箱
             String regex = "[a-zA-Z0-9_]+@[a-zA-Z0-9]+(\\.[a-zA-Z]+)+"; //邮箱的正则表达式
             //使用regex匹配email是否符合格式要求
             boolean match = email.matches(regex);  //返回一个boolena值
             if(match){
                 System.out.println("是正确的邮箱格式");  //true
             }else{
                 System.out.println("不是正确的邮箱格式"); //false
             }
         }
     }

输出结果:


- replaceAll():将当前字符串中满足正则表达式(regex)的部分给替换为给定的字符串(s)

用法示例:

 public class ReplaceAllDemo {
         public static void main(String[] args) {
             String line = "abc123def456ghi78";
             //将line中的数字部分替换为#NUMBER#
             line = line.replaceAll("[0-9]+","#NUMBER#");
             System.out.println(line);
         }
     }

 输出结果:


 - split():将当前字符串按照满足正则表达式的部分进行拆分,并将拆分出的以String[]形式来返回

用法示例:

public class SplitDemo {
         public static void main(String[] args) {
             String line = "abc123def456ghi";
             String[] data = line.split("[0-9]+"); //按数字拆分(数字就拆没了)
             System.out.println(Arrays.toString(data)); //将data数组按String格式输出
     
             line = "123.456.78";
             data = line.split("\\."); //按.拆(.就拆没了)
             System.out.println(Arrays.toString(data));
     
             //最开始就是可拆分项(.),那么数组第1个元素为空字符串------------""
             //如果连续两个(两个以上)可拆分项,那么中间也会拆出一个空字符串----""
             //如果末尾连续多个可拆分项,那么拆出的空字符串被忽略
             line = ".123.456..78.......";
             data = line.split("\\."); //按.拆(.就拆没了)
             System.out.println(Arrays.toString(data));
         }
     }

输出结果: