正則表達式口訣及教程(推薦)
當前位置:點晴教程→知識管理交流
→『 技術文檔交流 』
[b]正則表達式口訣及教程(推薦)[/b][br]正則其實也勢利,削尖頭來把錢揣; (指開始符號^和結尾符號$)[br]特殊符號認不了,弄個倒杠來引路; (指\. \*等特殊符號)[br]倒杠后面跟小w, 數字字母來表示; (\w跟數字字母;\d跟數字)[br]倒杠后面跟小d, 只有數字來表示;[br]倒杠后面跟小a, 報警符號嘀一聲;[br]倒杠后面跟小b, 單詞分界或退格;[br]倒杠后面跟小t, 制表符號很明了;[br]倒杠后面跟小r, 回車符號知道了;[br]倒杠后面跟小s, 空格符號很重要;[br]小寫跟罷跟大寫,多得實在不得了;[br]倒杠后面跟大w, 字母數字靠邊站;[br]倒杠后面跟大s, 空白也就靠邊站;[br]倒杠后面跟大d, 數字從此靠邊站;[br]倒框后面跟大b, 不含開頭和結尾;[br][br]單個字符要重復,三個符號來幫忙; (* + ?)[br]0 星加1 到無窮,問號只管0 和1; (*表0-n;+表1-n;?表0-1次重復)[br]花括號里學問多,重復操作能力強; ({n} {n,} {n,m})[br]若要重復字符串,園括把它括起來; ((abc){3} 表示字符串“abc”重復3次 )[br]特殊集合自定義,中括號來幫你忙;[br]轉義符號行不通,一個一個來排隊;[br]實在多得排不下,橫杠請來幫個忙; ([1-5])[br]尖頭放進中括號,反義定義威力大; ([^a]指除“a”外的任意字符 )[br]1豎作用可不小,兩邊正則互替換; (鍵盤上與“\”是同一個鍵)[br]1豎能用很多次,復雜定義很方便;[br]園括號,用途多;[br]反向引用指定組,數字排符對應它; (“\b(\w+)\b\s+\1\b”中的數字“1”引用前面的“(\w+)”)[br]支持組名自定義,問號加上尖括號; (“(?
[b]常用正則表達式[/b][br][br]1。^\d+$ //匹配非負整數(正整數 + 0) [br]2。^[0-9]*[1-9][0-9]*$ //匹配正整數 [br]3。^((-\d+) ?(0+))$ //匹配非正整數(負整數 + 0) [br]4。^-[0-9]*[1-9][0-9]*$ //匹配負整數 [br]5。^-?\d+$ //匹配整數 [br]6。^\d+(\.\d+)?$ //匹配非負浮點數(正浮點數 + 0) [br]7。^(([0-9]+\.[0-9]*[1-9][0-9]*) ?([0-9]*[1-9][0-9]*\.[0-9]+) ?([0-9]*[1-9][0-9]*))$ //匹配正浮點數 [br]8。^((-\d+(\.\d+)?) ?(0+(\.0+)?))$ //匹配非正浮點數(負浮點數 + 0) [br]9。^(-(([0-9]+\.[0-9]*[1-9][0-9]*) ?([0-9]*[1-9][0-9]*\.[0-9]+) ?([0-9]*[1-9][0-9]*)))$ //匹配負浮點數 [br]10。^(-?\d+)(\.\d+)?$ //匹配浮點數 [br]11。^[a-za-z]+$ //匹配由26個英文字母組成的字符串 [br]12。^[a-z]+$ //匹配由26個英文字母的大寫組成的字符串 [br]13。^[a-z]+$ //匹配由26個英文字母的小寫組成的字符串 [br]14。^[a-za-z0-9]+$ //匹配由數字和26個英文字母組成的字符串 [br]15。^\w+$ //匹配由數字、26個英文字母或者下劃線組成的字符串 16。^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$ //匹配email地址 [br]17。^[a-za-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\s*)?$ //匹配url [br]18。匹配中文字符的正則表達式: [\u4e00-\u9fa5] [br]19。匹配雙字節字符(包括漢字在內):[^\x00-\xff] [br]20。應用:計算字符串的長度(一個雙字節字符長度計2,ascii字符計1) [br]string.prototype.len=function(){return this.replace([^\x00-\xff]/g,”aa”).length;} [br]21。匹配空行的正則表達式:\n[\s ? ]*\r [br]22。匹配html標記的正則表達式:/ <(.*)>.* <\/\1> ? <(.*) \/>/ [br]23。匹配首尾空格的正則表達式:(^\s*) ?(\s*$) [br]* 正則表達式用例 [br]* 1、^\s+[a-z a-z]$ 不能為空 不能有空格 只能是英文字母 [br]* 2、\s{6,} 不能為空 六位以上 [br]* 3、^\d+$ 不能有空格 不能非數字 [br]* 4、(.*)(\.jpg ?\.bmp)$ 只能是jpg和bmp格式 [br]* 5、^\d{4}\-\d{1,2}-\d{1,2}$ 只能是2004-10-22格式 [br]* 6、^0$ 至少選一項 [br]* 7、^0{2,}$ 至少選兩項 [br]* 8、^[\s ?\s]{20,}$ 不能為空 二十字以上 [br]* 9、^\+?[a-z0-9](([-+.] ?[_]+)?[a-z0-9]+)*@([a-z0-9]+(\. ?\-))+[a-z]{2,6}$郵件 [br]* 10、\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*([,;]\s*\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*)* 輸入多個地址用逗號或空格分隔郵件 [br]* 11、^(\([0-9]+\))?[0-9]{7,8}$電話號碼7位或8位或前面有區號例如(022)87341628 [br]* 12、^[a-z a-z 0-9 _]+@[a-z a-z 0-9 _]+(\.[a-z a-z 0-9 _]+)+(\,[a-z a-z 0-9 _]+@[a-z a-z 0-9 _]+(\.[a-z a-z 0-9 _]+)+)*$ [br]* 只能是字母、數字、下劃線;必須有@和.同時格式要規范 郵件 [br]* 13 ^\w+@\w+(\.\w+)+(\,\w+@\w+(\.\w+)+)*$上面表達式也可以寫成這樣子,更精練。 [br]14 ^\w+((-\w+) ?(\.\w+))*\@\w+((\. ¦-)\w+)*\.\w+$ [br]匹配中文字符的正則表達式: [\u4e00-\u9fa5] [br]評注:匹配中文還真是個頭疼的事,有了這個表達式就好辦了 [br]匹配雙字節字符(包括漢字在內):[^\x00-\xff] [br]評注:可以用來計算字符串的長度(一個雙字節字符長度計2,ascii字符計1) [br]匹配空白行的正則表達式:\n\s*\r [br]評注:可以用來刪除空白行 [br]匹配html標記的正則表達式: <(\s*?)[^>]*>.*? ? <.*? /> [br]評注:網上流傳的版本太糟糕,上面這個也僅僅能匹配部分,對于復雜的嵌套標記依舊無能為力 [br]匹配首尾空白字符的正則表達式:^\s* ?\s*$ [br]評注:可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達式 [br]匹配email地址的正則表達式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)* [br]評注:表單驗證時很實用 [br]匹配網址url的正則表達式:[a-za-z]+://[^\s]* [br]評注:網上流傳的版本功能很有限,上面這個基本可以滿足需求 [br]匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-za-z][a-za-z0-9_]{4,15}$ [br]評注:表單驗證時很實用 [br]匹配國內電話號碼:\d{3}-\d{8} ?\d{4}-\d{7} [br]評注:匹配形式如 0511-4405222 或 021-87888822 [br]匹配騰訊qq號:[1-9][0-9]{4,} [br]評注:騰訊qq號從10000開始 [br]匹配中國郵政編碼:[1-9]\d{5}(?!\d) [br]評注:中國郵政編碼為6位數字 [br]匹配身份證:\d{15} ?\d{18} [br]評注:中國的身份證為15位或18位 [br]匹配ip地址:\d+\.\d+\.\d+\.\d+ [br]評注:提取ip地址時有用 [br]匹配特定數字: [br]^[1-9]\d*$ //匹配正整數 [br]^-[1-9]\d*$ //匹配負整數 [br]^-?[1-9]\d*$ //匹配整數 [br]^[1-9]\d* ¦0$ //匹配非負整數(正整數 + 0) [br]^-[1-9]\d* ¦0$ //匹配非正整數(負整數 + 0) [br]^[1-9]\d*\.\d* ¦0\.\d*[1-9]\d*$ //匹配正浮點數 [br]^-([1-9]\d*\.\d* ¦0\.\d*[1-9]\d*)$ //匹配負浮點數 [br]^-?([1-9]\d*\.\d* ¦0\.\d*[1-9]\d* ¦0?\.0+ ¦0)$ //匹配浮點數 [br]^[1-9]\d*\.\d* ¦0\.\d*[1-9]\d* ¦0?\.0+ ¦0$ //匹配非負浮點數(正浮點數 + 0) [br]^(-([1-9]\d*\.\d* ¦0\.\d*[1-9]\d*)) ¦0?\.0+ ¦0$ //匹配非正浮點數(負浮點數 + 0) [br]評注:處理大量數據時有用,具體應用時注意修正 [br]匹配特定字符串: [br]^[a-za-z]+$ //匹配由26個英文字母組成的字符串 [br]^[a-z]+$ //匹配由26個英文字母的大寫組成的字符串 [br]^[a-z]+$ //匹配由26個英文字母的小寫組成的字符串 [br]^[a-za-z0-9]+$ //匹配由數字和26個英文字母組成的字符串 [br]^\w+$ //匹配由數字、26個英文字母或者下劃線組成的字符串 [br]“^[\\w-]+([url=file://...[..w-]+)*@[..w-]+(...[..w-]+)+___fckpd___0quot/][color=#2c629e]\\.[\\w-]+)*@[\\w-]+(\\.[\\w-]+)+___fckpd___0quot[/color][/url]; //email地址 [br]“^[a-za-z]+://([url=file://..w+(-..w+)*)(...(..w+(-..w+)*))*(../?..s*)?___fckpd___0quot][color=#2c629e]\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\s*)?___fckpd___0quot[/color][/url]; //url [br]匹配中文字符的正則表達式: [\u4e00-\u9fa5] [br]評注:匹配中文還真是個頭疼的事,有了這個表達式就好辦了 [br]匹配雙字節字符(包括漢字在內):[^\x00-\xff] [br]評注:可以用來計算字符串的長度(一個雙字節字符長度計2,ascii字符計1) [br]匹配空白行的正則表達式:\n\s*\r [br]評注:可以用來刪除空白行 [br]匹配html標記的正則表達式: <(\s*?)[^>]*>.*? ? <.*? /> [br]評注:網上流傳的版本太糟糕,上面這個也僅僅能匹配部分,對于復雜的嵌套標記依舊無能為力 [br]匹配首尾空白字符的正則表達式:^\s* ?\s*$ [br]評注:可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達式 [br]匹配email地址的正則表達式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)* [br]評注:表單驗證時很實用 [br]匹配網址url的正則表達式:[a-za-z]+://[^\s]* [br]評注:網上流傳的版本功能很有限,上面這個基本可以滿足需求 [br]匹配帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-za-z][a-za-z0-9_]{4,15}$ [br]評注:表單驗證時很實用 [br]匹配國內電話號碼:\d{3}-\d{8} ?\d{4}-\d{7} [br]評注:匹配形式如 0511-4405222 或 021-87888822 [br]匹配騰訊qq號:[1-9][0-9]{4,} [br]評注:騰訊qq號從10000開始 [br]匹配中國郵政編碼:[1-9]\d{5}(?!\d) [br]評注:中國郵政編碼為6位數字 [br]匹配身份證:\d{15} ?\d{18} [br]評注:中國的身份證為15位或18位 [br]匹配ip地址:\d+\.\d+\.\d+\.\d+ [br]評注:提取ip地址時有用 [br]匹配特定數字: [br]^[1-9]\d*$ //匹配正整數 [br]^-[1-9]\d*$ //匹配負整數 [br]^-?[1-9]\d*$ //匹配整數 [br]^[1-9]\d* ¦0$ //匹配非負整數(正整數 + 0) [br]^-[1-9]\d* ¦0$ //匹配非正整數(負整數 + 0) [br]^[1-9]\d*\.\d* ¦0\.\d*[1-9]\d*$ //匹配正浮點數 [br]^-([1-9]\d*\.\d* ¦0\.\d*[1-9]\d*)$ //匹配負浮點數 [br]^-?([1-9]\d*\.\d* ¦0\.\d*[1-9]\d* ¦0?\.0+ ¦0)$ //匹配浮點數 [br]^[1-9]\d*\.\d* ¦0\.\d*[1-9]\d* ¦0?\.0+ ¦0$ //匹配非負浮點數(正浮點數 + 0) [br]^(-([1-9]\d*\.\d* ¦0\.\d*[1-9]\d*)) ¦0?\.0+ ¦0$ //匹配非正浮點數(負浮點數 + 0) [br]評注:處理大量數據時有用,具體應用時注意修正 [br]匹配特定字符串: [br]^[a-za-z]+$ //匹配由26個英文字母組成的字符串 [br]^[a-z]+$ //匹配由26個英文字母的大寫組成的字符串 [br]^[a-z]+$ //匹配由26個英文字母的小寫組成的字符串 [br]^[a-za-z0-9]+$ //匹配由數字和26個英文字母組成的字符串 [br]^\w+$ //匹配由數字、26個英文字母或者下劃線組成的字符串 [br]“^[\\w-]+(\\.[\\w-]+)*@[\\w-]+(\\.[\\w-]+)+___fckpd___0quot; //email地址 [br]“^[a-za-z]+://(\\w+(-\\w+)*)(\\.(\\w+(-\\w+)*))*(\\?\\s*)?___fckpd___0quot; //urlview plaincopy to clipboardprint? [br][br][b]正則幾個基本概念: [/b] [br]1.貪婪:+,*,?,{m,n}等默認是貪婪匹配,即盡可能多匹配,也叫最大匹配 [br]如果后面加上?,就轉化為非貪婪匹配,需要高版本支持 [br]1.貪婪:+,*,?,{m,n}等默認是貪婪匹配,即盡可能多匹配,也叫最大匹配 [br]如果后面加上?,就轉化為非貪婪匹配,需要高版本支持view plaincopy to clipboardprint? [br]2.獲取:默認用(x ¦y)是獲取匹配,很多時候只是測試,不一定要求得到所匹配的數據,尤其在嵌套匹配或大數據中就要用非獲取匹配(?:x ¦y),這樣提高了效率,優化了程序。 [br]2.獲取:默認用(x ¦y)是獲取匹配,很多時候只是測試,不一定要求得到所匹配的數據,尤其在嵌套匹配或大數據中就要用非獲取匹配(?:x ¦y),這樣提高了效率,優化了程序。view plaincopy to clipboardprint? [br]3.消耗:默認是消耗匹配,一般在預查中是非消耗匹配。 [br]舉個例子,2003-2-8要變為2003-02-08 [br]如果用/-(\d)-/第二次匹配將從8開始,從而只替換第一個2,錯誤 [br]如果用/-(\d)(?=-)/則第二次匹配從第二個-開始,即不消耗字符- [br]3.消耗:默認是消耗匹配,一般在預查中是非消耗匹配。 [br]舉個例子,2003-2-8要變為2003-02-08 [br]如果用/-(\d)-/第二次匹配將從8開始,從而只替換第一個2,錯誤 [br]如果用/-(\d)(?=-)/則第二次匹配從第二個-開始,即不消耗字符-view plaincopy to clipboardprint? [br]4.預查:js中分為正向預查和負向預查 [br]如上面的(?=pattern)是正向預查,在任何匹配 pattern 的字符串開始處匹配查找字符串。還有 (?!pattern)是負向預查,在任何不匹配 pattern 的字符串開始處匹配查找字符串。負向預查有時會用在對[^]的擴充,[^]只是一些字符,而?!可以使整個字符串。 [br]4.預查:js中分為正向預查和負向預查 [br]如上面的(?=pattern)是正向預查,在任何匹配 pattern 的字符串開始處匹配查找字符串。還有 (?!pattern)是負向預查,在任何不匹配 pattern 的字符串開始處匹配查找字符串。負向預查有時會用在對[^]的擴充,[^]只是一些字符,而?!可以使整個字符串。view plaincopy to clipboardprint? [br]5.回調:一般用在替換上,即根據不用的匹配內容返回不用的替換值,從而簡化了程序,需要高版本支持 [br]5.回調:一般用在替換上,即根據不用的匹配內容返回不用的替換值,從而簡化了程序,需要高版本支持view plaincopy to clipboardprint? [br]6.引用:\num 對所獲取的第num個匹配的引用。 [br]例如,’(.)\1\1′ 匹配aaa型。’(.)(.)\2\1′ 匹配abba型。 [br]6.引用:\num 對所獲取的第num個匹配的引用。 [br]例如,’(.)\1\1′ 匹配aaa型。’(.)(.)\2\1′ 匹配abba型。view plaincopy to clipboardprint? [br][b][br]正則表達式保留字 [/b][br]^ (carat) [br]. (period) [br][ (left bracket} [br]$ (dollar sign) [br]( (left parenthesis) [br]) (right parenthesis) [br]? (pipe) [br]* (asterisk) [br]+ (plus symbol) [br]? (question mark) [br]{ (left curly bracket, or left brace) [br]\ backslash [br]正則表達式保留字 [br]^ (carat) [br]. (period) [br][ (left bracket} [br]$ (dollar sign) [br]( (left parenthesis) [br]) (right parenthesis) [br]? (pipe) [br]* (asterisk) [br]+ (plus symbol) [br]? (question mark) [br]{ (left curly bracket, or left brace) [br]\ backslash view plaincopy to clipboardprint? [br]構造 匹配于 [br]構造 匹配于 view plaincopy to clipboardprint? [br]字符 [br]x 字符 x [br]\\ 反斜線字符 [br]\0n 八進制值的字符0n (0 <= n <= 7) [br]\0nn 八進制值的字符 0nn (0 <= n <= 7) [br]\0mnn 八進制值的字符0mnn 0mnn (0 <= m <= 3, 0 <= n <= 7) [br]\xhh 十六進制值的字符0xhh [br]\uhhhh 十六進制值的字符0xhhhh [br]\t 制表符('\u0009') [br]\n 換行符 ('\u000a') [br]\r 回車符 ('\u000d') [br]\f 換頁符 ('\u000c') [br]\a 響鈴符 ('\u0007') [br]\e 轉義符 ('\u001b') [br]\cx t對應于x的控制字符 x [br]字符 [br]x 字符 x [br]\\ 反斜線字符 [br]\0n 八進制值的字符0n (0 <= n <= 7) [br]\0nn 八進制值的字符 0nn (0 <= n <= 7) [br]\0mnn 八進制值的字符0mnn 0mnn (0 <= m <= 3, 0 <= n <= 7) [br]\xhh 十六進制值的字符0xhh [br]\uhhhh 十六進制值的字符0xhhhh [br]\t 制表符('\u0009') [br]\n 換行符 ('\u000a') [br]\r 回車符 ('\u000d') [br]\f 換頁符 ('\u000c') [br]\a 響鈴符 ('\u0007') [br]\e 轉義符 ('\u001b') [br]\cx t對應于x的控制字符 x view plaincopy to clipboardprint? [br]字符類 [br][abc] a, b, or c (簡單類) [br][^abc] 除了a、b或c之外的任意 字符(求反) [br][a-za-z] a到z或a到z ,包含(范圍) [br][a-z-[bc]] a到z,除了b和c : [ad-z](減去) [br][a-z-[m-p]] a到z,除了m到 p: [a-lq-z] [br][a-z-[^def]] d, e, 或 f [br]字符類 [br][abc] a, b, or c (簡單類) [br][^abc] 除了a、b或c之外的任意 字符(求反) [br][a-za-z] a到z或a到z ,包含(范圍) [br][a-z-[bc]] a到z,除了b和c : [ad-z](減去) [br][a-z-[m-p]] a到z,除了m到 p: [a-lq-z] [br][a-z-[^def]] d, e, 或 f view plaincopy to clipboardprint? [br]預定義的字符類 [br]. 任意字符(也許能與行終止符匹配,也許不能) [br]\d 數字: [0-9] [br]\d 非數字: [^0-9] [br]\s 空格符: [ \t\n\x0b\f\r] [br]\s 非空格符: [^\s] [br]\w 單詞字符: [a-za-z_0-9] [br]\w 非單詞字符: [^\w] 該文章在 2010/3/9 21:23:34 編輯過 |
關鍵字查詢
相關文章
正在查詢... |