GitHub

Some useful regexes

Collecting some useful regex string, if you know some, pls tell me. :)

[TOC]

用户名 (username)

^[a-z0-9_-]{3,16}$

密码 (password)

^[a-z0-9_-]{6,18}$

16进制数 (Hex value)

^#?([a-f0-9]{6}|[a-f0-9]{3})$

校验密码强度 (password strength check)

密码的强度必须是包含大小写字母和数字的组合，不能使用特殊字符，长度在8-10之间

^(?=.*\\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$

校验中文 (verify chinese)

字符串仅能是中文。

^[\\u4e00-\\u9fa5]{0,}$

由数字、字母或下划线 (only number、letter or underline)

由数字、字母或下划线组成的字符串

^\\w+$

手机号码 (CN-phone number)

下面是国内 13、15、18开头的手机号正则表达式。

^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\\d{8}$

校验身份证号码 (CN-identity card)

身份证号码的正则校验(15 或 18位)

15位

^[1-9]\\d{7}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}$

18位

^[1-9]\\d{5}[1-9]\\d{3}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}([0-9]|X)$

邮箱地址 (email address)

email地址合规性的正则检查语句

^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$

^[a-z\d]+(\.[a-z\d]+)*@([\da-z](-[\da-z])?)+(\.{1,2}[a-z]+)+$

[\\w!#$%&'*+/=?^_`{|}~-]+(?:\\.[\\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\\w](?:[\\w-]*[\\w])?\\.)+[\\w](?:[\\w-]*[\\w])?

校验日期 (verify datetime "yyyy-mm-dd" format)

"yyyy-mm-dd" 格式的日期校验，已考虑平闰年

^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$

提取页面超链接 (get url address)

提取html中的超链接

(<;a\\s*(?!.*\\brel=)[^>;]*)(href="https?://)((?!(?:(?:www\\.)?'.implode('|(?:www\\.)?', $follow_list).'))[^"]+)"((?!.*\\brel=)[^>;]*)(?:[^>;]*)>

抽取注释 (get html comment)

查找HMTL中的注释

<!--(.*?)-->

匹配HTML标签 (matching html tag)

匹配出HTML中的标签。

</?\\w+((\\s+\\w+(\\s*=\\s*(?:".*?"|'.*?'|[\\^'">\\s]+))?)+\\s*|\\s*)/?>

验证域名 (verify domain)

匹配完整域名

^(?=^.{3,255}$)[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+$

Win文件路径及扩展名校验 (verify win path and extension)

验证文件路径和扩展名

^([a-zA-Z]\\:|\\\\)\\\\([^\\\\]+\\\\)*[^\\/:*?"<>|]+\\.txt(l)?$

# import re
# regx = """^([a-zA-Z]\\:|\\\\)\\\\([^\\\\]+\\\\)*[^\\/:*?"<>|]+\\.txt(l)?$"""
# print(re.match(regx,"""C:\\fewfewfw\\fewf\\test.txtf"""))

提取Color Hex Codes (get color hex)

抽取网页中的颜色代码

\\#([a-fA-F]|[0-9]){3,6}

提取网页图片 (get image address)

提取网页中所有图片

\\< *[img][^\\>]*[src] *= *[\\"\\']{0,1}([^\\"\\'\\ >]*)

校验IPv4地址 (verify ipv4)

IP4 正则语句。

((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)

^(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)$

\\b(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\b

校验IPv6地址 (verify ipv6)

IP6 正则语句。

(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))

匹配URL (get url)

^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$

检查URL的前缀 (get url prefix)

很多时候需要区分请求是HTTPS还是HTTP，通过下面的表达式可以取出一个url的前缀然后再逻辑判断。

^[a-zA-Z]+:\\/\\/

# print(re.findall("^[a-zA-Z]+:\\/\\/","ftp://test.com"))

校验金额 (verify money)

金额校验，精确到2位小数。

^[0-9]+(.[0-9]{2})?$

判断IE的版本 (get IE version)

IE目前还没被完全取代，很多页面还是需要做版本兼容，下面是IE版本检查的表达式。

^.*MSIE [5-8](?:\\.[0-9]+)?(?!.*Trident\\/[5-9]\\.0).*$

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Some useful regexes

用户名 (username)

密码 (password)

16进制数 (Hex value)

校验密码强度 (password strength check)

校验中文 (verify chinese)

由数字、字母或下划线 (only number、letter or underline)

手机号码 (CN-phone number)

校验身份证号码 (CN-identity card)

15位

18位

邮箱地址 (email address)

校验日期 (verify datetime "yyyy-mm-dd" format)

提取页面超链接 (get url address)

抽取注释 (get html comment)

匹配HTML标签 (matching html tag)

验证域名 (verify domain)

Win文件路径及扩展名校验 (verify win path and extension)

提取Color Hex Codes (get color hex)

提取网页图片 (get image address)

校验IPv4地址 (verify ipv4)

校验IPv6地址 (verify ipv6)

匹配URL (get url)

检查URL的前缀 (get url prefix)

校验金额 (verify money)

判断IE的版本 (get IE version)

About

Releases

Packages

secoba/SomePubRegex

Folders and files

Latest commit

History

Repository files navigation

Some useful regexes

用户名 (username)

密 码 (password)

16进制数 (Hex value)

校验密码强度 (password strength check)

校验中文 (verify chinese)

由数字、字母或下划线 (only number、letter or underline)

手机号码 (CN-phone number)

校验身份证号码 (CN-identity card)

15位

18位

邮箱地址 (email address)

校验日期 (verify datetime "yyyy-mm-dd" format)

提取页面超链接 (get url address)

抽取注释 (get html comment)

匹配HTML标签 (matching html tag)

验证域名 (verify domain)

Win文件路径及扩展名校验 (verify win path and extension)

提取Color Hex Codes (get color hex)

提取网页图片 (get image address)

校验IPv4地址 (verify ipv4)

校验IPv6地址 (verify ipv6)

匹配URL (get url)

检查URL的前缀 (get url prefix)

校验金额 (verify money)

判断IE的版本 (get IE version)

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

密码 (password)

Packages