常用正则表达式收集

正则表达式的应用的地方还是挺多的,如爬虫中提取相关数据,以及web开发中用户提交数据验证,所有收集些常用的正则表达式,方便自已查找使用。

网上版本很多,也不知到谁是原创,我仅提取我需要的部分,在以后,自己会继续更新更多的正则表达式,以供参考学习。

0x01 验证数字的表达式

数字:^[0-9]*$

n位的数字:^d{n}$

至少n位的数字:^d{n,}$

m-n位的数字:^d{m,n}$

零和非零开头的数字:^(0|[1-9][0-9]*)$

非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$

带1-2位小数的正数或负数:^(-)?d+(.d{1,2})?$

正数、负数、和小数:^(-|+)?d+(.d+)?$

有两位小数的正实数:^[0-9]+(.[0-9]{2})?$

有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$

非零的正整数:^[1-9]d*$^([1-9][0-9]*){1,3}$^+?[1-9][0-9]*$

非零的负整数:^-[1-9][]0-9"*$^-[1-9]d*$

非负整数:^d+$^[1-9]d*|0$

非正整数:^-[1-9]d*|0$^((-d+)|(0+))$

非负浮点数:^d+(.d+)?$^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$

非正浮点数:^((-d+(.d+)?)|(0+(.0+)?))$^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$

正浮点数:^[1-9]d*.d*|0.d*[1-9]d*$^(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*))$

负浮点数:^-([1-9]d*.d*|0.d*[1-9]d*)$^(-(([0-9]+.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*.[0-9]+)|([0-9]*[1-9][0-9]*)))$

浮点数:^(-?d+)(.d+)?$^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$

0x02 验证字符串的表达式

汉字:^[\u4e00-\u9fa5]+$

英文和数字:^[A-Za-z0-9]+$^[A-Za-z0-9]{4,40}$

长度为3-20的所有字符:^.{3,20}$

由26个英文字母组成的字符串:^[A-Za-z]+$

由26个大写英文字母组成的字符串:^[A-Z]+$

由26个小写英文字母组成的字符串:^[a-z]+$

由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$

由数字、26个英文字母或者下划线组成的字符串:^w+$^w{3,20}$

0x03 特殊需求表达式

去掉左右空格:
str.replace(/(^\s*)|(\s*$)/g, '')

去掉所有空格:
str.replace(/\s+/g, '')

密码需由8位以上大写字母、小写字母、数字及特殊符号组成: /^(?=.*?[A-Z])(?=.*?[a-z])(?=.*?[0-9])(?=.*?[#?!.,@$%^&*-]).{8,}$/

Email地址:^w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*$

域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?

InternetURL:[a-zA-z]+://[^s]* 或^http://([w-]+.)+[w-]+(/[w-./?%&=]*)?$`

手机号码:^1[3456789]\d{9}$

电话号码(“XXX-XXXXXXX”、”XXXX-XXXXXXXX”、”XXX-XXXXXXX”、”XXX-XXXXXXXX”、”XXXXXXX”和”XXXXXXXX):^((d{3,4}-)|d{3.4}-)?d{7,8}$

国内电话号码(0511-4405222、021-87888822):d{3}-d{8}|d{4}-d{7}

身份证号(15位、18位数字):^d{15}|d{18}$

短身份证号码(数字、字母x结尾):^([0-9]){7,18}(x|X)?$^d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$

帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$

密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):^[a-zA-Z]w{5,17}$

强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):^(?=.*d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$

日期格式:^d{4}-d{1,2}-d{1,2}

Html中title:<title>(.*?)</title>|<TITLE>(.*?)</TITLE>

一年的12个月(01~09和1~12):^(0?[1-9]|1[0-2])$

一个月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\.[x|X][m|M][l|L]$

空白行的正则表达式:s* (可以用来删除空白行)

HTML标记的正则表达式:<(S*?)[`^>]*>.*?</>|<.*? /> (网上流传的版本太糟糕,上面这个也仅仅能部分,对于复杂的嵌套标记依旧无能为力)

首尾空白字符的正则表达式:^s*|s*$或(^s*)|(s*$) (可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式)

腾讯QQ号:[1-9][0-9]{4,} (腾讯QQ号从10000开始)

中国邮政编码:[1-9]d{5}(?!d) (中国邮政编码为6位数字)

IP地址:d+.d+.d+.d+ (提取IP地址时有用)

IP地址:((?:(?:25[0-5]|2[0-4]\d|[01]?\d?\d)\.){3}(?:25[0-5]|2[0-4]\d|[01]?\d?\d))