1. 什么是正则表达式
正则表达式(Regular Expression)是用于匹配字符串中字符组合的模式。在JavaScript中,正则表达式也是对象
通常用来查找、替换那些符合正则表达式的文本,许多语言都支持正则表达式。
正则表达式在JavaScript中的使用场景:
例如验证表单:用户名表单只能输入英文字母、数字或者下划线,昵称输入框中可以输入中文(匹配)
比如用户名: /^[a-z0-9_-]{3,16}$/
过滤掉页面内容中的一些敏感词(替换),或从字符串中获取我们想要的特定部分(提取)等。
2. 语法
JavaScript 中定义正则表达式的语法有两种,我们先学习其中比较简单的方法:
1.定义正则表达式语法:
const 变量名 = /表达式/
其中 / / 是正则表达式字面量
比如:
const reg = /前端/
2.判断是否有符合规则的字符串:
test() 方法 用来查看正则表达式与指定的字符串是否匹配
语法:
reg.test(被检测的字符串)
比如:
// 要检测的宇符申 const str = '学习新思想,争做新青年' // 1.定义正则表达式,检测规则 const reg = /学习/ // 2.检测方法 console.log(reg.test(str)) // true
如果正则表达式与指定的字符串匹配,返回 true,否则 false
3.检索(查找)符合规则的字符串:
exec() 方法在一个指定字符串中执行一个搜索匹配
语法:
reg.exec(被检测的字符串)
比如:
// 要检测的宇符申 const str = '学习新思想,争做新青年' // 1.定义正则表达式,检测规则 const reg = /学习/ // 2.检测方法 console.log(reg.exec(str)) // ['学习', index: 0, input: '学习新思想,争做新青年', groups: undefined]
如果匹配成功,exec() 方法返回一个数组,否则返回 null
3. 元字符
普通字符:
大多数的字符仅能够描述它们本身,这些字符称作普通字符,例如所有的字母和数字。
也就是说普通字符只能够匹配字符串中与它们相同的字符。
元字符(特殊字符)
是一些具有特殊含义的字符,可以极大提高了灵活性和强大的匹配功能。
比如,规定用户只能输入英文26个英文字母,普通字符的话 abcdefghijklm.....
但是换成元字符写法: [a-z]
参考文档:
MDN:https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Guide/Regular_expressions
正则测试工具: http://tool.oschina.net/regex
1.边界符
正则表达式中的边界符(位置符)用来提示字符所处的位置,主要有两个字符
^ 表示匹配行首的文本(以谁开始)
console.log(/^a/.test('a')) // true console.log(/^a/.test('ab')) // true
$ 表示匹配行尾的文本(以谁结束)
console.log(/a$/.test('a')) // true console.log(/a$/.test('ab')) // false
如果 ^ 和 $ 在一起,表示必须是精确匹配
console.log(/^a$/.test('a')) // true console.log(/^a$/.test('ab')) // false console.log(/^a$/.test('aa')) // false
2.量词
量词用来 设定某个模式出现的次数
* 重复零次或更多次
console.log(/^a*$/.test('')) // true console.log(/^a*$/.test('a')) // true console.log(/^a*$/.test('aa')) // true
+ 重复一次或更多次
console.log(/^a+$/.test('')) // false console.log(/^a+$/.test('a')) // true console.log(/^a+$/.test('aa')) // true
? 重复零次或一次
console.log(/^a?$/.test('')) // true console.log(/^a?$/.test('a')) // true console.log(/^a?$/.test('aa')) // false
{n} 重复n次
console.log(/^a{2}$/.test('')) // false console.log(/^a{2}$/.test('a')) // false console.log(/^a{2}$/.test('aa')) // true
{n,} 重复n次或更多次
console.log(/^a{2,}$/.test('')) // false console.log(/^a{2,}$/.test('a')) // false console.log(/^a{2,}$/.test('aa')) // true console.log(/^a{2,}$/.test('aaa')) // true console.log(/^a{2,}$/.test('aaaa')) // true
{n,m} 重复n到m次
console.log(/^a{2,4}$/.test('')) // false console.log(/^a{2,4}$/.test('a')) // false console.log(/^a{2,4}$/.test('aa')) // true console.log(/^a{2,4}$/.test('aaa')) // true console.log(/^a{2,4}$/.test('aaaa')) // true console.log(/^a{2,4}$/.test('aaaaa')) // false console.log(/^a{2,4}$/.test('aaaaaa')) // false
注意:逗号左右两侧千万不要出现空格
3.字符类:
[ ] 匹配字符集合
后面的字符串只要包含 abc 中任意一个字符,都返回 true 。
// 只要中括号里面的任意字符出现都返回为true console.log(/[abc]/.test('andy')) // true console.log(/[abc]/.test('baby')) // true console.log(/[abc]/.test('cry')) // true console.log(/[abc]/.test('die')) // false
[ ] 里面加上- 连字符
使用连字符 - 表示一个范围
console.log(/^[a-z]$/.test('c')) // true
比如:
[a-z] 表示 a 到 z 26个英文字母都可以
[a-zA-Z] 表示大小写都可以
[0-9] 表示 0~9 的数字都可以
[ ] 里面加上 ^ 取反符号
比如:
console.log(/[a-z]/.test('a')) // true console.log(/[^a-z]/.test('a')) // false
[^a-z] 匹配除了小写字母以外的字符
注意要写到中括号里面
. 匹配除换行符之外的任何单个字符
console.log(/./.test('a')) // true console.log(/./.test('\n')) // false
预定义: 指的是 某些常见模式的简写方式
\d 匹配0-9之间的任一数字,相当于[0-9]
\D 匹配所有0-9以外的字符,相当于 [^0-9]
\w 匹配任意的字母、数字和下划线,相当于[A-Za-z0-9 ]
\W 除所有字母、数字和下划线以外的字符,相当于 [^A-Za-z0-9_]
\s 匹配空格(包括换行符、制表符、空格符等),相等于[\t\r\n\v\f]
\S 匹配非空格的字符,相当于[^\t\r\n\v\f]
日期格式:^\d{4}-\d{1,2}-\d{1,2}
4. 修饰符
修饰符约束正则执行的某些细节行为,如是否区分大小写、是否支持多行匹配等
语法:
/表达式/修饰符
i 是单词 ignore 的缩写,正则匹配时字母不区分大小写
g 是单词 global 的缩写,匹配所有满足正则表达式的结果
console.log(/a/i.test('a')) // true console.log(/a/i.test('A')) // true
替换 replace 替换
语法:
字符串.replace(/正则表达式/, '替换的文本')