服务器之家:专注于服务器技术及软件下载分享
分类导航

PHP教程|ASP.NET教程|Java教程|ASP教程|编程技术|正则表达式|C/C++|IOS|C#|Swift|Android|VB|R语言|JavaScript|易语言|vb.net|

服务器之家 - 编程语言 - 正则表达式 - 正则表达式u修饰符(支持UTF-16编码)

正则表达式u修饰符(支持UTF-16编码)

2020-08-25 15:09antzone 正则表达式

这篇文章主要介绍了正则表达式u修饰符(支持UTF-16编码),需要的朋友可以参考下

正则表达式u修饰符:

此修饰符标识能够正确处理大于\uFFFF的Unicode字符。
也就是说,会正确处理四个字节的UTF-16编码。
此修饰符是ES2015新增,更多正则表达式新特性可以参阅ES2015 正则表达式新增特性一章节。
更多正则表达式教程可以参阅正则表达式教程板块。

代码实例:

?
1
console.log(/^\uD842/u.test("\uD842\uDFB7"))

输出false,由于"\uD842\uDFB7"是一个四个字节的UTF-16编码,代表一个字符,所以如果正则表达式带有u修饰符,那么就能够识别它。

?
1
console.log(/^\uD842/.test("\uD842\uDFB7"))

输出true;不加u修饰符,那么就无法将四个字节的UTF-16编码识别为一个字符,所以就可以产生匹配。

?
1
2
/^.$/.test("\uD842\uDFB7")//false
/^.$/u.test("\uD842\uDFB7")//true

关于元字符点(.)的用法可以参阅正则表达式.号元字符一章节。

?
1
2
/^.$/.test("\uD842\uDFB7")//false
/^.$/u.test("\uD842\uDFB7")//true

添加u修饰符之后,点元字符就可以匹配码点大于0xFFFF的Unicode字符。

?
1
2
/ \u{61} /.test("a")//false
/ \u{61} / u.test("a")//true

使用u修饰符,正则表达式能够识别大括号{}表示的Unicode字符,否则无法识别,{61}也会被解读为量词,表示61个u字符。
关于大括号表示的Unicode字符可以参阅ES2015 字符串新增特性一章节。

延伸 · 阅读

精彩推荐