正则表达式r”[^\w\d’\s]+”的含义是匹配一个或多个非单词字符、非数字、非单引号和非空白符的连续序列。
这个正则表达式由几个关键部分组成,具体解释如下:
[]:方括号用于定义一个字符类,即匹配方括号内的任意一个字符。
^:在字符类的开头使用,表示取反,即匹配不在方括号内指定的字符集中的任何字符。
\w:匹配任何单词字符,相当于[a-zA-Z0-9_]。
\d:匹配任何数字字符,相当于[0-9]。
‘:匹配单引号字符。
\s:匹配任何空白字符,包括空格、制表符和换行符等。
+:匹配前面的子表达式一次或多次。在这个正则表达式中,它意味着匹配一个或多个连续的非单词字符、非数字、非单引号和非空白符。
正则表达式r'([,.:;?!”()\’]|–|\s)’用于匹配逗号、句点、冒号、分号、问号、下划线、感叹号、双引号、单引号、括号、连字符(包括单个和连续两个)以及任何空白符。 这个正则表达式由几个关键部分组成,具体解释如下: []:方括号用于定义一个字符类,即匹配方括号内的任意一个字符。 ,.:;?!”:在字符类中列出了多个标点符号,这些符号将被直接匹配。
():圆括号用于分组,使得其中的内容作为一个整体进行匹配。
‘:匹配单引号字符。
–:匹配两个连续的连字符。
\s:匹配任何空白字符,包括空格、制表符和换行符等。
|:逻辑或操作符,表示前后两部分中的任意一部分都可以匹配。
+:匹配前面的子表达式一次或多次。在这个正则表达式中,它意味着匹配一个或多个连续的指定字符。