2022年3月5日

Python: re.sub使用lambda函数作为参数

import re word_string = """ <head>iph</head> """ regular = "<.*?>((\w*)(<.*?>))" result = re.sub(regular, lambda x:x.group(2), word_string) print(result) 运行 […]
2022年3月5日

正则表达式中(?:pattern)、(?=pattern)、(?!pattern)、(?<=pattern)和(?<!pattern)

正则表达式的匹配原理可以参考这篇文章:https://blog.csdn.net/lxcnn/article/details/4304651 (?:pattern)# ()表示捕获分组,()会把每个分组里的匹配的值保存起来,从左向右,以分组的左括号为标志,第一个出现的分组的组号为1,第二个为2,以此类推 (?:)表示非捕获分组,和捕获分组唯一的区别在于,非捕 […]
2022年3月5日

正则表达式不包含特定字符串

概述 做日志分析工作的经常需要跟成千上万的日志条目打交道,为了在庞大的数据量中找到特定模式的数据,常常需要编写很多复杂的正则表达式。例如枚举出日志文件中不包含某个特定字符串的条目,找出不以某个特定字符串打头的条目,等等。 使用否定式前瞻 正则表达式中有前瞻(Lookahead)和后顾(Lookbehind)的概念,这两个术语非常形象的描述了正则引擎的匹配行为 […]
2022年3月5日

正则表达式匹配任意字符(包括换行符)

正则表达式中,“.”(点符号)匹配的是除了换行符“\n”以外的所有字符,但有时候我们需要匹配包括换行符在内的字符。 手册上还有一句话:要匹配包括 '\n' 在内的任何字符,请使用像 '[.\n]' 的模式,但是发现[.\n]*不可以。 经查,发现了几种正则表达式匹配任意字符(包括换行符)的方法: [\s\S]* [\d\D]* [\w\W]* 另外,[.\s […]
2022年3月1日

正则表达式 Regular Expression Language - Quick Reference

https://docs.microsoft.com/en-us/dotnet/standard/base-types/regular-expression-language-quick-reference A regular expression is a pattern that the regular expression engine attempt […]
2022年1月31日

正则表达式手册/常用正则表达式

正则表达式手册 字符 描述 \ 将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如,“n”匹配字符“n”。“\n”匹配一个换行符。串行“\\”匹配“\”而“\(”则匹配“(”。 ^ 匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性,^也匹配“\n”或“\r”之后的位置。 $ 匹配输入字符串的结 […]
ajax-loader