参考资料

  1. XPath 轴(Axes)
  2. XPath 有七种类型的节点
  3. XPath 选取节点
  4. XPath Helper 介绍
  5. xpath中的节点有多重类型不包括
  6. XPath 节点关系
  7. XPath 选取未知节点
  8. xpath多个相同元素怎么定位

正则表达式语法速查

  1. 基本匹配
    . 匹配任意单个字符(除换行符)
    \w 匹配字母、数字或下划线 [a-zA-Z0-9_]
    \W 匹配非字母、数字、下划线
    \d 匹配数字 [0-9]
    \D 匹配非数字
    \s 匹配空白字符(空格、制表符等)
    \S 匹配非空白字符

  2. 字符类
    [abc] 匹配a、b或c
    [^abc] 匹配非a、b、c的字符
    [a-z] 匹配a到z的小写字母
    [A-Z] 匹配A到Z的大写字母
    [0-9] 匹配0到9的数字

  3. 量词

  • 匹配0次或多次

  • 匹配1次或多次
    ? 匹配0次或1次
    {n} 匹配恰好n次
    {n,} 匹配至少n次
    {n,m} 匹配n到m次

  1. 位置锚点
    ^ 匹配字符串开始
    $ 匹配字符串结束
    \b 匹配单词边界
    \B 匹配非单词边界

  2. 分组与捕获
    (exp) 匹配exp并捕获到自动命名的组
    (?

  3. 特殊字符转义
    . 匹配点号
    \ 匹配反斜杠
    * 匹配星号
    + 匹配加号
    ? 匹配问号

  4. 选择与断言
    a|b 匹配a或b
    (?=exp) 正向先行断言
    (?!exp) 负向先行断言
    (?<=exp) 正向后行断言
    (?<!exp) 负向后行断言

  5. 修饰符
    i 不区分大小写
    g 全局匹配
    m 多行模式
    s 使.匹配包括换行符