disgare 的博客
首页
博客
分类
标签
首页
博客
分类
标签
  • 网络

    • 计算机网络学习笔记
    • 网络安全相关
    • 域名和子网掩码
    • CORS 跨域资源共享
    • DNS、HTTP 与 HTTPS
    • Server-Sent Events (SSE)
    • WebSocket 长连接
  • 计算机基础

    • 操作系统 IO 相关知识
    • 操作系统学习笔记
    • 程序的机器级表示
    • 音频文件基础
    • 正则表达式相关概念
      • 元字符
      • 正则表达式语法
        • 基础概念
        • \ 可以配合很多字符代表特殊含义
        • 空白字符
        • [] 使用多个字符表示一个字符
        • {}、*、+、? 匹配前面的字符多次
        • () 子表达式
      • windows 和 linux 下读取文件换行符的不同
      • 为什么 java 中匹配一个反斜杠要用四个反斜杠
      • 常用网站
    • ffmpeg 的安装以及实现音频切分功能
    • Hex 和 Base64 编码
    • XML 的使用
  • 数据结构与算法

    • 动态规划算法学习笔记
    • 基于比较的排序算法的最坏情况下的最优下界为什么是O(nlogn)
    • 集合与数据结构学习笔记
    • 面试常见算法总结
    • 算法导论第二部分排序学习笔记
    • 算法导论第一部分学习笔记
  • Java

    • 对象之间的映射与转换
    • 反射学习笔记
    • 泛型相关概念
    • 关于 boolean 类型的坑
    • 如何使用 lambda 表达式实现排序
    • CompletableFuture 相关用法
    • CompletableFuture 源码浅要阅读
    • FutureTask 源码阅读
    • Guava 常用 API
    • Guava 源码阅读:Multimap 相关
    • Jackson 的各种使用
    • Java 的 Excel 相关操作
    • java 的常见性能问题分析以及出现场景
    • java 基础知识
    • JAVA 枚举的基础和原理
    • Java 图片文件上传下载处理
    • Java 序列化
    • Java 异常
    • Java 语法糖
    • Java 中关于字符串处理的常用方法
    • Java 中强、软、弱、虚引用
    • JAVA 注解小结
    • Java Http 访问框架
    • Java Stream 的使用
    • Java8 新特性
    • netty 学习笔记
    • Scanner 的各种用法
    • Servlet 学习笔记
    • String、StringBuffer、StringBuilder 学习笔记
  • JVM

    • 虚拟机执行子系统
    • JVM 自动内存管理
    • Linux 中 JVM 常用工具以及常见问题解决思路
  • Linux

    • crontab 表达式
    • Linux 常见命令
    • Linux 文件系统
  • 中间件

    • 关于定时任务原理
    • 详解 kafka
    • ES 搜索引擎
    • flink 提交流程
    • Grape-RAG
    • Hadoop 基础原理
  • 多线程

    • 多线程基础学习笔记
    • 简单了解并发集合
    • 如何手写单例
    • 深入理解 java 多线程安全
    • 生产者消费者问题
    • 线程池作用、用法以及原理
    • AQS 组件
    • ThreadLocal 原理以及使用
  • 非关系型数据库

    • Redis 集群
    • Redis 数据结构、对象与数据库
    • Redis 学习笔记
  • 关系型数据库

    • B+ 树的插入、删除和数据页分裂机制
    • MySQL 的 binglog、redolog、undolog
    • MySQL 的记录存储结构、存储引擎与 Buffer Pool
    • MySQL 基本的特性
    • MySQL 开发规范
    • MySQL 事务与锁与 MVCC
    • MySQL 数据类型、字符集相关内容
    • MySQL 索引与索引优化
    • PostgreSQL 更新数据时 HOT优化
    • PostgreSQL 相关用法
  • Python

    • Python 基础语法
    • Python 学习
  • Spring 项目

    • Lombok 的常用注解
    • maven 小结
    • MyBatis 框架的使用
    • MyBatis 重要知识点总结
    • MybatisPlus 的使用
    • Spring 框架基础使用
    • Spring 事务相关
    • Spring IOC 的原理及源码
    • Spring AOP 的使用和原理
    • SpringBoot 的原理
    • SpringBoot 基础使用
    • SpringWeb 重要知识点
  • 分布式

    • 初步了解 docker
    • 从 ACID 到 BASE 事务处理的实现
    • 访问远程服务
    • 分布式 id
    • 分布式缓存相关问题
    • 分布式集群理论和分布式事务协议
    • 分布式架构的观测
    • 分布式一致性算法
    • 负载均衡 Load Balancing
    • 关于分布式系统 RPC 中高可用功能的实现
    • 集群间数据同步的目的
    • 三高问题下的系统优化
    • 数据库分库分表
    • 详解 Spring Cloud
    • Dubbo 基础概念
    • Gossip 协议
    • nginx 学习笔记
    • Protobuf 通信协议
    • Zookeeper 基础学习
  • 架构设计

    • 参数校验与异常处理
    • 抽象方法与设计模式
    • 代码整洁之道
    • 权限系统设计
    • 用低内存处理大量数据
    • 设计模式——策略模式
    • 设计模式——过滤器模式在 Spring 中的实践
    • 状态模式
    • 统一结果返回
    • 为什么要打日志?怎么打日志?打什么日志?
    • 运维监控常见指标含义
    • 资深研发进阶
    • DDD 架构学习笔记
    • Java 常用的规则引擎
    • MVC 架构学习笔记
  • AI

    • 如何编写 Prompt
    • Agent 工程架构
    • LLM 相关内容
    • NLP 相关知识
    • vibe coding 最佳实践
    • windows 下 ollama 迁移到 D 盘
  • 开发工具

    • 如何画时序图、流程图、状态流转图
    • excel 关于 =vlookup 的用法
    • git 的学习以及使用
    • IDEA 插件推荐
    • IDEA 常用快捷键以及调试
    • Shell 脚本
    • swagger 的使用
  • 前端

    • 简单了解前端页面开发
    • 伪静态是什么
    • GitHub Pages 部署教程
    • Vercel 部署教程
    • vue-admin-template 简单使用
    • VuePress 博客搭建指南
  • 项目

    • 面试刷题网——技术方案
    • 影视资源聚合站——技术方案
  • 问题记录

    • 定时任务单线程消费 redis 中数据导致消费能力不足
    • 提供可传递的易受攻击的依赖项
    • Liteflow 在 SpringBoot 启动时无法注入组件问题 couldn‘t find chain with the id[THEN(NodeComponent)]
  • 金融

    • 股票分析——关于电力
    • 股票技术面——量价关系
    • 股票技术面——盘口
    • 股票技术面——基础
    • 基础的金融知识
    • 基金与股票
    • 韭菜的自我总结
    • 聊聊价值投资
  • 其他

    • 程序员职场工作需要注意什么
    • 创业全链路SOP:从灵光一现到系统化增长的实战指南
    • 观罗翔讲刑法随笔
    • 价格和价值
    • 立直麻将牌效益理论
    • 梅花易数学习笔记
    • 压力管理
2022-08-16
计算机基础
目录

正则表达式相关概念

# 元字符

正则表达式语言由两种基本字符类型组成:原义(正常)文本字符和元字符。元字符使正则表达式具有处理能力。所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式

以上出自百度百科,通俗点说就是拥有一些特殊能力的字符,普通的字符比如 a 就表示 a,元字符.可以表示任意字符

# 正则表达式语法

# 基础概念

  • ^ 表示匹配输入字符串的开始位置
  • $ 表示匹配输入字符串的结束位置
  • \ 可以与下一个字符一起组成元字符,比如 \r 表示回车,\n 表示换行
  • . 可以匹配任何字符,hell. 匹配 hello,^hell.$ 也匹配 hello

关于 ^ 表示匹配输入字符串的开始位置与 $ 表示匹配输入字符串的结束位置,这两个符号到底有什么用呢,为什么要用 ^abc$ 来表示 abc 呢?因为有些情况下需要使用到字符串的最前与最末的位置,比如在字符串的最前面加东西,在这种情况下我们就可以直接使用 ^ 来处理了

举个例子,使用 notepad++ 来转换 sql 语句,我们可以这样写 image-2026-01-31-20-56-28.png

# \ 可以配合很多字符代表特殊含义

  • \d 匹配一个数字字符,可以表示0到9中任意一个数字
  • \D 匹配一个非数字字符
  • \s 匹配所有的空白字符,包括空格、制表符、换页符、换行符、回车符等等
  • \S 匹配所有的非空白字符
  • \w 匹配所有的数字、字母以及下划线
  • \W 除了 \w 匹配到的内容其他的字符都能匹配到
  • \. 表示普通的 .
  • \ 表示 \

# 空白字符

  • \f 换页符
  • \n 换行符
  • \r 回车符

这里说一下换行与回车的区别

换行符就是另起一新行,光标在新行的开头;回车符就是光标回到一旧行的开头(即光标目前所在的行为旧行)

也就是说键盘上的回车键是用来进行实现换行的

# [] 使用多个字符表示一个字符

使用 [] 来表示任意字符,[] 代表一个字符集合,可以匹配所包含的任意一个字符,注意只能匹配一个

比如 [abc] 可以匹配 a 或者 b 或者 c

在 [] 中加入 ^ 可以匹配未包含的任意字符,比如 [ ^abc ] 匹配除了 abc 的任意一个字符

在 [] 中加入 - 匹配指定范围内的任意字符,这个指定范围使用 ASCII 码来判断,比如 [ a-z ],表示匹配 a 到 z 中的任意一个字符

在 [] 中的 . 表示普通的 .

[] 可以被看成一个字符

# {}、*、+、? 匹配前面的字符多次

前面使用到了中括号,这里可以使用大括号

  • *表示匹配前面的表达式任意次
  • +表示匹配前面的表达式一次或多次(大于等于1次)
  • ?表示匹配前面的表达式零次或一次
  • {n},n必须是一个非负整数,该表达式意思时匹配前面的表达式确定的n次例如,“o{2}”不能匹配“Bob”中的“o”,但是能匹配“food”中的两个o
  • {n,} n是一个非负整数。至少匹配n次
  • {n,m} m和n均为非负整数,其中n<=m。最少匹配n次且最多匹配m次。可以写成 {n,} 或者 {,m} 形式,表示至少匹配n次以及至多匹配m次

配合前面的 [],正则表达式就有操作空间了,比如 [a-z]*,可以匹配 abcabcabc

# () 子表达式

中括号和大括号都出现了,怎么能少的了小括号

使用 () 定义一个子表达式。子表达式的内容可以当成一个独立元素,即可以将它看成一个字符,可以在 () 中使用元字符

这么做有什么好处?比如(ab){2,}可以匹配ababab

# windows 和 linux 下读取文件换行符的不同

windows 和 linux 下对换行符处理不同

使用 Windows 系统时,程序用 enter 换行,真正朝文件中写的是 \r\n(0x0d0x0a) ,同时读取时程序真正读取的是 \n

使用 Linux 系统时,程序用 enter 换行,真正朝文件中写的是 \n(0x0a) ,同时读取时程序真正读取的是 \n

因此,有些正则表达式或者程序在 win 中可以正常运行,在 Linux 下却不能

# 为什么 java 中匹配一个反斜杠要用四个反斜杠

首先我们知道在正则表达式中 \ 代表转义,而 java 中 \ 也代表转义(一些字母前加 \ 来表示常见的那些不能显示的 ASCII 字符,如 \0,\t,\n 等,就称为转义字符)

如果在其他语言中使用过正则表达式,那你就立刻能发现 Java 对反斜线 \ 的不同处理。在其他语言中,\ 表示我想要在正则表达式中插入一个普通的反斜线,请不要给他任何特殊的意义。而在Java中 \ 的意思是我要插入一个正则表达式的反斜线,所以其后的字符具有特殊的意义。例如,如果你想表示一位数字,那么正则表达式应该是 \d。如果你想插入一个普通的反斜线,则应该这样用 \,不过换行和制表符之类的东西只需使用单反斜线 \n\t

在 java 中,先由 java 解释器解释字符串,然后再由正则表达式解释器解释正则表达式

# 常用网站

正则表达式在线测试以及常用正则表达式查询链接: 常用正则表达式 (opens new window)

可视化理解正则链接: 可视化理解正则 (opens new window)

#正则表达式
最后更新: 1/31/2026, 1:15:24 PM
音频文件基础
ffmpeg 的安装以及实现音频切分功能

← 音频文件基础 ffmpeg 的安装以及实现音频切分功能→

最近更新
01
vibe coding 最佳实践
02-24
02
立直麻将牌效益理论
02-23
03
伪静态是什么
02-08
更多文章>
Theme by Vdoing
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式