当前位置: 首页 > news >正文

python常用的正则表达式及作用

Python常用正则表达式及作用

正则表达式是处理字符串的强大工具,Python通过re模块提供正则表达式支持:

基本匹配模式

  1. 匹配数字

    • \d:匹配任意数字,等价于[0-9]
    • \D:匹配任意非数字,等价于[^0-9]
    • 示例:r'\d+'匹配一个或多个连续数字
  2. 匹配字母和数字

    • \w:匹配字母、数字或下划线,等价于[a-zA-Z0-9_]
    • \W:匹配非字母、数字、下划线,等价于[^a-zA-Z0-9_]
  3. 匹配空白字符

    • \s:匹配任意空白字符(空格、制表符、换行等)
    • \S:匹配任意非空白字符
  4. 匹配任意字符

    • .:匹配除换行符外的任意单个字符

常用正则表达式示例

  1. 匹配邮箱地址

    r'[\w\.-]+@[\w\.-]+\.\w+'
    
  2. 匹配URL

    r'https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+'
    
  3. 匹配IP地址

    r'\b(?:\d{1,3}\.){3}\d{1,3}\b'
    
  4. 匹配中文

    r'[\u4e00-\u9fa5]'
    
  5. 匹配日期(YYYY-MM-DD格式)

    r'\d{4}-\d{1,2}-\d{1,2}'
    
  6. 匹配手机号码(中国大陆)

    r'1[3-9]\d{9}'
    
  7. 匹配HTML标签

    r'<[^>]+>'
    
  8. 匹配身份证号(18位)

    r'[1-9]\d{5}(18|19|20)\d{2}(0[1-9]|1[0-2])(0[1-9]|[12]\d|3[01])\d{3}[\dXx]'
    

常用量词

  1. *:匹配前一个字符0次或多次
  2. +:匹配前一个字符1次或多次
  3. ?:匹配前一个字符0次或1次
  4. {n}:匹配前一个字符恰好n次
  5. {n,}:匹配前一个字符至少n次
  6. {n,m}:匹配前一个字符n到m次

边界匹配

  1. ^:匹配字符串开头
  2. $:匹配字符串结尾
  3. \b:匹配单词边界
  4. \B:匹配非单词边界

分组和捕获

  1. ():创建捕获组
  2. (?:):创建非捕获组
  3. (?P<name>):命名捕获组

常用re模块方法

  1. re.match():从字符串开头匹配
  2. re.search():搜索整个字符串
  3. re.findall():返回所有匹配结果
  4. re.finditer():返回匹配结果的迭代器
  5. re.sub():替换匹配的字符串
  6. re.split():根据模式分割字符串

示例代码

import re# 查找所有数字
text = "我有3个苹果和5个橙子"
numbers = re.findall(r'\d+', text)  # ['3', '5']# 验证邮箱格式
email = "test@example.com"
if re.match(r'[\w\.-]+@[\w\.-]+\.\w+', email):print("邮箱格式正确")# 提取URL
html = '<a href="https://www.example.com">链接</a>'
url = re.search(r'href="(https?://[^"]+)"', html).group(1)
http://www.lqws.cn/news/494497.html

相关文章:

  • 编程江湖-正则表达式
  • vue3 el-table row-class-name 行字体颜色失效
  • Spring Cloud微服务
  • MM-AttacKG:一种使用大型语言模型构建攻击图的多模态方法
  • GitLab 17.8 备份秘籍:快速获取纯 Git 仓库与核心配置
  • 兆瓦闪充技术革命:解码新能源汽车补能赛道的技术跃迁与从业机会图谱
  • 60天python训练计划----day56
  • 左神算法之二叉树的个数
  • 数据标注师学习内容
  • Domain 层完全指南(面向 iOS 开发者)
  • 【数据结构初阶】--顺序表(一)
  • FPGA基础 -- Verilog 验证平台
  • 《哈希表》K倍区间(解题报告)
  • 论文略读:ASurvey on Intent-aware Recommender Systems
  • 13-MCP4725-带 EEPROM 存储器的 12 位数模转换器
  • DeepSeek中的提示库及其用法示例
  • AI编程再突破,文心快码发布行业首个多模态、多智能体协同AI IDE
  • leetcode543-二叉树的直径
  • Flink SQL执行流程深度剖析:从SQL语句到分布式执行
  • 【Linux学习笔记】进程间通信之共享内存
  • Kimi“新PPT助手” ,Kimi全新自研的免费AI生成PPT助手
  • 金融行业B端系统布局实战:风险管控与数据可视化的定制方案
  • 深入理解PHP中的面向对象编程
  • 电脑的虚拟内存对性能影响大吗
  • FPGA基础 -- Verilog 竞争/竞态(Race Condition)
  • ubuntu安装postman教程并中文汉化详细教程
  • Anaconda虚拟环境
  • flutter TabBar左边间隔问题
  • 【android bluetooth 框架分析 04】【bt-framework 层详解 8】【DeviceProperties介绍】
  • Java数据结构第二十四期:探秘 AVL 树,当二叉搜索树学会 “自我调节”