In [None]:
import re
text='我的电话是13812345678，邮箱是abc@example.com。'
m=re.search(r'\d{11}',text)
print(m)
eamils= re.findall(r'[\w.-]+@[\w.-]+\.\w+', text)
print(eamils)
masked = re.sub(r'(\d{3})\d{4}(\d{4})', r'\1****\2', text)
print(masked)
word=re.search(r'\bcom\b',text)
print(word.group())

In [1]:
import re

# re.compile()
# 函数用于编译正则表达式，返回一个正则表达式对象。
# 预编译提高效率，提前编译好正则表达式，可以提高匹配效率。
pattern=re.compile(r'\d{3}-\d{3}-\d{4}')
# .findall() 方法用于查找字符串中所有匹配正则表达式的子串，并返回一个列表。
pattern.findall('Tel: 123-456-7890, 021-123-4567')

['123-456-7890', '021-123-4567']

# 正则表达式语法指南

## 1. 基本匹配
| 语法       | 说明                     | 示例                     |
|------------|--------------------------|--------------------------|
| `abc`      | 匹配普通字符 "abc"       | `"abc"` → 匹配 `"abc"`   |
| `[abc]`    | 匹配 `a`、`b` 或 `c`     | `"[abc]"` → 匹配 `"a"`、`"b"`、`"c"` |
| `[^abc]`   | 匹配**非** `a`、`b`、`c` | `"[^abc]"` → 匹配 `"d"`、`"1"` 等 |
| `[a-z]`    | 匹配小写字母 `a` 到 `z`  | `"[a-z]"` → 匹配 `"a"`、`"b"`...`"z"` |
| `.`        | 匹配**任意单个字符**（除换行符 `\n`） | `"a.c"` → 匹配 `"abc"`、`"a1c"` 等 |

## 2. 元字符（特殊字符）
| 语法  | 说明                     | 示例                     |
|-------|--------------------------|--------------------------|
| `\d`  | 匹配数字 `[0-9]`         | `"\d"` → 匹配 `"1"`、`"2"` 等 |
| `\D`  | 匹配**非**数字 `[^0-9]`  | `"\D"` → 匹配 `"a"`、`" "` 等 |
| `\w`  | 匹配单词字符 `[a-zA-Z0-9_]` | `"\w"` → 匹配 `"a"`、`"1"`、`"_"` |
| `\W`  | 匹配**非**单词字符 `[^\w]` | `"\W"` → 匹配 `" "`、`"@"` 等 |
| `\s`  | 匹配空白字符（空格、`\t`、`\n` 等） | `"\s"` → 匹配 `" "`、`"\n"` |
| `\S`  | 匹配**非**空白字符 `[^\s]` | `"\S"` → 匹配 `"a"`、`"1"` 等 |

## 3. 量词（匹配次数）
| 语法    | 说明                     | 示例                     |
|---------|--------------------------|--------------------------|
| `*`     | 匹配 `0` 次或多次        | `"a*"` → 匹配 `""`、`"a"`、`"aaa"` |
| `+`     | 匹配 `1` 次或多次        | `"a+"` → 匹配 `"a"`、`"aaa"`（不匹配 `""`） |
| `?`     | 匹配 `0` 或 `1` 次       | `"a?"` → 匹配 `""` 或 `"a"` |
| `{n}`   | 匹配**恰好 `n` 次**      | `"a{3}"` → 匹配 `"aaa"` |
| `{n,}`  | 匹配**至少 `n` 次**      | `"a{2,}"` → 匹配 `"aa"`、`"aaa"`... |

## 4. 分组与捕获
| 语法         | 说明                     | 示例                     |
|--------------|--------------------------|--------------------------|
| `(abc)`      | **捕获分组**，匹配并记住 `"abc"` | `"(ab)+"` → 匹配 `"abab"`，分组捕获 `"ab"` |
| `(?:abc)`    | **非捕获分组**，仅匹配不记住 | `"(?:ab)+"` → 匹配 `"abab"`，但不捕获 |
| `\|`         | **或**逻辑               | `"a\|b"` → 匹配 `"a"` 或 `"b"` |

## 5. 边界匹配（断言）
| 语法   | 说明                     | 示例                     |
|--------|--------------------------|--------------------------|
| `^`    | 匹配字符串**开头**       | `"^abc"` → 匹配 `"abc123"` 但不匹配 `"123abc"` |
| `$`    | 匹配字符串**结尾**       | `"abc$"` → 匹配 `"123abc"` 但不匹配 `"abc123"` |
| `(?=abc)` | **正向先行断言**，后面必须跟 `"abc"` | `"a(?=bc)"` → 匹配 `"a"` 仅当后面是 `"bc"` |

## 6. 修饰符（模式标志）
| 修饰符 | 说明                     | 示例（Python）           |
|--------|--------------------------|--------------------------|
| `i`    | 忽略大小写               | `re.compile("abc", re.I)` |
| `m`    | 多行模式（`^` 和 `$` 匹配每行） | `re.compile("^abc", re.M)` |

## 7. 常用正则示例
- 邮箱：`\w+@\w+\.\w+`
- URL：`https?://[^\s]+`
- 日期（YYYY-MM-DD）：`\d{4}-\d{2}-\d{2}`

## 8. 在线测试工具
- [Regex101](https://regex101.com/) **(在线测试)**
- [RegExr](https://regexr.com/) **(交互式学习)**

In [None]:
print([x for x in range(10) if x % 2 == 0 if x % 3 == 0])