## 正则表达式

`re.findall('正则表达式', a)`

In [1]:
import re

a = 'C|C++|Java|C#|Python|Javascript'

print(a.index('Python') > -1)
print('Python' in a)

result = re.findall('Python', a)
if(result):
    print(result)
else:
    print(None)


True
True
['Python']


In [2]:
b = 'C2|3C3+87+9|Jav0al9C#|Pyt80hon80|0Ja8v0a8sc980r0i0p-t'

result = re.findall('\d', b)
print(result)
result = re.findall('\D', b)
print(result)


['2', '3', '3', '8', '7', '9', '0', '9', '8', '0', '8', '0', '0', '8', '0', '8', '9', '8', '0', '0', '0']
['C', '|', 'C', '+', '+', '|', 'J', 'a', 'v', 'a', 'l', 'C', '#', '|', 'P', 'y', 't', 'h', 'o', 'n', '|', 'J', 'a', 'v', 'a', 's', 'c', 'r', 'i', 'p', '-', 't']


In [3]:
# 匹配中间是c|f|d的单词

s = 'abc,acc,adc,aec,afc,ahc'
result = re.findall('a[cfd]c', s)
print(result)

result = re.findall('a[^cfd]c', s)
print(result)

result = re.findall('a[c-d]c', s)
print(result)


['acc', 'adc', 'afc']
['abc', 'aec', 'ahc']
['acc', 'adc']


默认贪婪匹配，后面加问号（零次或一次），惰性匹配。

`?` 匹配0到1次

`+` 匹配1到无限次

`*` 匹配0到无限次

In [4]:
a = 'C|C++|Java|C#|Python|Javascript'
result = re.findall('\w{1,}', a)
print(result)

result = re.findall('\w+', a)
print(result)

result = re.findall('(\w+)?', a)
print(result)

result = re.findall('[Java]\w*', a)
print(result)

result = re.findall('^C.*t$', a)
print(result)


['C', 'C', 'Java', 'C', 'Python', 'Javascript']
['C', 'C', 'Java', 'C', 'Python', 'Javascript']
['C', '', 'C', '', '', '', 'Java', '', 'C', '', '', 'Python', '', 'Javascript', '']
['Java', 'Javascript']
['C|C++|Java|C#|Python|Javascript']


In [5]:
a = 'C|C++|Java|C#|Python|Python|Python|af'

result = re.findall('(Python){1,3}', a)
print(result)


['Python', 'Python', 'Python']


### 匹配模式

flags : 可选，表示匹配模式，比如忽略大小写，多行模式等，具体参数为：

1. re.I 忽略大小写
2. re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
3. re.M 多行模式
4. re.S 即为 . 并且包括换行符在内的任意字符（. 不包括换行符）
5. re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库
6. re.X 为了增加可读性，忽略空格和 # 后面的注释

`re.findall('正则表达式', <字符串>, 匹配模式)`

In [6]:
import re
a = 'C|C++|Java|C#\n|Python|Python|Python|a\nf'

result = re.findall('c#.{1}', a, re.I | re.S)
print(result)


def convert(value):
    print(value)
    matched = value.group()
    return ' '+matched+' '


result = re.sub('python', convert, a, 0, re.I)
print(result)


['C#\n']
<re.Match object; span=(15, 21), match='Python'>
<re.Match object; span=(22, 28), match='Python'>
<re.Match object; span=(29, 35), match='Python'>
C|C++|Java|C#
| Python | Python | Python |a
f


`re.match(pattern, string, flags=0)`

`re.search(pattern, string, flags=0)`

re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None；而re.search匹配整个字符串，直到找到一个匹配。

`re.sub(pattern, repl, string, count=0, flags=0)`
参数：

- pattern : 正则中的模式字符串。
- repl : 替换的字符串，也可为一个函数。
- string : 要被查找替换的原始字符串。
- count : 模式匹配后替换的最大次数，默认 0 表示替换所有的匹配。

compile 函数用于编译正则表达式，生成一个正则表达式（ Pattern ）对象，供 match() 和 search() 这两个函数使用。

`re.compile(pattern[, flags])`

`findall(string[, pos[, endpos]])`

和 findall 类似，在字符串中找到正则表达式所匹配的所有子串，并把它们作为一个迭代器返回。

`re.finditer(pattern, string, flags=0)`

split 方法按照能够匹配的子串将字符串分割后返回列表，它的使用形式如下：

`re.split(pattern, string[, maxsplit=0, flags=0])`

#### re.RegexObject
`re.compile()` 返回 RegexObject 对象。

#### re.MatchObject
`group()` 返回被 RE 匹配的字符串。

- start() 返回匹配开始的位置
- end() 返回匹配结束的位置
- span() 返回一个元组包含匹配 (开始,结束) 的位置

https://www.runoob.com/python/python-reg-expressions.html


### group 分组


In [7]:
s = 'python is good'
r = re.search('python(.*)good', s)
print(r.group(0, 1))
print(r.group(1))

r = re.findall('python(.*)good', s)
print(r)


('python is good', ' is ')
 is 
[' is ']


### JSON

In [8]:
import json

json_str = '{"name":"zhangsan","age":18}'

student = json.loads(json_str)
print(type(student))
print(student['name'])

json_str = '[{"name":"zhangsan","age":18,"flag":false,"happy":null}]'

student = json.loads(json_str)
print(type(student))
print(student[0])


student = [{"name": "zhangsan", "age": 18, "flag": False, "happy": None}]
student_str = json.dumps(json_str)
print(student_str)


<class 'dict'>
zhangsan
<class 'list'>
{'name': 'zhangsan', 'age': 18, 'flag': False, 'happy': None}
"[{\"name\":\"zhangsan\",\"age\":18,\"flag\":false,\"happy\":null}]"
