# 正则表达式
正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。

# re.match函数
re.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none。

函数语法：

re.match(pattern, string, flags=0)

<p>函数参数说明：</p>
<table class="reference">
<tbody><tr>
<th style="width:30%">参数</th><th>描述</th>
</tr>
<tr><td>pattern</td><td>匹配的正则表达式</td></tr>
<tr><td>string</td><td>要匹配的字符串。</td></tr>
<tr><td>flags</td><td>标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。参见：<a href="#flags">正则表达式修饰符 - 可选标志</a></td></tr>
</tbody></table>
<p>匹配成功re.match方法返回一个匹配的对象，否则返回None。</p>


In [1]:
 import re
print(re.match('www', 'www.runoob.com').span())  # 在起始位置匹配
print(re.match('com', 'www.runoob.com'))         # 不在起始位置匹配

(0, 3)
None


<hr><h2>re.search方法</h2>
<p>re.search 扫描整个字符串并返回第一个成功的匹配。</p>
<p>函数语法：</p>
<pre>
re.search(pattern, string, flags=0)
</pre>
<p>函数参数说明：</p>
<table class="reference">
<tbody><tr>
<th style="width:30%">参数</th><th>描述</th>
</tr>
<tr><td>pattern</td><td>匹配的正则表达式</td></tr>
<tr><td>string</td><td>要匹配的字符串。</td></tr>
<tr><td>flags</td><td>标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。</td></tr>
</tbody></table>
<p>匹配成功re.search方法返回一个匹配的对象，否则返回None。</p>


In [2]:
import re
print(re.search('www', 'www.runoob.com').span())  # 在起始位置匹配
print(re.search('com', 'www.runoob.com').span())         # 不在起始位置匹配

(0, 3)
(11, 14)


# re.match与re.search的区别
re.match只匹配字符串的开始，如果字符串开始不符合正则表达式，则匹配失败，函数返回None；而re.search匹配整个字符串，直到找到一个匹配。

<hr><h2>检索和替换</h2>
<p>Python 的 re 模块提供了re.sub用于替换字符串中的匹配项。</p>
<p>语法：</p>
<pre>
re.sub(pattern, repl, string, count=0, flags=0)
</pre>
<p>参数：</p>
<ul>
<li>pattern : 正则中的模式字符串。</li><li>
repl : 替换的字符串，也可为一个函数。</li><li>
string : 要被查找替换的原始字符串。</li><li>
count : 模式匹配后替换的最大次数，默认 0 表示替换所有的匹配。</li></ul>


In [4]:
import re
 
phone = "2004-959-559 # 这是一个国外电话号码"

# 删除字符串中的 Python注释 
num = re.sub(r'#.*$', "", phone)
print ("电话号码是: ", num)

# 删除非数字(-)的字符串 
num = re.sub(r'\D', "", phone)
print ("电话号码是 : ", num)

电话号码是:  2004-959-559 
电话号码是 :  2004959559


正则表达式实例
</h2>
<h4>字符匹配</h4>
<table class="reference">
<tbody><tr><th style="width:25%">实例</th><th>描述</th></tr>
<tr><td>python</td><td>匹配 "python". </td></tr>
</tbody></table>
<h4>字符类</h4>
<table class="reference">
<tbody><tr><th style="width:25%">实例</th><th>描述</th></tr>
<tr><td>[Pp]ython </td><td>匹配 "Python" 或 "python"</td></tr>
<tr><td>rub[ye]</td><td>匹配 "ruby" 或 "rube"</td></tr>
<tr><td>[aeiou]</td><td>匹配中括号内的任意一个字母</td></tr>
<tr><td>[0-9]</td><td>匹配任何数字。类似于 [0123456789]</td></tr>
<tr><td>[a-z]</td><td>匹配任何小写字母</td></tr>
<tr><td>[A-Z]</td><td>匹配任何大写字母</td></tr>
<tr><td>[a-zA-Z0-9]</td><td>匹配任何字母及数字</td></tr>
<tr><td>[^aeiou]</td><td>除了aeiou字母以外的所有字符 
</td></tr>
<tr><td>[^0-9]</td><td>匹配除了数字外的字符 
</td></tr>
</tbody></table>

<h4>特殊字符类</h4>
<table class="reference">
<tbody><tr><th style="width:25%">实例</th><th>描述</th></tr>
<tr><td>.</td><td>匹配除 "\n" 之外的任何单个字符。要匹配包括 '\n' 在内的任何字符，请使用象 '[.\n]' 的模式。</td></tr>
<tr><td>\d</td><td>匹配一个数字字符。等价于 [0-9]。</td></tr>
<tr><td>\D </td><td>匹配一个非数字字符。等价于 [^0-9]。</td></tr>
<tr><td>\s</td><td>匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。</td></tr>
<tr><td>\S </td><td>匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。</td></tr>
<tr><td>\w</td><td>匹配包括下划线的任何单词字符。等价于'[A-Za-z0-9_]'。</td></tr>
<tr><td>\W</td><td>匹配任何非单词字符。等价于 '[^A-Za-z0-9_]'。</td></tr>
</tbody></table>	

# OS模块
Python 的 os 模块封装了常见的文件和目录操作，
<table>
<thead>
<tr>
<th style="text-align: center;">方法</th>
<th style="text-align: center;">说明</th>
</tr>
</thead>
<tbody>
<tr>
<td style="text-align: center;"> os.mkdir</td>
<td style="text-align: center;"> 创建目录</td>
</tr>
<tr>
<td style="text-align: center;">os.rmdir</td>
<td style="text-align: center;"> 删除目录</td>
</tr>
<tr>
<td style="text-align: center;"> os.rename</td>
<td style="text-align: center;"> 重命名</td>
</tr>
<tr>
<td style="text-align: center;">os.remove</td>
<td style="text-align: center;">删除文件</td>
</tr>
<tr>
<td style="text-align: center;"> os.getcwd</td>
<td style="text-align: center;">获取当前工作路径</td>
</tr>
<tr>
<td style="text-align: center;">os.walk</td>
<td style="text-align: center;">遍历目录</td>
</tr>
<tr>
<td style="text-align: center;">os.path.join</td>
<td style="text-align: center;">连接目录与文件名</td>
</tr>
<tr>
<td style="text-align: center;">os.path.split</td>
<td style="text-align: center;">分割文件名与目录</td>
</tr>
<tr>
<td style="text-align: center;">os.path.abspath</td>
<td style="text-align: center;">获取绝对路径</td>
</tr>
<tr>
<td style="text-align: center;">os.path.dirname</td>
<td style="text-align: center;">获取路径</td>
</tr>
<tr>
<td style="text-align: center;">os.path.basename</td>
<td style="text-align: center;">获取文件名或文件夹名</td>
</tr>
<tr>
<td style="text-align: center;">os.path.splitext</td>
<td style="text-align: center;">分离文件名与扩展名</td>
</tr>
<tr>
<td style="text-align: center;">os.path.isfile</td>
<td style="text-align: center;">判断给出的路径是否是一个文件</td>
</tr>
<tr>
<td style="text-align: center;">os.path.isdir</td>
<td style="text-align: center;">判断给出的路径是否是一个目录</td>
</tr>
</tbody>
</table>

In [6]:
import os
print(os.getcwd())
for root, dirs, files in os.walk('D:/gitProcess/电子书/'):
    print (root)
    print (dirs)
    print (files)

D:\gitProcess\PythonLearning


# datatime 模块

In [19]:
from datetime import datetime
birthday = datetime(year=1993, month=10, day=20,hour=11,minute=12,second=11)
print(birthday)
print(birthday.month)
now = datetime.now() # 返回当前时间
print(now)

1993-10-20 11:12:11
10
2019-01-30 17:15:21.688622


# http请求
## get请求

In [14]:

## 不带参数 
#!/usr/bin/python
import requests
url="http://www.baidu.com/"
r = requests.get(url)
print (r.status_code)#这是状态码
#print (r.content)#这是返回内容

200


# post请求

In [15]:
!/usr/bin/python

import requests

url="http://www.baidu.com"

payload={'message': "Opportunities and challenges together"}

r = requests.post(url, data=payload)

print (r.status_code)
#print (r.content)

302


系统找不到指定的路径。


# 作业
1.请用户输入一个时间，输出选项所对应的现在时间，告诉用户这两个时间相隔的天数，小时数，分钟数和秒数

In [32]:
input_time=input("请输入一个时间,格式是 年 月 天 时 分 秒").split(" ")
input_time = datetime(year=int(input_time[0]), month=int(input_time[1]), day=int(input_time[2]),hour=int(input_time[3]),minute=int(input_time[4]),second=int(input_time[5]))
now_time=datetime.now()
print("用户输入时间时{},当前时间时：{}".format(input_time,now_time))
res=input_time-now_time if input_time>now_time else now_time-input_time
print("相差天数{}，相差小时{}，相差分钟{}，相差秒{}".format(res.days,res.seconds/60//24,res.seconds//60,res.seconds))


请输入一个时间,格式是 年 月 天 时 分 秒2019 1 30 17 30 00
用户输入时间时2019-01-30 17:30:00,当前时间时：2019-01-30 17:41:24.087676
相差天数0，相差小时0.0，相差分钟11，相差秒684


In [None]:
2.请用户输入电话及邮箱，判断用户输入是否合法。

In [38]:
import re
str=r'^[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+){0,4}@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+){0,4}$'
email=input("请输入邮箱")
if re.match(str,email):
    print('OK')
else:
    print("wrong")

请输入邮箱1233@ddd.cm
OK


In [37]:
phone_pat = re.compile('^(13\d|14[5|7]|15\d|166|17[3|6|7]|18\d)\d{8}$')
phone = input('请输入您的手机号:')
res = re.search(phone_pat, phone)
if res:
    print('正常手机号')
else:
    print('不是手机号')


请输入您的手机号:1385464556
不是手机号


3.对http://www.baidu.com 进行请求，并用正则化匹配图片内容。将百度图标爬取下来保存至本地

In [52]:
from urllib import request
url="http://www.baidu.com/"
r = requests.get(url)
#print (r.content)#这是返回内容

reg=r'src="(.+?\.png)"'
#buf=data.decode('utf-8')
imglist=re.findall(reg,r.content.decode('utf-8'))
for addr in imglist:
    print(addr)
    request.urlretrieve("https:"+addr,r"D:\logo.png")

//www.baidu.com/img/bd_logo1.png
