# 类和对象
* **面向对象编程** 是最有效的软件编写方法之一。在面向对象编程中，你编写表示现实世界中的事物和情景的 **类** 并基于这些类来创建对象。编写类时，你定义一大类对象都有的通用行为。基于类创建 **对象** 时，每个对象都自动具备这种通用行为，然后可根据需要赋予每个对象独特的个性。使用面向对象编程可模拟现实情景，其逼真程度达到了令你惊讶的地步。  
* 根据类来创建对象被称为 **实例化** ，这让你能够使用类的实例。

## 创建和使用类
* 使用类几乎可以模拟任何东西。

In [1]:
class person:
    print('I\'m a person.')

I'm a person.


In [2]:
p1=person()

In [3]:
print(p1)

<__main__.person object at 0x000000000628DD68>


* 下面来编写一个表示小狗的简单类 Dog —— 它表示的不是特定的小狗，而是任何小狗。对于大多数宠物狗，我们都知道些什么呢？它们都有名字和年龄；我们还知道，大多数小狗还会蹲下和打滚。由于大多数小狗都具备上述两项信息（名字和年龄）和两种行为（蹲下和打滚），我们的 Dog 类将包含它们。这个类让Python 知道如何创建表示小狗的对象。编写这个类后，我们将使用它来创建表示特定小狗的实例。
* 创建 Dog 类
根据 Dog 类创建的每个实例都将存储名字和年龄。我们赋予了每条小狗蹲下（ sit() ）和打滚（ roll_over() ）的能力:

In [4]:
class Dog():
    """ 一次模拟小狗的简单尝试 """
    def __init__(self, name, age):
        """ 初始化属性 name 和 age"""
        self.name = name
        self.age = age
    def sit(self):
        """ 模拟小狗被命令时蹲下 """
        print(self.name.title() + " is now sitting.")
    def roll_over(self):
        """ 模拟小狗被命令时打滚 """
        print(self.name.title() + " rolled over!")

根据约定，在 Python 中，首字母大写的名称指的是类。这个类定义中的括号是空的，因为我们要从空白创建这个类。
* 方法 __init__()
类中的函数称为 方法 ；你前面学到的有关函数的一切都适用于方法，就目前而言，唯一重要的差别是调用方法的方式。方法 __init__() 是一个特殊的方法，每当你根据 Dog 类创建新实例时， Python 都会自动运行它。在这个方法的名称中，开头和末尾各有两个下划线，这是一种约定，旨在避免 Python 默认方法与普通方法发生名称冲突。
* self 形参
 Python 调用这个 __init__() 方法来创建 Dog 实例时，将自动传入实参 self 。每个与类相关联的方法调用都自动传递实参 self ，它是一个指向实例本身的引用，让实例能够访问类中的属性和方法。我们创建 Dog 实例时， Python 将调用 Dog 类的方法 __init__() 。我们将通过实参向 Dog() 传递名字和年龄； self 会自动传递，因此我们不需要传递它。每当我们根据 Dog 类创建实例时，都只需给最后两个形参（ name 和 age ）提供值。
* 根据类创建实例
可将类视为有关如何创建实例的说明。 Dog 类是一系列说明，让 Python 知道如何创建表示特定小狗的实例。
下面来创建一个表示特定小狗的实例.

In [5]:
my_dog = Dog('willie', 6)
print("My dog's name is " + my_dog.name.title() + ".")
print("My dog is " + str(my_dog.age) + " years old.")

My dog's name is Willie.
My dog is 6 years old.


* 访问属性
要访问实例的属性，可使用句点表示法。

In [6]:
my_dog.name

'willie'

In [7]:
my_dog.age

6

* 调用方法
根据 Dog 类创建实例后，就可以使用句点表示法来调用 Dog 类中定义的任何方法。

In [8]:
my_dog.sit()

Willie is now sitting.


In [9]:
my_dog.roll_over()

Willie rolled over!


## 继承

编写类时，并非总是要从空白开始。如果你要编写的类是另一个现成类的特殊版本，可使用 继承 。一个类 继承 另一个类时，它将自动获得另一个类的所有属性和方法；原有的类称为 **父类** 或 **超类** ，而新类称为 **子类** 。  
子类继承了其父类的所有属性和方法，同时还可以定义自己的属性和方法。  
创建子类的实例时， Python 首先需要完成的任务是给父类的所有属性赋值。为此，子类的方法 __init__() 需要父类施以援手。
* 给子类定义属性和方法
让一个类继承另一个类后，可添加区分子类和父类所需的新属性和方法。
* 重写父类的方法
对于父类的方法，只要它不符合子类模拟的实物的行为，都可对其进行重写。为此，可在子类中定义一个这样的方法，即它与要重写的父类方法同名。这样， Python 将不会考虑这
个父类方法，而只关注你在子类中定义的相应方法。
* 将实例用作属性
使用代码模拟实物时，你可能会发现自己给类添加的细节越来越多：属性和方法清单以及文件都越来越长。在这种情况下，可能需要将类的一部分作为一个独立的类提取出来。你可以将大型类拆分成多个协同工作的小类。

## 导入类
略

# 正则表达式

正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配。  


## 正则表达式语法
参见 https://docs.python.org/zh-cn/3.7/library/re.html 正则表达式语法部分
* \d 可以匹配一个数字 
* \w 可以匹配一个字母或数字
* 在正则表达式中，用 \* 表示任意个字符（包括0个），用 + 表示至少一个字符，用 ? 表示0个或1个字符，用 {n} 表示n个字符，用 {n,m} 表示n*m个字符.
* ^ 表示行的开头， ^\d 表示必须以数字开头。
* \\$ 表示行的结束， \d\\$ 表示必须以数字结束。

# re模块  
Python 自1.5版本起增加了re 模块，它提供 Perl 风格的正则表达式模式。  
re 模块使 Python 语言拥有全部的正则表达式功能。  
compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。  
re 模块也提供了与这些方法功能完全一致的函数，这些函数使用一个模式字符串做为它们的第一个参数。  
第三方模块 regex , 提供了与标准库 re 模块兼容的API接口, 同时还提供了额外的功能和更全面的Unicode支持。 参见官方网站https://pypi.org/project/regex/  
Python提供 re 模块，包含所有正则表达式的功能。由于Python的字符串本身也用 \ 转义，所以要特别注意.强烈建议使用Python的 r 前缀，就不用考虑转义的问题了.

In [10]:
s = 'ABC\\-001' # Python的字符串
# 对应的正则表达式字符串变成：
# 'ABC\-001'

In [11]:
s = r'ABC\-001' # Python的字符串
# 对应的正则表达式字符串不变：
# 'ABC\-001'

## re.match函数
re.match 尝试从字符串的起始位置匹配一个模式，如果不是起始位置匹配成功的话，match()就返回none。
**函数语法**：
re.match(pattern, string, flags=0)
**参数说明**:
* pattern	匹配的正则表达式 
* string	要匹配的字符串。  
* flags	标志位，用于控制正则表达式的匹配方式，如：是否区分大小写，多行匹配等等。

match() 方法判断是否匹配，如果匹配成功，返回一个 Match 对象，否则返回 None 

In [12]:
import re

In [13]:
re.match(r'^\d{3}\-\d{3,8}$', '010 12345')


In [14]:
re.match(r'^\d{3}\-\d{3,8}$', '010-12345')

<_sre.SRE_Match object; span=(0, 9), match='010-12345'>

# 第三方模块regex 
 第三方模块 regex , 提供了与标准库 re 模块兼容的API接口, 同时还提供了额外的功能和更全面的Unicode支持。 参见官方网站https://pypi.org/project/regex/

# datetime模块学习
datetime模块是用于操作时间的模块。
datetime 模块中有以下几个类:　
* datetime.date：表示日期的类。常用的属性有year, month, day；
* datetime.time：表示时间的类。常用的属性有hour, minute, second, microsecond；
* datetime.datetime：表示日期时间
* datetime.timedelta：表示时间间隔，即两个时间点之间的长度
* datetime.tzinfo：与时区有关的相关信息

更多信息参见:https://blog.csdn.net/xsj_blog/article/details/51968971

In [15]:
import datetime,time

In [16]:
dir(datetime)

['MAXYEAR',
 'MINYEAR',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'date',
 'datetime',
 'datetime_CAPI',
 'sys',
 'time',
 'timedelta',
 'timezone',
 'tzinfo']

In [17]:
datetime.MAXYEAR

9999

In [18]:
lastdaty2018=datetime.date(2018,12,31)
# 语法格式:datetime.date(year, month, day)
#参数说明：
#  year的范围是[MINYEAR, MAXYEAR]，即[1, 9999]
#  month的范围是[1, 12]
#  day的最大值根据给定的year, month参数来决定。例如闰年2月份有29天

In [19]:
lastdaty2018

datetime.date(2018, 12, 31)

In [20]:
# datetime.datetime??

In [21]:
# datetime.sys??

In [22]:
dir(time)

['_STRUCT_TM_ITEMS',
 '__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'altzone',
 'asctime',
 'clock',
 'ctime',
 'daylight',
 'get_clock_info',
 'gmtime',
 'localtime',
 'mktime',
 'monotonic',
 'perf_counter',
 'process_time',
 'sleep',
 'strftime',
 'strptime',
 'struct_time',
 'time',
 'timezone',
 'tzname']

In [23]:
#　time.sleep??　休眠指定的秒数


In [24]:
for i in range(10):
    print(str(i)+'seconds')
    time.sleep(i)

0seconds
1seconds
2seconds
3seconds
4seconds
5seconds
6seconds
7seconds
8seconds
9seconds


In [25]:
time.mktime??

# http请求

In [26]:
import requests

In [27]:
r=requests.get('https://github.com/timeline.json')
# 还有其他的方法: post,put,delete,head,options
# 可使用requests.post?? 命令查看源代码及参数和使用说明

In [28]:
# requests.put??

In [29]:
r.text #返回结果

'{"message":"Hello there, wayfaring stranger. If you’re reading this then you probably didn’t see our blog post a couple of years back announcing that this API would go away: http://git.io/17AROg Fear not, you should be able to get what you need from the shiny new Events API instead.","documentation_url":"https://developer.github.com/v3/activity/events/#list-public-events"}'

In [30]:
r.status_code

410

In [31]:
r.json()
# 需要注意的是，成功调用 r.json() 并**不**意味着响应的成功。有的服务器会在失败的响应中包含一个 JSON 对象（比如 HTTP 500 的错误细节）。这种 JSON 会被解码返回。要检查请求是否成功

{'message': 'Hello there, wayfaring stranger. If you’re reading this then you probably didn’t see our blog post a couple of years back announcing that this API would go away: http://git.io/17AROg Fear not, you should be able to get what you need from the shiny new Events API instead.',
 'documentation_url': 'https://developer.github.com/v3/activity/events/#list-public-events'}

In [32]:
requests.get('http://www.sina.com').text
#有乱码,是否有参数可以设置文字编码?

'<!DOCTYPE html>\n<!-- [ published at 2019-08-13 09:36:00 ] -->\n<html>\n<head>\n    <meta http-equiv="Content-type" content="text/html; charset=utf-8" />\n    <meta http-equiv="X-UA-Compatible" content="IE=edge" />\n    <title>æ\x96°æµªé¦\x96é¡µ</title>\n\t<meta name="keywords" content="æ\x96°æµª,æ\x96°æµªç½\x91,SINA,sina,sina.com.cn,æ\x96°æµªé¦\x96é¡µ,é\x97¨æ\x88·,èµ\x84è®¯" />\n\t<meta name="description" content="æ\x96°æµªç½\x91ä¸ºå\x85¨ç\x90\x83ç\x94¨æ\x88·24å°\x8fæ\x97¶æ\x8f\x90ä¾\x9bå\x85¨é\x9d¢å\x8f\x8aæ\x97¶ç\x9a\x84ä¸\xadæ\x96\x87èµ\x84è®¯ï¼\x8cå\x86\x85å®¹è¦\x86ç\x9b\x96å\x9b½å\x86\x85å¤\x96çª\x81å\x8f\x91æ\x96°é\x97»äº\x8bä»¶ã\x80\x81ä½\x93å\x9d\x9bèµ\x9bäº\x8bã\x80\x81å¨±ä¹\x90æ\x97¶å°\x9aã\x80\x81äº§ä¸\x9aèµ\x84è®¯ã\x80\x81å®\x9eç\x94¨ä¿¡æ\x81¯ç\xad\x89ï¼\x8cè®¾æ\x9c\x89æ\x96°é\x97»ã\x80\x81ä½\x93è\x82²ã\x80\x81å¨±ä¹\x90ã\x80\x81è´¢ç»\x8fã\x80\x81ç§\x91æ\x8a\x80ã\x80\x81æ\x88¿äº§ã\x80\x81æ±½è½¦ç\xad\x8930å¤\x9aä¸ªå\x86\x85å®¹é¢\x91é\x81\x93ï¼\x8cå\x90\x8cæ\x97¶å¼\x80è®¾å\x

In [33]:
# requests.get??

In [34]:
#设置超时时间 如果不设置超时时间则有可能会永远得不到返回
requests.get('https://github.com', timeout=0.01)

ConnectTimeout: HTTPSConnectionPool(host='github.com', port=443): Max retries exceeded with url: / (Caused by ConnectTimeoutError(<urllib3.connection.VerifiedHTTPSConnection object at 0x00000000087B9DD8>, 'Connection to github.com timed out. (connect timeout=0.01)'))