# 面向对象

In [1]:
class Person:
    
    # 静态变量
    nationality = 'Chinese!'
    
    # self：指对象自身
    def __init__(self, x="Laoshan", y="Xiuji"): # "Laoshan", "Xiuji"是默认参数，会被手动指定的覆盖
        # 实例变量(动态变量)
        self.name = x
        self.__gender = y
    
    def baoguang(self):
        print(self.__gender)

In [2]:
import numpy as np

# 类：ndarray
# 对象：arr
arr = np.array([0,1,2])

In [3]:
# ndarray类的属性
arr.shape

(3,)

In [4]:
# 别忘了()
# 有括号：类的实例化
# 没括号：给Person起了个别称
me = Person()

In [5]:
me = Person('Laowang', 'Male')

In [6]:
me.name

'Laowang'

In [7]:
me.__gender

AttributeError: 'Person' object has no attribute '__gender'

In [None]:
you = Person('Xiaowang', 'Male')

In [None]:
you.name

In [None]:
you.gender

In [None]:
me.nationality

In [None]:
you.nationality

In [None]:
me.__gender

In [None]:
me.baoguang()

In [None]:
help(Person)

In [None]:
me.__dict__

## 继承/派生

In [None]:
class Person:
    
    def __init__(self, name, gender):
        self.name
        self.gender
        
    def eat(self):
        print("真香")
        
    def __sleep(self):
        print("Zzz")

In [None]:
# ShehuiPerson继承了Person
# Person派生出ShehuiPerson
# Person是基类/父类
# ShehuiPerson是子类
class ShehuiPerson(Person):

    def __init__(self, job, exp):
        self.job = job
        self.exp = exp
    

In [None]:
# I是ShehuiPerson的一个对象（实例）
I = ShehuiPerson('动画制作', 3)

In [None]:
I.name

In [None]:
I.job

In [None]:
I.exp

In [None]:
# .eat()是从Person继承而来的
I.eat()

In [None]:
# .__sleep()是私有方法
I.__sleep()

In [None]:
from sklearn import datasets

iris = datasets.load_iris()

In [None]:
iris

In [None]:
iris.target

In [None]:
iris['feature_names']

In [None]:
iris.feature_names

In [None]:
# 从sklearn里导入支持向量机算法类
from sklearn import svm

In [None]:
# 新建了类SVC的实例clf
clf = svm.SVC(C=0.5)

In [None]:
# 训练过程
clf.fit(iris.data[9:], iris.target[9:])

In [None]:
iris.data[:9]

In [None]:
# ground truth
iris.target[:9]

In [None]:
# predictions
# predict()方法，返回预测结果
clf.predict(iris.data[:9])

In [None]:
help(sorted)

# 正则表达式
https://regexr.com/

In [None]:
def potential(s):
    for c in s:
        #if '0' <= c <= '9':
        if c.isdigit():
            return int(c)

In [None]:
'4'.isdigit()

In [None]:
def potential_sorted(str_lst):
    
    # 新建空字典
    s_potential = {}        
    for s in str_lst:
        s_potential[potential(s)] = s
    
    print(s_potential)
    
    ret_lst = []
    for num in sorted(s_potential):
        ret_lst.append(s_potential[num])
        
    return ret_lst

In [None]:
potential_sorted(["4chan", "o3o", "you2be"])

In [None]:
sorted({2: 'you2be', 3: 'o3o', 4: '4chan'})

In [None]:
potential_sorted(['sto9', 'tr4eating', '8me', 'l1ke', 'that3'])

In [None]:
# potential函数：字符串 --映射--> 字符串中含有的数字(int)
# sorted(<>, key=<function>)，以映射之后的序列为依据排序
def potential_sorted_v2(str_lst):
    return sorted(str_lst, key=potential)

In [None]:
lst = [2,1,0,-3,-4]

In [None]:
def square(x):
    return x ** 2

In [None]:
sorted(lst, key=square)

In [None]:
# Regular Expression
import re

In [None]:
# re.search(<正则表达式>, <目标文本>)
re.search('\d', 'l1ke')

In [None]:
re.search('\d', 'l1ke').group()

In [None]:
re.search('\d', 'l1keyou2be4chan').group()

In [None]:
re.findall('\d', 'lkeyoubechan')

In [None]:
# re.sub(<正则表达式>, <替换文本>, <目标文本>)
re.sub('\d', '#', 'l1keyou2be4chan')

In [None]:
re.sub('\d', '#', 'l1keyou2be4chan', count=2)

In [None]:
re.search('\d', 'like') == None

In [None]:
def potential(s):
    return int(re.search('\d', s).group())
    
def potential_sorted_v2(str_lst):
    return sorted(str_lst, key=potential)

In [None]:
potential_sorted_v2(["4chan", "o3o", "you2be"])

In [None]:
potential_sorted_v2(['sto9', 'tr4eating', '8me', 'l1ke', 'that3'])

# 匿名函数

In [None]:
# x映射到x**2
sorted(lst, key=lambda x:x ** 2)

In [None]:
def potential_sorted_v3(str_lst):
    return sorted(str_lst, key=lambda s:int(re.search('\d', s).group()))

In [None]:
potential_sorted_v3(['s2to9', 'tr4eat4i2ng', '8m6e', 'l1k7e', 'th1at3'])

In [None]:
def potential_sorted_v4(str_lst):
    return sorted(str_lst, key=lambda s:max(re.findall('\d', s)))

In [None]:
potential_sorted_v4(['s2to9', 'tr4eat4i2ng', '8m6e', 'l1k7e', 'th1at3'])

## 找出邮件中的所有邮箱

In [None]:
spam_sample = '''
Received: from 163.con ([61.141.165.252])
	by spam-gw.ccert.edu.cn (MIMEDefang) with ESMTP id j7CHJ2B9028021
	for <xing@ccert.edu.cn>; Sun, 14 Aug 2005 10:04:03 +0800 (CST)
Message-ID: <200508130119.j7CHJ2B9028021@spam-gw.ccert.edu.cn>
From: =?GB2312?B?1cW6o8TP?= <jian@163.con>
Subject: =?gb2312?B?uavLvtK1zvEutPq/qreixrGjoQ==?=
To: xing@ccert.edu.cn
Content-Type: text/plain;charset="GB2312"
Date: Sun, 14 Aug 2005 10:17:57 +0800
X-Priority: 2
X-Mailer: Microsoft Outlook Express 5.50.4133.2400

尊敬的贵公司(财务/经理)负责人您好！  
        我是深圳金海实业有限公司（广州。东莞）等省市有分公司。  
    我司有良好的社会关系和实力，因每月进项多出项少现有一部分  
    发票可优惠对外代开税率较低，增值税发票为5%其它国税.地税.     
    运输.广告等普通发票为1.5%的税点，还可以根据数目大小来衡  
    量优惠的多少，希望贵公司.商家等来电商谈欢迎合作。
   
       本公司郑重承诺所用票据可到税务局验证或抵扣！
    欢迎来电进一步商谈。
    电话：13826556538（24小时服务）
    信箱：szlianfen@163.com
    联系人：张海南

               
       顺祝商祺   
                 

                   深圳市金海实业有限公司


'''

In [None]:
re.findall('[\w.]+@\w+[.\w]{2,4}', spam_sample)

In [None]:
import requests

In [None]:
response = requests.get('http://www.people.com.cn/')

In [None]:
response.status_code

In [None]:
response.encoding = 'GBK'

In [None]:
html_doc = response.text
html_doc

# 0.0 定义函数

定义函数 `find_potential(s)`，参数 `s` 是一个字符串，字符串由多个字母和一个数字组成，我们称字符串中的数字为字符串的“潜力”。

函数以整数形式返回 `s` 的潜力。

分别用 for 循环和列表推导式的方式来完成。

In [None]:
# 用 for 循环
@@ find_potential(s):
    for @@ in s:
        if '0' <= @@ <= '9':
            return int(@@)

In [None]:
# 用列表推导式
def find_potential(s):
    return int(next(num for num in s if '0' <= @@ <= '9'))

In [None]:
# 测试：2
find_potential('you2be')

# 0.1 调用函数

完成函数 `potential_lst(lst)`，使用上一题中的 `find_potential(s)` 函数，找出 `lst` 中所有“潜力字符串”的“潜力”，以整数列表的形式返回所有潜力。

In [None]:
def potential_lst(lst):
    ret_lst = []
    for s in lst:
        ret_lst.append(@@(s))
    return @@

In [None]:
# 测试：[4, 3, 2]
potential_lst(["4chan", "o3o", "you2be"])

# 0.2 函数是对象

`sorted` 函数返回一个有序的列表，例如 `sorted([4, 3, 2])` 返回 `[2, 3, 4]`。但它不能将字符串按照潜力进行排序。

实际上 `sorted()` 函数可以接收一个名为 `key` 参数，接收一个函数对象。

使用 `sorted()` 方法完成 `#4` 中的选做题“潜力排序”。

In [None]:
# 测试：['you2be', 'o3o', '4chan']
sorted(["4chan", "o3o", "you2be"], key=find_potential)

# 0.3 lambda

使用关键字 `lambda` 也可以生成函数。

在下方用 lambda 来生成 0.0 中的函数。

In [None]:
# 在此处完成作业
lambda_potential = lambda s: int(next(num for num in s if '0' <= @@ <= '9'))

In [None]:
# 测试：2
lambda_potential('you2be')

# 0.4 匿名函数

`lambda` 函数通常被称为匿名函数，使用匿名函数可以省去定义函数的步骤，同时也能避免函数、变量等的命名混乱。

使用 `lambda` 实现 0.0 和 0.2 中的功能。

In [None]:
sorted(["4chan", "o3o", "you2be"], key=lambda s:
       int(next(num for num in s if '0' <= @@ <= '9')))

# 0.5 正则表达式

正则表达式可以用来匹配一定格式的文本。正则表达式需要导入 `re`。

使用下方的正则表达式 `email_p`，判断字符串 `s` 是不是电子邮件，如果匹配成功，Notebook 将会输出一个匹配对象；如果失败，没有输出。

选做：你可以尝试改良这个正则表达式，以匹配更多格式的电子邮件地址，比如 'xxx@yyy.edu.cn'。

In [None]:
import re

email_p = r'^[0-9a-zA-Z_]{0,19}@[0-9a-zA-Z]{1,13}\.[com,cn,net]{1,3}$'

In [None]:
s = 'iamsf@sijf.com'
re.match(email_p, s)

In [None]:
s = 'amsfiaojio'

In [None]:
re.match(email_p, s)

In [None]:
s = 'asfasf@isafj.edu.cn'

In [None]:
re.match(email_p, s)

# 0.6 `import numpy`

导入 `numpy`，因为后面要用。

In [None]:
import @@ as np

# 1. 求总分

经历过一次考试，每位学生的语数外三门课的成绩，都用列表表示：`[90,90,90]`。

完成函数 `total_each(score_arr)`，`score_arr` 包含多位同学的成绩，形如：

```python
[ [60, 80,100],
  [80, 70, 80],
  [90, 90, 90] ]
```

算出每位同学的总分，将结果存入一个 `ndarray` 并返回。

**注意**，请用 `numpy` 中的方法，求出所有同学的总分。

```python
输入 [[60, 80,100], [80, 70, 80], [90, 90, 90]]
返回 array([240, 230, 270])
```

In [None]:
# 提示
arr = [ [0,0,0],
        [1,1,1] ]
np.sum(arr, 1)

In [None]:
def total_each(score_arr):
    return np.@@(score_arr)

In [None]:
# 测试：array([240, 230, 270])
total_each([[60, 80,100], [80, 70, 80], [90, 90, 90]])

# 2. 求班级各科平均分

完成函数 `mean_course(score_arr)`，返回语数外三科的平均分。

关于刚才的考试，现在需要求出各科的班级平均分，将结果存入一个 `ndarray` 并返回。比如：

```python
[ [60, 80,100],
  [80, 70, 80],
  [90, 90, 90] ]
```

语文平均分是 (60 + 80 + 90) / 3。

**注意**，请用 `numpy` 中的方法。

```python
输入 [[60, 80,100], [80, 70, 80], [90, 90, 90]]
返回 array([76.66666667, 80.        , 90.        ])
```

In [None]:
import numpy as np
# 提示
lst = [ [1,2,3],
        [1,2,3] ]
np.mean(lst, 0)

In [None]:
def mean_course(score_arr):
    return np.@@(score_arr)

In [None]:
# 测试：array([76.66666667, 80.        , 90.        ])
total_each([[60, 80,100], [80, 70, 80], [90, 90, 90]])

# 3. C 位出道

如果总人数是奇数，C 位就只有一个人，如果是偶数，就要双 C 位。

完成函数 `c_wei(s)`，参数 `s` 是只包含字母的字符串，返回位于中间的字符串。

如果字符串总长是偶数，返回中间的两个字母。

```
输入 'world'
返回 'r'

输入 'sorrow'
返回 'rr'
```

In [None]:
# 提示：偶数判断条件
len('sorrow') % 2 == 0

In [None]:
def c_wei(s):
    if @@ % 2 != 0:
        return s[@@]
    else:
        return s[@@:@@]

In [None]:
# 测试：'r'
c_wei('world')

In [None]:
# 测试：'rr'
c_wei('sorrow')

# 4. 失散多年

完成函数 `find_siblings(me, lst)`，`lst` 是一个列表，列表每一项都是只包含字母的字符串。`me` 是一个只包含字母的字符串。

返回 `lst` 中所有的 `me` 的失散多年的兄/弟/姐/妹。

兄弟姐妹判断条件：

1. 包含的字母相同
2. 各个字母的出现次数相同

```
输入 'shift', ['ifsht', 'shit', 'shitt', 'hisft']
返回 ['ifsht', 'hisft']

输入 'adam', ['dama', 'damn', 'mada', 'amd']
返回 ['dama', 'mada']
```

In [None]:
# 提示
sorted('adam') == sorted('dama')

In [None]:
def find_siblings(me, lst):
    me = sorted(me)
    
    ret_lst = []
    for @@ in lst:
        if me == @@(@@):
            ret_lst.append(@@)
            
    return @@

In [None]:
# 测试：['ifsht', 'hisft']
find_siblings('shift', ['ifsht', 'shit', 'shitt', 'hisft'])

In [None]:
# 测试：['dama', 'mada']
find_siblings('adam', ['dama', 'damn', 'mada', 'amd'])

# 5. 24 岁，是…学生

创建类 `Student`。实例化 `Student`，把对象存入变量 `stu1`。

**注意**，*对象*（object）又称*实例*（instance），是由*类*（class）*实例化*得到的。

In [None]:
@@ Student: pass

In [None]:
stu1 = @@

# 6. 变形计

1. 修改上一题中类 `Student` 的定义：

    1. 添加一个初始化方法，接收参数 `name`，作为属性保存。

    2. 添加一个方法，名为 `study()`，方法的行为：输出 "我{}就是饿死，死外边，从这里跳下去，不会学一次习。真香！"，其中 {} 用 `name` 属性的值来替代。

2. 实例化 `Student`，在初始化方法的参数中传入你的名字，存入变量 `stu2` 中。

3. `print` `stu2` 的属性 `name`。

4. 调用 `stu2` 的方法 `study()`。

In [None]:
@@ Student:
    def __init__(self, @@):
        self.@@ = @@
        
    def @@(self):
        print('@@'.format(@@))

In [None]:
stu2 = @@
print(@@)
stu2.@@

# 7. 掰弯数组（选做）

完成函数 `bend(lst, times)`，接收列表类型参数，列表中每一项都是整数。输出掰弯 `time` 次后的列表。

例如：输入参数 [1,2,3,4,5] 和 2，即掰弯数组两次，输出结果应为 [9, 6]。

掰弯一次的过程如下：

```
                     5/           5|         5\          
                    4/            4|          4\      
1 2 3 4 5      1 2 3/         1 2 3|       1 2 3\       6 6 3
----*----      ----*          ----*        ----*        ----*
```

### 基本解题思路

折叠一次的过程：

1. 设 `lst` 的长度为 `l`
2. 将第 `0` 项与第 `l - (0+1)` 项相加，依次类推
3. 将第 `i` 项与第 `l - (i+1)` 项相加
4. 直到 `i` 的值为 `l // i`

折叠 `times` 次。

In [None]:
def bend(lst, times):
    
    
    

In [None]:
# 测试：返回 [9, 6]
bend([1, 2, 3, 4, 5], 2)