该教程是为了快速让你了解Python(Python3)的基本概念

部分来自https://www.liaoxuefeng.com/wiki/1016959663602400 和 https://www.runoob.com/python3/python3-tutorial.html

- Python官网：https://www.python.org/
- 解释型语言 动态类型语言
- 面向对象
- 函数式编程
- 丰富的第三方库 (PyPI,Python Package Index) https://pypi.org/
- 包管理器：pip
- 交互式解释器：REPL(Read Eval Print Loop)

像学习大多数语言一样，我们一般从以下几个方面学习一门语言。
-  数据类型
- 运算符
- 条件控制和循环
- 函数
- 错误和异常
- 类和对象
- 模块
- 其他高级特性和语法糖

Python最简单的程序如下，在屏幕上打印'Hello,world'

In [1]:
print('Hello, world')

Hello, world


## 1. 变量和值（对象）

赋值运算符将值赋给变量，在Python中，变量没有类型，只是指向对象(object)的标签。Python中一切都是对象。

In [2]:
a = 512

<div>
<img src="attachment:image.png" width="100"/>
</div>

In [3]:
b = a
id(b) == id(a) # id函数返回对象的内存地址

True

a赋给b后，a和b都指向对象512
<div>
<img src="attachment:image.png" width="100"/>
</div>

In [4]:
a = 513

a指向对象513
<div>
<img src="attachment:image.png" width="100"/>
</div>

In [5]:
b = 513

现在没有变量指向对象512，该处内存被自动回收。
<div>
<img src="attachment:image.png" width="100"/>
</div>

## 2. 基本类型

值（对象）是有类型的，最常用的内置类型有以下几种：

1. 表示字符串的: 	str
2. 表示数字的：int(整数类型), float(浮点数类型), complex(复数类型)
3. 表示序列的：list(列表), tuple(元组)
4. 表示映射关系的：dict(字典)
5. 表示集合的：set(集合)
6. 表示真假的: 	bool(布尔类型)

In [6]:
# Python支持大整数
a=28947385478548578469812893573897598
print(type(a))
a=5
print(a**3)
print(5/2)
print(5//2)
print(5%3)

<class 'int'>
125
2.5
2
2


In [2]:
# float8字节浮点数，存在精度问题
a=1/10
print(type(a))
a+a+a==1/10

<class 'float'>


False

In [8]:
# 在数值运算中，True其实是1,False是0
True+True+False

2

In [9]:
# str字符串
s1='Hello'
s2='world'
s1+' '+s2


'Hello world'

In [10]:
#list列表
s = [] #空列表
print(s)
s = list()
print(s)
s = [1,2,3]
s.append(4)# 追加元素
s.insert(0,-1) # 插入元素
print(s)
del s[1] # 删除元素
print(s)
s[0]=0 # 更新元素
print(s)

[]
[]
[-1, 1, 2, 3, 4]
[-1, 2, 3, 4]
[0, 2, 3, 4]


In [11]:
# tuple元组
# 元组不能修改
t = () #空元组
t = (1,) # 一个元素的元组，逗号区分开括号表达式
t = (1,2,3) # 元组不能修改
t[0]=2

TypeError: 'tuple' object does not support item assignment

Python支持的运算符很多，常见的有
- 算数运算符`+ - * ** / // % @`
- 位运算符 `& | ~ ^ << >>`
- 赋值运算符 `= += -= *= **= /= //= %= @= &= |= ~= ^=<<= >>=`
- 逻辑运算符 `and or not`
- 比较运算符 `== != > >= < <= `
- 成员资格运算符 `in not in`
- 身份运算符 `is is not`

对于运算符优先级，除非很明显，建议加括号。


## 3. 条件控制和循环

### 3.1 条件控制语句
Python用缩进表示嵌套关系。
Python中if语句的一般形式如下所示：
```
if condition_1:
    statement_block_1
elif condition_2:
    statement_block_2
else:
    statement_block_3
```

### 3.2 循环语句
有while循环和for循环，两种循环的形式如下：

```
while 判断条件(condition)：
    执行语句(statements)……
```

```
for <variable> in <sequence>:
    <statements>
```

In [12]:
# 该实例演示了数字猜谜游戏
number = 7
guess = -1
print("数字猜谜游戏!")
while guess != number:
    guess = int(input("请输入你猜的数字："))
 
    if guess < number:
        print("猜的数字小了...")
    elif guess > number:
        print("猜的数字大了...")
    else: #guess == number:
        print("恭喜，你猜对了！")

数字猜谜游戏!
请输入你猜的数字：1
猜的数字小了...
请输入你猜的数字：7
恭喜，你猜对了！


## 4. 切片索引

通过slice对象表示切片索引：语法是slice(begin,end,step)，可以用来索引序列类型(string, tuple, list等)

In [13]:
slice(0,5,1) #从索引0开始，一直到索引5(不含)，歩长1
slice(0,5) #省略歩长为1
slice(5)# 省略歩长1,起始0

slice(None, 5, None)

In [14]:
s='Python'
s=list(s)
print(s)
print(s[slice(0,5,2)])
print(s[0:5:2]) #更常用的简化写法
print(s[:5:2]) #同上
print(s[slice(len(s))])
print(s[:])
print(s[::-1]) # step小于0是逆序遍历

['P', 'y', 't', 'h', 'o', 'n']
['P', 't', 'o']
['P', 't', 'o']
['P', 't', 'o']
['P', 'y', 't', 'h', 'o', 'n']
['P', 'y', 't', 'h', 'o', 'n']
['n', 'o', 'h', 't', 'y', 'P']


In [15]:
print(s[4:10])#不报错
s[10]#报错

['o', 'n']


IndexError: list index out of range

In [16]:
print(s[0:1])
print(s[0])

['P']
P


In [17]:
# 切片赋值
s[1:3]=[] #相当于del s[2:4]
print(s)
s[1:1]=['y','t'] # 相当于s.insert(1,'y'); s.insert(2,'t')
print(s)

['P', 'h', 'o', 'n']
['P', 'y', 't', 'h', 'o', 'n']


## 5. 函数

函数是组织好的，可重复使用的，用来实现单一，或相关联功能的代码段。

函数能提高应用的模块性，和代码的重复利用率。你已经知道Python提供了许多内建函数，比如print()。但你也可以自己创建函数，这被叫做用户自定义函数。

### 5.1 函数定义和调用

In [18]:
# 函数的小例子
def Fib(n):
    if n in [0,1]:
        return 1
    return Fib(n-1)+Fib(n-2)

In [19]:
[Fib(i) for i in range(10)]

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

函数可以有默认参数，调用函数时，如果没有传递参数，则会使用默认参数。以下实例中如果没有传入 age 参数，则使用默认值：

In [20]:
#可写函数说明
def printinfo( name, age = 35 ):
   "打印任何传入的字符串"
   print ("名字: ", name)
   print ("年龄: ", age)
   return
 
#调用printinfo函数
printinfo( age=50, name="runoob" )
print ("------------------------")
printinfo( name="runoob" )

名字:  runoob
年龄:  50
------------------------
名字:  runoob
年龄:  35


### 5.2 匿名函数

lambda表达式也是函数

In [21]:
add = lambda a,b:a+b
add(2,3)

5

### 5.3 函数式编程
函数式编程指的是把函数本身作为参数传入另一个函数，还允许返回函数

In [22]:
s = ' 大数据 与   分布式计算'
s = s.split(' ')
print(s)

['', '大数据', '与', '', '', '分布式计算']


以下filter,map,sorted都允许传入函数

In [23]:
# filter过滤操作
list(filter(lambda x:len(x)>0, s))

['大数据', '与', '分布式计算']

In [24]:
# map映射操作
list(map(lambda x:len(x), s))

[0, 3, 1, 0, 0, 5]

In [25]:
# 函数作为参数传递给其他函数
sorted(s,key=lambda x:len(x))

['', '', '', '与', '大数据', '分布式计算']

## 6. 类和面向对象

面向对象编程将类设计为属性和方法的集合，对象是类的实例化

In [26]:
class Cat:
    def __init__(self, name):
        self.name=name
    def say(self):
        print(self.name+' says: miao~')

cat1 = Cat('Mr. Black')
cat1.say()

Mr. Black says: miao~


In [27]:
# 类成员函数参数里的第一个参数是对象自身(self)，用来访问自身属性
class Dog:
    def __init__(whatever,name):
        whatever.name=name
        print(id(whatever))
dog=Dog('Snoopy')
print(id(dog))

281462432114288
281462432114288


## 7. 模块

一个程序所有代码不可能都在同一个文件中，可以通过import引入其他模块中的代码

Python本身就内置了很多非常有用的模块，只要安装完毕，这些模块就可以立刻使用。

In [29]:
import math
math.sqrt(2)

1.4142135623730951

在Python中，安装第三方模块，是通过包管理工具pip完成的。比如下面一行在shell中运行可以安装numpy包

In [30]:
!pip install numpy



## 8. 错误和异常

有时候程序会出错，比如猜数字的游戏如果输入字母便会报错，如果不捕获错误并处理，程序就会退出

In [31]:
# 该实例演示了数字猜谜游戏
number = 7
guess = -1
print("数字猜谜游戏!")
while guess != number:
    guess = int(input("请输入你猜的数字："))
 
    if guess < number:
        print("猜的数字小了...")
    elif guess > number:
        print("猜的数字大了...")
    else: #guess == number:
        print("恭喜，你猜对了！")

数字猜谜游戏!
请输入你猜的数字：a


ValueError: invalid literal for int() with base 10: 'a'

所有高级语言通常都内置了一套try...except...finally...的错误处理机制，Python也不例外。

In [32]:
# 该实例演示了数字猜谜游戏
number = 7
guess = -1
print("数字猜谜游戏!")
while guess != number:
    try:
        guess = int(input("请输入你猜的数字："))
    except ValueError as e:
        print('请输入数字')
        continue
    if guess < number:
        print("猜的数字小了...")
    elif guess > number:
        print("猜的数字大了...")
    else: #guess == number:
        print("恭喜，你猜对了！")

数字猜谜游戏!
请输入你猜的数字：a
请输入数字
请输入你猜的数字：7
恭喜，你猜对了！


## 9. IO编程
Python open() 方法用于打开一个文件，并返回文件对象，在对文件进行处理过程都需要使用到这个函数。

注意：使用 open() 方法一定要保证关闭文件对象，即调用 close() 方法。

open() 函数常用形式是接收两个参数：文件名(file)和模式(mode)。
模式是字符串，每个字符表示的含义是：
- r 读
- w 写
- a 追加
- t 文本
- b 二进制

In [33]:
f = open('/home/jovyan/data/input/gender_submission.csv', 'rt') 
content = f.read()
f.close()
content.split('\n')[:5]

['PassengerId,Survived', '892,0', '893,1', '894,0', '895,0']

除了显示地调用close,可以使用with as这种上下文管理器，自动关闭文件

In [34]:
with open('/home/jovyan/data/input/gender_submission.csv', 'rt') as f:
    content = f.read()
content.split('\n')[:5]

['PassengerId,Survived', '892,0', '893,1', '894,0', '895,0']

## 10. 其他
### 10.1 列表推导
列表推导的形式如下
```
[ EXP for x in seq]
[ EXP for x in seq if COND ]
[ EXP1 if COND else EXP2 for x in seq ]
[ EXP1 if COND1 else EXP2 if COND2 else EXP3 for x in seq ]
#断句：EXP1 if COND1 else (EXP2 if COND2 else EXP3 for x in seq )
```

In [35]:
lst = [1,2,3]
print([i**2 for i in lst])
print([i**2 for i in lst if i%2==1])

[1, 4, 9]
[1, 9]


### 10.2 unicode编码

Unicode是字符集 utf-8是一种变长(1-4字节)编码方式

python3脚本文件编码方式默认是utf-8

变量名可以使用一些unicode字符

In [36]:
课程 = '大数据与分布式计算'
打印 = print
打印(课程)

大数据与分布式计算


字符串内部用固定字节(1,2,4)存储unicode字符，而非使用utf-8，所以索引操作花费常数时间，但是更浪费空间

In [37]:
import sys

s = 'yo'
print(s, sys.getsizeof(s))
s+='u'
print(s, sys.getsizeof(s))
s+='你'
print(s, sys.getsizeof(s))
s+='u'
print(s, sys.getsizeof(s))
s+='😀'
print(s, sys.getsizeof(s))
s+='u'
print(s, sys.getsizeof(s))


yo 51
you 52
you你 82
you你u 84
you你u😀 100
you你u😀u 104


### 10.3 可变对象和不可变对象
可变对象(Mutable Objects)
list set dict

In [38]:
a = [1,2,3]
print(id(a))
b = a
a += [4]
print(a)
print(b)
print(id(a))

281462432120512
[1, 2, 3, 4]
[1, 2, 3, 4]
281462432120512


不可变对象(Immutable Objects)
int float bool tuple str frozenset


In [39]:
a = (1,2,3)
print(id(a))
b = a
a += (4,)
print(a)
print(b)
print(id(a))

281462431831360
(1, 2, 3, 4)
(1, 2, 3)
281462432236624


### 10.4 序列解包


In [40]:
a = 1
b = 2
# 交换
a,b=b,a
a,b,c=['apple', 'banana', 'cherry']

a = ['apple', 'banana', 'cherry']
for idx, fruit in enumerate(a):
    print(idx, fruit)

0 apple
1 banana
2 cherry


### 10.5 类型注解


In [41]:
def scale(scalar: float, vector: list) -> list:
    return [scalar*num for num in vector]

print(scale(2,[1,2]))
print(scale('a',[1,2]))

[2, 4]
['a', 'aa']


### 10.6 Pythonic

In [42]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


### 10.7 Python常用包


- 机器学习：scikit-learn
- 深度学习：pytorch tensorflow
- 数据分析：numpy pandas scipy
- 图表可视化：matplotlib seaborn
- 网站搭建：flask django
- 爬虫：requests selenium

## 练习

1. 将上面求斐波那契数量的函数从递归改成迭代

In [None]:
def Fib(n):
    a_2=0
    a_1=1
    a=1
    for _ in range(n):
        #...
        #...
        #...
    return a

[Fib(i) for i in range(10)]

2. 请定义一个City类，该class具有如下字段:

 - name: 名称，String类型
 - latitude: 纬度，double类型
 - longitude: 经度，double类型

实例化几个City并赋值，然后打印。

3. 输入两个数字m和n,计算从m到n的和

In [None]:
m = int(input())
n = int(input())
# ...

4. 请定义一个函数quadratic(a, b, c)，接收3个参数，返回一元二次方程 ax^2+bx+c=0的两个解

5. 利用切片操作，针对数组[1,2,3,4,5,6,7,8,9]，只取偶数，并逆序输出

In [None]:
lst = [1,2,3,4,5,6,7,8,9]
#...