# 数据类型和变量 

在计算机内部可以把数据都看成对象，而变量就是在程序中用来指向这些对象的，对变量赋值就是把数据和变量关联起来。  
Python的基本数据类型：`Number`（数字）、`String`（字符串）、  
`List`（列表）、`Tuple`（元组）、`Set`（集合）、`Dictionary`（字典）。  

## Number

### 整数（int）  
Python可以处理任意大小的整数，包括负整数，表示方法和数学写法一样，例如100、-8080、0。  
有时候用十六进制表示比较方便，十六进制用0x前缀和0-9，a-f表示，例如0xff00、0xa5b4c3d2。  
Python的整数没有大小限制，而某些语言的整数根据其存储长度是有大小限制的。    
Python的浮点数也没有大小限制，但是超出一定范围就直接表示为inf（无限大）。

### 浮点数（float）  
小数之所以称为浮点数，是因为用科学记数法表示时，小数点位置是可变的，  
比如，1.23 x 10^9 和 12.3 x 10^8是相等的。浮点数可以用数学写法，如3.14、-9.01。  
但是很大或很小的浮点数，就必须用科学计数法表示，1.23 x 10^9就是1.23e9或者12.3e8。  
整数和浮点数在计算机内部存储方式不同，整数运算永远是精确的（包括除法），而浮点数运算可能会有误差。

Python有两种除法，一种是`/`，其计算结果始终是浮点数，即使两个整数恰好整除。  
还有一种是`//`，称为地板除，两个整数的地板除永远是整数，即使除不尽。  
//除法只取结果的整数部分，所以Python还提供余数运算% ，可以得到两个整数相除的余数。

In [1]:
9 / 3

3.0

In [2]:
10 // 3

3

In [3]:
10 % 3

1

### 布尔值（bool）  
布尔值只有True、False两种值，可以直接用True、False表示布尔值，也可以通过布尔运算计算出来：

In [4]:
True

True

In [5]:
3 > 5

False

`and`运算是与运算，只有所有项都为True，and运算结果才是True；  
`or`运算是或运算，只要其中有一个为True，or运算结果就是True；  
`not`运算是非运算，它是单目运算符，把True变成False、False变成True。

In [6]:
5 > 3 and 3 > 1

True

In [7]:
5 > 3 or 1 > 3

True

In [8]:
not 1 > 2

True

In [None]:
# 布尔值经常用在条件判断中
if age >= 18:
    print('adult')
else:
    print('teenager')

In [9]:
# bool是int的子类，因此True、False可以和数字相加，语句`True==1`、`False==0`会返回True
True+1

2

### 复数（complex）  
复数由实数部分和虚数部分构成，可以用`a+bj`或`complex(a,b)`表示，复数的实部a和虚部b都是浮点型。

## String

字符串是以单引号或双引号括起来的任意文本，例如'abc'，"xyz"。  
引号本身不是字符串的一部分，如果'也是内部的一个字符，可以用""将其括起来，
比如"I'm OK"包含的是 I，'，m，空格，O，K这6个字符。  
如果字符串内部既包含'又包含"，则可以用转义字符\来标识，  
比如'I\'m \"OK\"!'表示的字符串内容是I'm "OK"!。

In [10]:
print('I\'m \"OK\"!')  

I'm "OK"!


转义字符`\`可以转义很多字符，比如`\n`表示换行，`\t`表示制表符。  
字符\本身也要转义，`\\`表示的字符就是\。  

In [11]:
print('I\'m learning\nPython.')

I'm learning
Python.


In [12]:
print('\\\n\\')

\
\


如果字符串里面有很多字符需要转义，就需要加很多\。  
为了简化，允许用`r' '`表示' '内部的字符串默认不转义。

In [13]:
print('\\\t\\')

\	\


In [14]:
print(r'\\\t\\')

\\\t\\


如果字符串内部有很多换行，都用\n会让代码可读性很差。为了简化，Python允许用`''' '''`的格式表示多行内容：  
`print('''line1`  
`... line2`  
`... line3''')`  
上面是在交互式命令行中输入多行内容的情形，提示符由>>>变为...表示可以接着上一行输入，写成程序就是：

In [15]:
print('''line1
line2
line3''')

line1
line2
line3


## List

list是一种有序集合，可以随时添加和删除其中的元素：

In [16]:
# 变量classmates就是一个list，函数len()可以获得list元素的个数
classmates = ['Michael', 'Bob', 'Tracy']
print(classmates)
len(classmates)

['Michael', 'Bob', 'Tracy']


3

In [17]:
# 用索引来访问list中的元素，注意索引从0开始，索引越界时会报IndexError错误
# 要把某个元素替换成别的元素，可以直接赋值给对应的索引位置
classmates[0] = 'Sarah'
print(classmates[0])

Sarah


要取最后一个元素，除了计算索引位置外，还可以用-1做索引来直接获取。  
类似可以获取classmate的倒数第2、3个元素，当然，倒数第4个就越界了。

In [18]:
classmates[-1]

'Tracy'

In [19]:
classmates[-3]

'Sarah'

`append()`可以往list末尾追加元素；`insert()`可以插入元素到指定位置；`pop()`可以删除指定位置的元素。

In [20]:
classmates.append('Adam')
print(classmates) 
classmates.insert(1, 'Jack') # 第一个参数为指定位置的索引，第二个参数为要插入的元素
print(classmates)
classmates.pop() # 无参数则删除list末尾的元素
print(classmates) 
classmates.pop(1) # 参数为指定位置的索引
print(classmates)

['Sarah', 'Bob', 'Tracy', 'Adam']
['Sarah', 'Jack', 'Bob', 'Tracy', 'Adam']
['Sarah', 'Jack', 'Bob', 'Tracy']
['Sarah', 'Bob', 'Tracy']


In [21]:
# list的元素的数据类型可以相同也可以不同
s = ['asp', 'php']
l = ['Apple', 123, ['asp', 'php'], True] # l只有4个元素，其中l[2]是另一个list
len(l)
# 要拿到'php'可以写s[1]或者l[2][1]，因此L可以看成是一个二维数组

4

In [22]:
# 空list长度为0
p= []
len(p)

0

## Tuple

tuple和list相似，但是tuple在定义时就必须确定元素，一旦初始化就不能修改元素。  
虽然不能对元组的单个元素进行修改，但事实上完全可以直接对元组重新赋值。

In [23]:
t = ("优雅","明确","简单")
t = ("优雅的","明确的","简单的")
print(t)

('优雅的', '明确的', '简单的')


In [24]:
# 二者都是list/二者都是tuple时，可以用运算符+拼接
l0 = [1,2,3]
l1 = [3,4]
l0 = l0 + l1
print(l0)
t0 = (1,2,3)
t1 = (4,5)
t0 = t0 + t1
print(t0)

[1, 2, 3, 3, 4]
(1, 2, 3, 4, 5)


In [25]:
# tuple获取元素的方法和list是一样的
classmates = ('Michael', 'Bob', 'Tracy')
classmates[0]

'Michael'

In [26]:
# 如果要定义一个空tuple，可以直接赋()
t = ()
print(t)

()


创建只有一个元素的元组，要在元素后面加逗号，否则括号会被当作运算符使用。

In [27]:
t = (50)
type(t) # 不加逗号，类型为整型

int

In [28]:
t = (50,)
type(t) # 加上逗号，类型为元组

tuple

In [29]:
# 元组中可以包含可变对象（比如列表），但通常不这样做，因为容易出问题
t = ('a', 'b', ['A', 'B'])
t[2][0] = 'X'
t[2][1] = 'Y'
t

('a', 'b', ['X', 'Y'])

上例中的tuple定义时有3个元素，分别是'a'，'b'和一个list。  
不是说tuple的元素初始化后就不可变了吗？这个例子是怎么回事呢？  
表面上tuple的元素变了，其实变的是list的元素，tuple指向的list并没有变成别的对象。  
所以tuple所谓的“不变”是说，tuple的每个元素指向不变：  
指向'a'就不能改成指向'b'，指向某个list就不能改成指向其他对象。  
综上所述，要创建一个内容真正不变的tuple必须保证每一个元素本身也不可变。

## Dict

dict全称dictionary，在其他语言中也称为map，使用`key-value`式存储。  
与list相比，dict用空间来换取时间，查找和插入的速度快，耗时不随元素增加而增加，但是需要占用大量的内存。  
假设要根据学生名字查找对应成绩，用列表实现需要两个list，用字典实现则只需建立一个“名字-成绩”的对照表：

In [30]:
# 下例为创建非空字典，创建空字典可以直接赋{}
d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}
# 给定一个名字，如'Michael'，dict在内部就可以计算出'Michael'对应成绩95存放的内存地址，所以速度非常快
d['Michael']

95

In [31]:
# 欲把数据放入dict，除了初始化时指定外，还可以通过key放入
d['Adam'] = 67
d['Adam']

67

key和value一一对应，多次对一个key放入value，后面的值会把前面的覆盖掉。  
此外，dict内部存放的顺序和key放入的顺序没有关系。  
如果查找时使用的key不存在，dict会报错。避免报错有两种办法，一是通过`in`判断key是否存在，  
二是使用dict提供的`get()`，如果key不存在，将会返回None或者指定值。

In [32]:
'Thomas' in d # 使用in判断

False

In [33]:
# 返回None时Python交互式命令行不显示结果。
d.get('Thomas') # dict.get(key)，指定key不存在返回None

In [34]:
d.get('Thomas', -1) # dict.get(key[, value])，指定key不存在返回可选参数value

-1

In [35]:
# 删除key可以使用pop(key)，对应的value也会从dict中删除
d.pop('Bob')
d

{'Michael': 95, 'Tracy': 85, 'Adam': 67}

dict的key必须是不可变对象，这是因为dict根据key来计算value的存储位置，该算法称为哈希（Hash）。  
如果每次相同的key计算的结果不同，dict内部就完全混乱了。要保证hash的正确性，作为key的对象就不能变。  
Python中字符串、整数等都是不可变的，可以放心地作为key，而列表等可变的就不能作为key。

## Set

set原理和dict类似，也存储一组key，但不存储value。与dict一样，set中的key不能重复。  
两个可变对象无法判断是否相等，进而无法保证set内部无重复元素，因此set不可以放入可变对象。  
可以使用大括号`{}`或者`set()`创建set，创建空集必须用set()，因为直接赋{}是用来创建空字典的。

In [36]:
# 首先演示一下set的自动去重复特性
s = {1, 2, 3, 1, 2, 3}
print(s)

{1, 2, 3}


In [37]:
# 用set()建立set要提供一个list作为输入
s = set([1, 2, 3]) 
print(s)
# 传入的list有序，但是set无序，打印显示的{1, 2, 3}并不代表这三个元素的顺序

{1, 2, 3}


In [38]:
# add(key)可以添加元素到set中，可以重复添加，但不会有效果
s.add(4)
s

{1, 2, 3, 4}

In [39]:
# remove(key)可以删除元素
s.remove(4)
s

{1, 2, 3}

In [40]:
# 两个set的交集运算
s1 = set([1, 2, 3])
s2 = set([2, 3, 4])
print(s1&s2)
print(s1|s2)

{2, 3}
{1, 2, 3, 4}


## 再议不可变对象

对于不可变对象，调用对象自身的任意方法，不会改变该对象自身的内容。  
因为这些方法会创建新的对象并返回，比如对字符串`a1 = 'abc'`，a1是变量，'abc'才是字符串对象。   
令`a2 = a1.replace('a', 'A')`，打印a1得到'abc'，而打印a2则得到'Abc'。

## 空值  

Python有一个特殊常量`None`，表示空值。None不能理解为0，因为0是一个有意义的具体值。  
None属于`NoneType`类型，也是该数据类型的唯一值（其他语言可能称这个值为null、nil或undefined）。  
因此，我们不能再创建其它NoneType类型的变量，但可以将None赋值给任何变量。

## 变量

变量在程序中用一个变量名表示，变量名必须是大小写英文、数字和_的组合，且不能用数字开头。  
在Python中，等号`=`是赋值语句，Python中变量赋值时会自动设置数据类型，不需要声明，例如：

In [None]:
a = 123 # a是整数
a = 'ABC' # a变为字符串

可以使用`type()`函数获取变量的数据类型：

In [41]:
x = 29.5
print(type(x))

<class 'float'>


Python这样变量类型不固定的语言称之为动态语言，与之对应的是静态语言。  
静态语言在定义变量时必须指定变量类型，如果赋值的时候类型不匹配会报错。  
例如Java是静态语言，赋值语句如下（Java中//表示单行注释）：

In [None]:
int a = 123; // 定义了a为int型变量
a = "ABC"; // 出现错误，不能把字符串赋给整型变量

In [42]:
x = 10
# 不要把赋值语句的等号等同于数学意义
# 赋值语句先计算右侧表达式x+2得到12，再赋给变量x
x = x + 2
print(x)

12


In [None]:
# Python允许在一行中为多个变量赋值
x, y, z = 'Orange', 'Banana', 'Cherry'
a = b = c = 'Apple'

理解变量在计算机内存中的表示也非常重要。执行语句`a = 'ABC'`时，  
解释器在内存中创建了一个字符串'ABC'和一个变量名为a的变量，并把它指向'ABC'。  
把一个变量a赋值给另一个变量b，这个操作实际上是把变量b指向变量a所指向的数据。

In [43]:
a = 'ABC'
b = a
a = 'XYZ'
print(b)

ABC


## 全局变量

在函数外部创建的变量称为全局变量，全局变量可以在函数内部或外部中使用。  
在函数内部创建一个与已有全局变量相同名称的变量，该变量将会是局部变量，  
局部只能在函数内部使用，同名的全局变量则保持不变。

In [44]:
x = 'awesome'
def myfunc():
    x = 'fantastic'
    print('Python is ' + x)
myfunc()
print('Python is ' + x)

Python is fantastic
Python is awesome


如欲在函数内部创建全局变量，或是在函数内部更改全局变量，可以使用`global`关键字：

In [45]:
def myfunc():
    global x
    x = 'fantastic'
myfunc()
print('Python is ' + x)

Python is fantastic


In [46]:
x = 'awesome'
def myfunc():
    global x
    x = 'fantastic'
myfunc()
print('Python is ' + x)

Python is fantastic


## 常量

所谓常量就是不能变的变量，通常用全部大写的变量名表示常量，例如π表示为PI=3.14159265359。  
事实上PI仍然是一个变量，Python语法并没有任何机制保证PI不会被改变，  
用全部大写的变量名表示常量只是一个习惯用法，如果一定要改变变量PI的值是可行的。