# 基本数据类型---整数

> 万物皆数（All is number.） ---毕达哥拉斯 

在古希腊毕达哥拉斯学派中，认为世界万物都可以用数来衡量。这里只是想说，数字是人类社会长期发展都是不可或缺的最基础之物。

那什么是整数呢？整数是没有定义的，整数（integer）就是像$-65536， -256, -1, 0, 1, 256， 65536$等这样的数。

## 创建对象

在 Python 中学习和使用一种数据类型，首要的是如何创建这种类型的对象。可以通过字面常数、变量定义，表达式来创建整数对象。如下代码会创建两个整数对象：

In [2]:
i = 1
googol = 10 ** 100
print(i, googol)

1 10000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000


## 自省

在 Python中，万物皆对象。对象是类的实例，类是对象的抽象。Python 提供了丰富的自省方法来来帮助认识对象。再重复一下对象三省的续貂之言：
> 吾每遇对象必自省，用变量而知其类乎？用其值而知属性乎？用其法而知方法乎？

### 对象的特性

对象有3个特性，类型，身份标识与值。首先使用`type()`看看这些对象是什么类的实例（啥东西）：

In [2]:
print(type(i), type(googol), type(123), type(1 + 1))

<class 'int'> <class 'int'> <class 'int'> <class 'int'>


由上可以看出，它们都是类(`int`)的实例，是整数对象。也可以使用`isinstance()`函数来检查对象是否是指定类的实例：

In [3]:
isinstance(i, int), isinstance(googol, int)

(True, True)

使用内置函数`id()`查看对象内存地址

In [4]:
print(id(i), id(googol), id(1), id(1+1))

1827565024 2177583731600 1827565024 1827565056


> 在 Python 中对象一旦创建，在其生命周期，类型和身份标识不能改变。对象的值如果可以修改称为可变（mutable）对象，如果不能修改则成为不可变（immutable）对象。

那整数对象的值是什么，能不能修改？呵呵，整数的值就是这些数。整数对象是不可变对象，实际上Python基本数据类型都是不可变对象。

不可变对象是不能进行修改的，如果要进行修改，Python 就会抛出异常报错。那么对于整数变量，例如上面创建的变量`i, googol`，如何“变”起来呢？例如：

In [5]:
i = 1
i = 2
i = i + 1

1. 当运行第1行代码是，创建一个值为1的整数对象，并赋值为变量`i`；
2. 当执行第2行代码是，会把变量`i`指向新创建对象，其值为2；
3. 当执行第3行代码时，首先计算表达式`i+1`，创建值为3的整数对象，然后再把`i`指向这个对象。

![](../images/integer_var_status.png)

在这个过程中，整数对象自身并没有改变，只是创建了新的对象。

也就是说，当我们使用赋值语句时，会创建一个对象，并用变量来引用该对象。下面定义3个变量

In [6]:
g1 = 10 ** 100
g2 = 10 ** 100
g3 = g1

前2行赋值语句使用字面常数来创建变量，会创建两个对象，并指向对应的变量；第3行定义的变量则指向`g1`引用的对象：

![](../images/integer_three_objects.png)

显然这3个变量指向的对象的值是相同的，可以使用`==`来判断对象的值相同：

In [7]:
print(g1 == g2)

print(g1 == g3)

True
True


变量`g1`与`g2`的值相同，但却引用两个不同的对象，也就是说对应的身份地址是不同，可以使用`id()`来检查：

In [8]:
id(g1), id(g2), id(g3)

(2177583732896, 2177583786288, 2177583732896)

在 Python 中提供有**身份运算符**`is`，用来检查两个变量的身份地址是否相同：

In [9]:
# 检查身份是否相同
print(g1 is g2)
print(g1 is g3)

# 检查身份是否不同
print(g1 is not g2)
print(g1 is not g3)

False
True
True
False


#### Python 整数的内存秘密

在上面的赋值语句中，当使用相同的字面常数来定义变量时，其身份地址是不同。但看看下面的代码：

In [10]:
i1 = 256
i2 = 256
i1 is i2

True

它们的身份确是相同的，这是为啥呢？在 Python 中，每次定义变量可能都会创建对象，也就是分配内存。当对象没有引用时，就销毁内存。显然会影响 Python 程序的运行效率。所以，Python 会事先创建一批整数对象，这样当定义小一点的整数变量时，就不用反复创建和销毁内存了。这些数字的范围大约为$[-5,256]$：

In [11]:
i1 = -6
i2 = -6
print(i1 is i2)
i1 = -5
i2 = -5
print(i1 is i2)
i1 = 256
i2 = 256
print(i1 is i2)
i1 = 257
i2 = 258
print(i1 is i2)

False
True
True
False


对于不变对象而言，不知道它们在内存中是如何分配，并不影响工作，但却有助于理解 Python 的运行。

### 对象属性和方法

站在实用主义的角度出发，遇到一个对象，重要的是使用它们，那么需要知道这些对象有哪些属性和方法。Python 提供了多种自省方法：

调用`help()`函数，传入一个对象，可以列出该对象的帮助，其中包括对象拥有的方法及其数据。例如，查看变量`googol`的帮助信息：

In [41]:
help(googol)

Help on int object:

class int(object)
 |  int(x=0) -> integer
 |  int(x, base=10) -> integer
 |  
 |  Convert a number or string to an integer, or return 0 if no arguments
 |  are given.  If x is a number, return x.__int__().  For floating point
 |  numbers, this truncates towards zero.
 |  
 |  If x is not a number or if base is given, then x must be a string,
 |  bytes, or bytearray instance representing an integer literal in the
 |  given base.  The literal can be preceded by '+' or '-' and be surrounded
 |  by whitespace.  The base defaults to 10.  Valid bases are 0 and 2-36.
 |  Base 0 means to interpret the base from the string as an integer literal.
 |  >>> int('0b100', base=0)
 |  4
 |  
 |  Methods defined here:
 |  
 |  __abs__(self, /)
 |      abs(self)
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __and__(self, value, /)
 |      Return self&value.
 |  
 |  __bool__(self, /)
 |      self != 0
 |  
 |  __ceil__(...)
 |      Ceiling of an Integral retur

使用内置函数`dir()`可以列出对象的属性和方法：

In [47]:
print(dir(googol))

['__abs__', '__add__', '__and__', '__bool__', '__ceil__', '__class__', '__delattr__', '__dir__', '__divmod__', '__doc__', '__eq__', '__float__', '__floor__', '__floordiv__', '__format__', '__ge__', '__getattribute__', '__getnewargs__', '__gt__', '__hash__', '__index__', '__init__', '__init_subclass__', '__int__', '__invert__', '__le__', '__lshift__', '__lt__', '__mod__', '__mul__', '__ne__', '__neg__', '__new__', '__or__', '__pos__', '__pow__', '__radd__', '__rand__', '__rdivmod__', '__reduce__', '__reduce_ex__', '__repr__', '__rfloordiv__', '__rlshift__', '__rmod__', '__rmul__', '__ror__', '__round__', '__rpow__', '__rrshift__', '__rshift__', '__rsub__', '__rtruediv__', '__rxor__', '__setattr__', '__sizeof__', '__str__', '__sub__', '__subclasshook__', '__truediv__', '__trunc__', '__xor__', 'bit_length', 'conjugate', 'denominator', 'from_bytes', 'imag', 'numerator', 'real', 'to_bytes']


Python 内置函数`hasattr()`用来检查对象是否存在指定属性或方法：

In [48]:
hasattr(googol, '__add__')

True

#### 魔术方法

在整数对象使用自省和帮助函数时，例如使用`dir()`函数，我们发现整数对象有如下成员：
```
['__abs__',
 '__add__',
 ...
```

大家或许会想，`__add__`是不是加法啊？想了就做，尝试一下：

In [49]:
googol.__add__(1)

10000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000001

确实是加法！大家也许准备吐槽，Python也不咋地啊，Guido的数学是不是体育老师教的，在其它语言可以直接写为`googol + 1`，这种数学操作符号岂不简单又直观。确实如此，这样写确实更简洁优雅。不过 Python 也绝对不会笨的，可以试一下：

In [16]:
googol + 1

10000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000001

二者结果是一样的，那为什么多此一举呢？Python之父对语言设计美学的深入理解绝对厉害，其设计的 Python 语言简洁优雅，而且一致性非常好。在 Python 中万物皆对象，对象中使用双划线`__`包括起来方法，称为特殊方法或魔术方法（magic method），有时也称为双下方法，还为此创建了新词“dunder”(double under)。

无论是整数，浮点数，还是字符串等其它类型，只要定义了`__add__`魔术方法，就可以使用`+`运算符来操作。使用`+`运算符操作，实际是调用`__add__`方法。

在下面运算符操作一节中，将详细介绍各种运算符操作。

#### 普通方法

整数对象还有一些常规方法：
- `bit_length()`，获得整数的位数。

In [53]:
print(i.bit_length())
print(googol.bit_length())

2
333


可以看出整数大小不同，在内存中占用的位数也不相同。

#### 属性与方法的差别

对于一个对象来说，通常具有一些属性（特征）和方法（行为），二者的区别是，前者是数据值，后者类似可调用的方法。Python 提供了自省用的函数`callable()`，来检查其是否可调用。例如，如下代码检查整数对象的成员`__add__`与`real`：

In [58]:
print(callable(googol.__add__))
print(callable(googol.real))

True
False


可知，前者是整数对象的模式方法，后者是整数对象的属性。整数有两个属性`real`与`imag`，基本上没有大用，主要是和复数等数值类型保持一致。

In [59]:
print(googol.real, googol.imag)

10000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000 0


## 运算符操作

上面讲过，在 Python 中，运算符与魔术方法相关，这里介绍一些常用的操作符。

### 算术运算符

下面列出算术运算符及其对应的魔术方法

|运算符 | 魔术方法    |  说明   |
| :----:|:-------------| -------: |
| `+`  | `__add__`    | 加法   |
| `-`  | `__sub__`    | 减法   |
| `*`  | `__mul__`    | 乘法   |
| `/`  | `__truediv__` | 真除   |
| `//` | `__floordiv__`| 地板除  |
| `%`  | `__mod__`    | 求余   |
| `**` | `__pow__`    | 求幂   |

In [60]:
# 加法(__add__)
print(1 + 1)
print(googol + 100)

# 减法(__sub__)
print(256 - 1)
print(googol - googol)

# 乘法(__mul__)
print(16 * 16)
print(googol * 128)

2
10000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000100
255
0
256
1280000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000


在 Python 中除法包括两种：
* 真除，即使分子和分母都是整数对象，也返回一个浮点数值
* 整除（地板除），即整除，返回一个整数。

In [61]:
# 真除(__truediv__)
print(12 / 2)
# 地板除(__floordiv__)
print(11 // 2)

6.0
5
1


在 Python 2 中，除法称为传统除法，整数除法相对于执行地板除：
```python
# python 2
11 / 2 == 5
```

In [63]:
# 取模（求余）(__mod__)
print(11 % 2)      

# 求幂(__pow__)
print(2 ** 16)

1
65536


还有几个魔术方法，对应的是 Python 的内置函数运算：

|运算符 | 魔术方法    |  说明   |
| :----:|:-------------| -------: |
| `divmod()`  | `__divmod__`  | 地板除与求余   |
| `pow`     | `__pow__`    | 求幂   |

定义了这些魔术方法，就可以使用 Python 内置函数`divmod()`：
```python
divmod (a,b)
```
即返回`(a//b, a%b)`结果

In [67]:
# divmod (__divmod__)
divmod(11, 2)

(5, 1)

In [65]:
# pow (__pow__)
print(pow(2, 16))
print(pow(2, 32))

65536
4294967296


### 一元运算符

|运算符  | 魔术方法    |  说明   |
| :-----:|:-------------| -------: |
| `-`   | `__neg__`   | 取负    |
| `+`   | `__pos__`   | 取正   |
| `abs()`| `__abs__`   | 求绝对值 |

In [72]:
# 取负
print(-googol)
# 取正，用于澄清代码
print(+googol)

-10000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000
10000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000


定义了`__abs__` 方法，就可以使用 Python 内置函数`abs()`来计算绝对值：

In [71]:
# 求绝对值 - `abs` (__abs__)
print(abs(-1024))
print(abs(-3.1314))

1024
3.1314


###  反向算术运算符

当运行`a + b`时，变量`a`引用的对象没有定义魔术方法`__add__`，那么就会调用变量`b`引用对象的魔术方法`__radd__`。

|运算符 | 魔术方法    |  说明      |
| :----:|:-------------| ------------: |
| `+`  | `__radd__`    | 加法右向操作 |
| `-`  | `__rsub__`    | 减法右向操作 |
| `*`  | `__rmul__`    | 乘法右向操作 |
| `/`  | `__rtruediv__` | 除法右向操作 |
| `//` | `__rfloordir__`| 除法右向操作 |
| `%`  | `__rmod__`    | 求余右向操作 |
| `**` | `__rpow__`    | 求幂右向操作 |

###  增强型赋值运算符

在编程中经常会遇到如下操作：
```python
a = a + b
```
即把变量`a`与另一个对象进行操作运算，再把结果赋值给变量`a`。与其它语言一样，Python 也提供有增强型赋值运算符来实现上述运算，例如：
```python
a += b
```

增强型赋值运算符 `+=` 对应有魔术方法是`__iadd__()`，不过在整数类中并没有定义这些成员：

In [5]:
hasattr(googol, '__iadd__')

False

在进行增强型赋值运算 `+=`时，如果对象定义有`__iadd__()` 方法，则会调用该方法，如果为定义的话该赋值操作就相当于：
```python
a = a + b
```

对于不可变对象来说，这个操作会调用`__add__()`方法创建一个新的对象，然后再绑定到原变量上。

对于二元算术运算符（`+,-,/,//,%,**`）来说，均存在类似运算，下表列出了增强型赋值运算符与对应的魔术方法：

|运算符 | 魔术方法    |  说明   |
| :----:|:--------------| -------: |
| `+=`  | `__iadd__`   |  加法   |
| `-=`  | `__isub__`   |  减法   |
| `*=`  | `__imul__`   |  乘法   |
| `/=`  | `__itruediv__` |  真除   |
| `//=` | `__ifloordiv__`|  地板除  |
| `%=`  | `__imod__`    |  求余   |
| `**=` | `__ipow__`    |  求幂   |

In [73]:
x = 2
x += 1
print(x)

3


In [74]:
x = 2
x *= 2
print(x)

5.5


### 比较运算符     

比较运算符用于两个对象的比较，返回值为布尔数。

|运算符 | 魔术方法    |  说明   |
| :----:|:-------------| -------: |
| `<`  | `__lt__`    | 小于    |
| `<=`  | `__le__`   | 小于等于 |
| `>`  | `__gt__`    | 大于    |
| `>=` | `__ge__`    | 大于等于 |
| `==`  | `__eq__`   | 等于    |
| `!=` | `__ne__`    | 不等于  |

In [75]:
# 小于(__lt__)
googol = 10 ** 100
googol < 10 ** 100 - 1

False

In [76]:
# 大于(__gt__)
googol > 10**100 - 1

True

## 整数进制

默认情况下，整数采用十进制，也可以使用其它进制表示， 例如：
- 二进制（以`0b`开始）
- 八进制（以`0o`开始）
- 十六进制（以`0x`开始）

In [30]:
ix1 = 255
ix2 = 0b11111111
ix8 = 0o377
ix16 = 0xff
print(ix1, ix2, ix8, ix16)

255 255 255 255


Python 内置提供了几个函数，用户返回整数对象对应进制的字符串：
- `bin()`， 返回二进制表示
- `oct()`， 返回八进制表示
- `hex()`， 返回十六进制表示

In [31]:
print(ix1)
print(bin(ix1))
print(oct(ix1))
print(hex(ix1))    

255
0b11111111
0o377
0xff


### 位运算符

对于整数，可以进行位运算操作，有如下位运算符：  

| 运算符 | 魔术方法    |  说明     |
| :----: |:-------------| :---------- |
| `<<`   | `__lshift__` | 左移运算   |
| `>>`   | `__rshift__` | 右移运算   |
| `&`    | `__and__`   | 按位与运算  |
| <code>&#124;</code>    | `__or__`    | 按位或运算  |
| `^`    | `__xor__`   | 按位异或运算|
| `~`    | `__invert__` | 按位取反运算|

下面实例，展示了一些位操作运算：

In [78]:
# 左移运算(__lshift__)
print(bin(0b11110010 << 2))

# 右移运算(__rshift__)
print(bin(0b11110010 >> 2))

# 按位与运算(__and__)
print(bin(0b10101010 & 0b01010101))

0b1111001000
0b111100
0b0


## 转换

> 在吃的法则里，风味重于一切。中国人从来没有把自己束缚在一张乏味的食品清单上。人们怀着对食物的理解，在不断的尝试中寻求着转化的灵感。
> ---舌尖上的中国

对于吃货来说，可以从豆子做出豆腐、豆浆，豆腐脑，豆皮等各种美食。在 Python 中，也需要在不同数据类型之间进行转换。

在前面的实例中，都是使用字面常数或表达式来创建整数对象。除此之外，可以使用 Python 内置函数`int()`类来构造一个对象，例如下面代码会把其它类型数据转换为整数：

In [88]:
ixx0 = int()
ixx1 = int(True)
ixx2 = int(1024.1)
ixx3 = int('1024')
print(type(ixx0), type(ixx1), type(ixx2), type(ixx3))
print(ixx0, ixx1, ixx2, ixx3)

<class 'int'> <class 'int'> <class 'int'> <class 'int'>
0 1 1024 1024


> 注意！ `int`实际上是 Python 内置的数据类，类似的还有很多，但大家习惯上仍称呼它们为函数。

## 与现实世界的差异

计算机是对现实世界的抽象，抽象很难完美表现现实世界。可以说，Python 内置整数类型完美的实现了现实世界的整数。

在计算机诸多编程语言中，整数是个特定的变量类型。例如在 32 位系统，一个整数是 32 位；在 64 位系统，整数是 64 位。整数类型还分为有符号整数（int）和无符号整数（unsigned int）之分。由于位数限制，也意味着对应的整数有一定范围。例如在32位系统下：
- 无符号整数范围：$0 \sim 2^{32}-1$
- 有符号整数：$-2^{31} \sim 2^{31}-1$

那么就存在整数溢出的问题：
> 溢出（overflow），数据大小超出数据类型能表达的范围。

例如，在 C 语言中，32位操作系统的无符号整数的范围是$[0,2^{32}-1]$， 当一个变量大小为：
```c
uint_max = 2**32 - 1
```

进行加法操作：
```c
uint_max += 1
```

它的结果不是$2^{32}$，而是由于整数溢出问题，结果为$0$

对于 Python 内置整数类型，不存在这个问题。其值可以足够大，直到自己计算机的物理内存无法不足够来存储这个数值。

使用整数对象的`bit_length()`方法可以获得该整数对象的位数，例如：

In [83]:
big_number = 10 ** 1000
big_number.bit_length()

3322

## 错误与异常

> 像硬币一样，任何事物都具有两重性或两面性。

学习 Python，除了掌握正确的使用方法外，还需要了解出错是怎么回事。常有人问如何才算掌握了 Python，笔者觉得熟练掌握 Python 其中一个特征就是：知道哪里有坑，自己不掉进去；掉进去能快速知道咋回事，像条件反射一样爬出来。所以要熟练掌握 Python，把常犯错误列出来是个不错的办法。对于整数来说，常犯的错误有如下：

### 分母（除数）不能为零

如果分母为零，则会出现零除异常`ZeroDivisionError`。

In [84]:
123 // 0

ZeroDivisionError: integer division or modulo by zero

### 转换错误

使用`int()`创建整数对象时，输入的字符串不全是数字，Python 会抛出值错误(`ValueError`)。

In [87]:
ixx = int('nonumber')

ValueError: invalid literal for int() with base 10: 'nonumber'

## 小结

本节花了大量笔墨使用面向对象的方法来介绍 Python 内置数据类型---整数。如何用自省的方法来剖析一个对象的各种特性、属性与方法。

本节分析了运算符与对象魔术方法的关系，截止目前已经介绍了Python中的各种运算符：
- 算术运算符
- 一元运算符
- 反向算术运算符
- 增强赋值算术运算符
- 比较运算符
- 身份运算符

在后续章节中，还会介绍更多运算符。

截止现在，已经介绍和使用过的Python内置函数包括：
- 自省
    - `type()`,查询对象的类
    - `isinstance()`，检查对象是否是指定类的实例
    - `id()`，返回对象的身份地址
    - `dir()`，列出对象的成员        
    - `hasattr()`，检查对象是否有指定成员
    - `callable()`，检查对象是否可以调用
   
- 帮助
    - `help()`，打印帮助
    
- 数学运算
    - 'abs()',求绝对值
    - 'divmod()',返回整除与求余结果
    - 'pow()',返回求幂结果    
    
- 类型函数
    - `int()`，创建整数对象
    
- 整数进制
    - `bin()`， 返回二进制表示
    - `oct()`， 返回八进制表示
    - `hex()`， 返回十六进制表示    