# 整数详解

Python的基本数据类型有下列几种
1. 数值数据类型(numeric type)：常见的数值数据又可分成整数（int)，浮点数(float)，复数(complex number)
2. 布尔值(Boolean)数据类型：也被视为数值数据类型
3. 文字序列类型(text sequence type)：也就是字符串(string)数据类型
4. bytes数据类型：这是二进制的数据类型，长度是8位
5. bytearray：字节数组数据类型
6. 序列类型(sequence type)：list, tuple
7. 映射类型(mapping type)：dict
8. 集合类型(set type)：集合set，冻结集合frozen set

其中list，tuple，dict，set又称作容器(container)  

**type()** 内置函数可以列出变量的数据类型。

* 整数

整数的英文是integer，在计算机程序语言中一般用int表示。整数大小必须在某一区间，否则会有溢位（overflow），造成数据不正确。  
Python3已经将整数存储空间的大小限制拿掉了，所以没有long了，也就是说int可以是任意大小的数值。

* 浮点数

浮点数的英文是float，既然整数大小没有限制，浮点数大小当然也没有限制。

* 整数与浮点数的混合运算

Python程序计时不同数据类型也可以执行运算，程序设计时常会发生整数与浮点数之间的数据运算。  
Python具有简单自动转换能力，在计算时会 **将整数转换为浮点数** 再执行运算。

## Test01

In [1]:
x = 10
print(x, type(x))

y = 10.5
print(y, type(y))

x = x + y
print(x, type(x))

# 整型数值没有长度限制
num = 2147483648123456789
print(num, type(num))

# 浮点型数值没有长度限制
num2 = 123456789.123456789
print(num2, type(num2))

10 <class 'int'>
10.5 <class 'float'>
20.5 <class 'float'>
2147483648123456789 <class 'int'>
123456789.12345679 <class 'float'>


不同进制的整数：在整数的使用中，除了我们熟悉的十进制整数运算，还有下列不同底数的整数运算。
* 二进制整数：0，1
* 八进制整数：0，1，2，3，4，5，6，7
* 十六进制整数：0，1，2，3，4，5，6，7，8，9，A，B，C，D，E，F


* 二进制整数与函数bin()

我们可以用二进制方式代表整数，Python中定义凡是0b开头的数字，代表这是二进制的整数。  
bin()函数可以将一般数字转换为二进制。

* 八进制整数与函数oct()

我们可以用八进制方式代表整数，Python中定义凡是0o开头的数字，代表这是八进制的整数。  
oct()函数可以将一般数字转换为八进制。

* 十六进制整数与函数hex()

我们可以用十六进制方式代表整数，Python中定义凡是0×开头的数字，代表这是十六进制的整数。  
hex()函数可以将一般数字转换为十六进制。  

程序员的数学进制 windows + r => calc ，打开 windows操作系统计算器，选择程序员计算器。

In [2]:
# 二进制
num3 = 0b01111 # 会省略1前面的0
print(num3, type(num3))

num4 = 15
print(bin(num4), type(num4))

# 八进制
num5 = 0o1234567
print(num5, type(num5))

num6 = 342391
print(oct(num6), type(num6))  # oct()：十进制转换为八进制格式

# 十六进制
num7 = 0x789abcdef
print(num7, type(num7))

num8 = 32374509039
print(hex(num8), type(num8))

15 <class 'int'>
0b1111 <class 'int'>
342391 <class 'int'>
0o1234567 <class 'int'>
32374509039 <class 'int'>
0x789abcdef <class 'int'>


# 强制类型转换

## Test02

强制数据类型转换：有时候我们设计程序时可以自行强制使用下列函数，转换变量的数据类型。
* int()：将数据类型强制转换为整数。
* float()：将数据类型强制转换为浮点数。

In [3]:
# 将字符串数据类型转换为整型或浮点型
num1 = '10'
print(f'num1\'s type is : {type(num1)}\n')
# 将 num1 强制转换为 整型 或 浮点型
print(f'int(num1) = {int(num1)}')
print(f'float(num1) = {float(num1)}\n')

sum = int(num1) + 10.5
print(sum)

sum = float(num1) + 10.5
print(sum)

num1's type is : <class 'str'>

int(num1) = 10
float(num1) = 10.0

20.5
20.5


# 数值运算常用的函数

数值运算常用的函数：下列是数值运算时常用的函数。

## abs()

计算绝对值

## pow(x, y)

返回×的y次方。

## round() 

采用Bankers Rounding概念。

* 如果处理位数左边是奇数，则使用四舍五入。
* 如果处理位数左边是偶数，则使用五舍六入。例如：

```python
round(1.5)=2
round(2.5)=2
```

* 处理小数时，第2个参数代表取到小数第几位，根据保留小数位的后两位，采用50舍去，51进位，例如：

```python
round(2.15,1) = 2.1
round(2.25,1) = 2.2
round(2.151,1) = 2.2
round(2.251,1) = 2.3
```

### Test03

In [4]:
x = -10
print(f'abs()函数的应用: {abs(x)}')

x = 2
y = 5
print(f'pow()函数的应用: {pow(x, y)}')       # 2^5

print(f'round(1.5) 的值: {round(1.5)}')
print(f'round(2.5) 的值: {round(2.5)}')
print(f'round(2.15) 的值: {round(2.15, 1)}')
print(f'round(2.25) 的值: {round(2.25, 1)}')

abs()函数的应用: 10
pow()函数的应用: 32
round(1.5) 的值: 2
round(2.5) 的值: 2
round(2.15) 的值: 2.1
round(2.25) 的值: 2.2


# 科学计算法与复数

## 科学计数法

所谓的科学计数法概念如下一个数字转成下列数学式：a\*10^n，以10为基底，我们用E或e表示，指数部分则转为一般数字，然后省略*符号。如果碰上小于1的数值，则E或e右边是负值。  

例如：0.000123转成科学计数法，最后表达式为：`1.23E-4` 或 `1.23e4-4` 。

## 复数

Python支持复数（complex number）的使用复数是由实数部分和虚数部分所组成。 

例如：a+bj或是`complex(a, b)`，复数的实部a和虚部b都是浮点数。

### Test04

In [5]:
x = 1.23456E+5
print(x)

y = 1.23e-4  # 前面有4个0，往前推
print(y)

# 复数
x = 3 + 5j
print(x, type(x))

y = complex(3, 5)
print(y, type(y))

123456.0
0.000123
(3+5j) <class 'complex'>
(3+5j) <class 'complex'>


# 布尔数据类型与bool()函数

布尔值数据类型：Python的布尔值（Boolean）数据类型的值有两种，True(真）或False(伪），它的数据类型代号是bool，这个布尔值
一般应用在程序流程的控制，特别是在条件表达式中，程序可以根据这个布尔值判断如何执行工作。如果将布尔值数据类型强制转换成整型，当原值是True，将得到1，当原值是False，将得到0。

bool()函数可以将所有数据转成True或False，我们可以将数据放在此函数得到布尔值，数数值如果是0或是空，或被视为False。

## Test05

In [6]:
x = True
print(x, type(x), int(x))

y = False
print(y, type(y), int(y))

# bool()函数
print(f'布尔值False: {bool(False)}')
print(f'整数0: {bool(0)}')
print(f'浮点数0.0: {bool(0.0)}')
print(f'空字符串" ": {bool("")}')
print(f'空格" ": {bool(" ")}')
print(f'空列表[]: {bool([])}')
print(f'空元组(): {bool(())}')
print(f'空字典: {bool({})}')
print(f'空集合set(): {bool(set())}')
print(f'None: {bool(None)}')

True <class 'bool'> 1
False <class 'bool'> 0
布尔值False: False
整数0: False
浮点数0.0: False
空字符串" ": False
空格" ": True
空列表[]: False
空元组(): False
空字典: False
空集合set(): False
None: False


# 字符串数据类型

## 字符串数据类型

所谓的字符串（string）数据是指两个单引号之间或是两个双引号之间任意个数字元符号的数据，它的数据类型代号是str，如果我们用单引号去处理字符串产生错误，碰到这种情况我们可以用双引号解决。
* 数学的运算符+可以执行两个字符串相加，产生新的字符串。
* 程序设计时如果字符串长度多于一行，可以使用三个单引号（或是三个双引号）将字符串包夹。

### Test06

In [7]:
# 由于存在内置函数str()，因此，最好不要使用str作为变量名
str0 = "This is my phone number."
print(str0)

str1 = "This is my"
str2 = " phone number."
str3 = str1 + str2
print(str3)

This is my phone number.
This is my phone number.


In [8]:
# 好处是可以保留所有格式，包括：换行 和 空格
str4 = '''This is my phone number.
  This is my home address.
This is my school name.
   '''
print(str4)

This is my phone number.
  This is my home address.
This is my school name.
   


* 如果使用三引号可以保留所有格式
* 如果使用小括号或者 \ 拼接方式，那么都将作为一行来显示字符串，无法保留格式

In [9]:
# 如果使用双引号而非三引号来包含一行字符串，
# 如果想从中间回车进行多行编辑，
# 回车换行后（IDE工具，如 PyCharm）会自动添加小括号，
# 实际上仍然是一行显示
# str="This is my phone number.This is my home address.This is my school name."
str5 = ("This is my phone number."
 "This is my home address."
 "This is my school name.")
print(str5)

This is my phone number.This is my home address.This is my school name.


In [10]:
# 可以使用 \ 代替括号() 进行字符串连接
str6 = "This is my phone number." \
 "This is my home address." \
 "This is my school name."
print(str6)

This is my phone number.This is my home address.This is my school name.


## 逸出（转义）字符（Escape Character）

逸出字符：在字符串使用中，如果字符串内有一些特殊字符，如单引号双引号必须在此特殊字符前加上 \（反斜杠），才可正常使用，这种含有\符号的字符称逸出字符。

|逸出字符 | Hex值 | 意义 | 逸出字符 | Hex值 | 意义 |
|---|---|---|---|---|---|
|\’ | 27 |单引号 | \n | 0A | 换行 |
| \” | 22 | 双引号 | \o |  | 八进制表示|
| \ \ | 5C | 反斜杠 | \\r | 0D | 光标移至最左位置 |
| \a | 07 | 响铃 | \x | | 十六进制表示 |
| \b | 08 | BackSpace键 | \t | 09 | Tab键效果 |
| \f | 0C | 换页 | \v | 0B | 垂直定位 |

### Test07

In [11]:
# 反斜杠表示转义 n -> \n 换行  t -> \t 制表符

str = "我想输出一个反斜杠\\, 再输出一个换行符\n然后再输出一个双引号\",最后输出一个制表符\tend." # end前面有一个制表符
print(str)

我想输出一个反斜杠\, 再输出一个换行符
然后再输出一个双引号",最后输出一个制表符	end.


## str()内置函数

str()函有好几个用法 

* 设定空字符串
* 设定字符串
* 强制将数值数据转换为字符串数据

### Test08

In [12]:
# 使用内置函数名作为变量名汇存在潜在的问题
str = "This is Jack's phone number."
# 无法使用一个实例名来作为函数名使用
str()

TypeError: 'str' object is not callable

* [How to Fix TypeError: 'Str' Object Is Not Callable in Python](https://builtin.com/articles/typeerror-str-object-is-not-callable)

In [13]:
# 执行 del str 后可以删除str实例
del str
# 删除str实例后可以让出str名称来作为方法名使用
str(100)

'100'

In [14]:
s1 = str()
print(s1) # 空字符串+默认打印换行

s2 = str("Python")
print(s2)

n = 123
s3 = str(n)
print(s3, type(s3))


Python
123 <class 'str'>


## 字符串相乘与原生字符串

* 字符串与整数相乘产生字符串复制效果

Python可以允许将字符串与整数相乘结果是字符串将重复该整数的次数。

* 聪明地使用字符串加法和换行字符\n

有时设计程序时，想将字符串分行输出，可以使用字符加法功能，在加法过程中加上换行字符\n即可产生字符串分行输出的结果。

* 字符串前加r

在使用Pyhon时，如果在字符串前加上r（raw，原生字符串），可以防止逸出字符被转义。相当于取消逸出字符的功能。

* 字符串与字符

在Python中没有所谓的字符(Character)数据类型，如果字符串含有一个字符，我们称这是含一个字符的字符串。

### Test09

In [15]:
# 字符串相乘就是复制效果
print('-' * 10)   # 将会输出一条华丽的分隔线

s = "Python "
print(s * 3) # 重复3次输出Python字符串

# 聪明的使用 \n 换行符
s1 = "Python"
s2 = "is"
s3 = "a nice language."
s4 = s1 + '\n' + s2 + '\n' + s3
print(s4)

# 如果在字符串前添加 r, 其字符串内容的转义效果就消失了  (raw string) 原生字符串
# 使用场景 : 文件路径, 网络资源地址中经常使用
s5 = r"hello\npython"
print(s5)

----------
Python Python Python 
Python
is
a nice language.
hello\npython


In [16]:
print(r"hh\naa\tbb") # raw string
print("hh\naa\tbb")  # normal string, with \n and \t

hh\naa\tbb
hh
aa	bb


# 字符编码

## ASCII码

计算器内部最小的存储单位是位（bit），这个位只能存储0和1。一个英文字符在计算器中是被存储成8个位的一连串0或1中，存储这个英文字符的编码我们称ASCII(American standerd Code for lnformation lnterchage，美国信息交换标准程序代码）。
![](img/ascii.jpg)
可参考：
* [ASCII 码表及说明](https://blog.csdn.net/liyuanbhu/article/details/49976271)
* [OSCHINA-常用对照表](https://tool.oschina.net/commons?type=4)
* [计算机中ascii是什么意思？](https://www.chaicp.com/list/2098.html)

我们可以使用 **chr()** 函数执行数据到ASCII码字符的转换。

## Unicode编码

计算机是美国发明的，因此ASCI|码对于英语系国家的确很好用，但是地球是一个多种族的社会存在几百种语言和文字，ASCII所能容纳的字符是有限的，为了让全球语系的用户可以彼此用计算机沟通，因此有了Unicode码的设计。

* Unicode码的基本精神是，所有的文字皆有一个码值，我们也可以将Unicode想成是一个字符集。
* 目前Unicode使用**16位**定义文字，等于65536，它的定义方式是以\u开头后面有4个十六进制的数字，所以是从\u0000至\uFFFF 。
* 在Unicodefi码中，前128个码值保留给ASC目码使用，所以对于原先存在ASCII码中的英文大小写，标点符号等，可以正常在Unicode码中使用，在应用Unicode编码中我们很常用的是ord()函数。
* **ord(x)** ：可以回传函数字符参数×的Unicode码值，如果是中文也可以回传Unicode码值。如果是英文字符，Unicode码值与ASCII码值是一样的了，有了这个函数，我们可以很轻易地获得自己名字的Unicode码值。
* ASCII使用utf-8编码规则：对于ASCII字符而言，基本上它使用1个byte存储ASCII字符，utf-8的编码方式是byte的第一个位是0，其它7个位则是此字符的ASCII码值。

### Test10

In [17]:
# ASCII 码我们需要知道的 3 个字符.  A -> 65  a -> 97  '0' -> 48
# ASCII 总共能够存储 128 个字符.

s1 = 65
s2 = 97
s3 = 48
print(s1, s2, s3)
print(chr(s1), chr(s2), chr(s3))

65 97 48
A a 0


In [18]:
# 中文使用一个字节是无法存储, Unicode 可以存储中文, 使用二个字节存储.
s4 = '爱'
print(s4)
# 对于ASCII字符而言，ord() 是 chr() 的逆函数
print(ord(s4))
print(ord('A'))
print(ord('a'))
print(ord('0'))
# utf-8 编码是可变长度的编码规则, 汉字在 utf-8 编码中是使用三个字节实现存储的.

爱
29233
65
97
48


In [19]:
print(ord('\n'))  # ord : ordinal 序数 ，还原为常规的数值形式
# ord('\n')         # Return the Unicode code point for a one-character string
chr(10)           # Return a Unicode string of one character with ordinal i;

10


'\n'

## UTF-8编码

utf-8是针对Unicode字符集的可变长度编码方式这是因特网目前所遵循的编码方式，在这种编码方式下，utf-8使用1~4个字节表示一个字符，这种编码方式会根据不同的字符变化编码长度。  
 
* ASCII使用utf-8编码规则：对于ASCII字符而言，基本上它使用1个byte存储ASCII字符，utf-8的编码方式是byte的第一个位是0，其它7个位则是此字符的ASCII码值。
* 汉字的utf-8编码规则：需要3个byte编码中文字。UTF-8编码存储汉字使用3个字节。 

## bytes数据

如果有一个你要与外界沟通或交换数据时特别是我们是使用中文，如果我们不懂中文字符串与bytes数据的转换，我们所获得的数据将会是乱码。

字符串转成bytes数据：将字符串转成bytes数据称**编码（encode）**，所使用的是encode()，这个方法的参数是指出编码的方法。

|编码 | 说明 |
|---|---|
|'ascii'| 标准7位的ASCII编码 |
|'utf-8' |Unicode可变长度编码，这也是最常使用的编码|
|'cp-1252' | 一般英文Windows操作系统编码 |
|‘cp950’ | 繁体中文Windows操作系统编码 |
|'unicode-escape' | Unicode的常数格式，\uxxxx或\Uxxxxxxxx |


bytes数据转成字符串：对于一个专业的Python程序设计师而言，常常需要从网络取得数据。所取得的是bytes数据，这时我们需
要将此数据转成字符串。将bytes数据转成字符串称码．所使用的是 **decode()** 这个方法的参数是指出编码的方法。

### Test11-encode()与decode()

In [20]:
str1 = 'abc'

# 网络中通用的编码格式 'utf-8'
encode1 = str1.encode('utf-8')  # 英文字符的utf8格式和原始格式内容相同
print(encode1, len(encode1))

# encode(字符集)  作用是将字符串数据类型转换为 `二进制字节数据类型`
str2 = "中国"
encode2 = str2.encode('utf-8')
print(encode2, len(encode2))  # 一个汉字占用3个字节

# 如果字符集不指定, 则默认为 utf-8
encode2_1 = str2.encode()
print(encode2_1, len(encode2_1))  

str3 = '今晚八点准时行动'
encode3 = str3.encode('utf-8')
print(encode3, len(encode3))

# decode(字符集)  作用是将二进制字节数据转换为指定字符集的字符串数据
str4 = encode3.decode('utf-8')
print(str4, len(str4))

b'abc' 3
b'\xe4\xb8\xad\xe5\x9b\xbd' 6
b'\xe4\xb8\xad\xe5\x9b\xbd' 6
b'\xe4\xbb\x8a\xe6\x99\x9a\xe5\x85\xab\xe7\x82\xb9\xe5\x87\x86\xe6\x97\xb6\xe8\xa1\x8c\xe5\x8a\xa8' 24
今晚八点准时行动 8


# 实例

## 计算地球到月球所需时间

马赫是声速的单位主要是纪念奥地利科学家恩斯特．马赫（ErnstMach)，一马赫就是一倍声速，它的速度大约是每小时1225千米。

从地球到月球约384 400干米，假设火箭的速度是一马赫，设计一个程序计算需要多少天，多少小时才可抵达月球。

### Test12

In [21]:
# 地球到月球的距离
distance = 384_400  # 每3个数字用一个下划线分割
# 马赫每小时为 1225 千米
speed = 1225
# 计算总小时数
total_hours = distance // speed
# 总天数
days = total_hours // 24
# 剩余小时数
hours = total_hours % 24

# 可以使用下内置divmod()函数进行简化
days, hours = divmod(total_hours, 24)

print(f'总共需要{days}天，{hours}小时.')

总共需要13天，1小时.


## 计算两点间的距离

有两个点坐标分别是（×1，y1),（×2，y2)，求两个点的距离。

其实这是勾股定理，基本概念是直角三角形两边长的平方和等于斜边的平方。$a^2+b^2=c^2$
$$
\sqrt{(x 1-x 2)^2+(y 1-y 2)^2}
$$
所以对于坐标上的两个点，我们必须计算相对直角三角形的2个边长，假设a是（×1-×2），b是(y1-y2)，然后计算斜边长，这个斜边长就是两点的距离．

![](img/gou.jpg)

在人工智能的应用中，我们常用点坐标代表某一个对象的特征（feature），计算两个点之间的距离，相当于可以了解物体间的相似程序，如果距离越短代表相似度越高，距离越长则代表相似度越低。

### Test13

In [22]:
# 假设两个点坐标分别是 (1, 8) 与 (-2, 4) 请计算着两点之间的距离

x1 = 1
y1 = 8
x2 = -2
y2 = 4

# 距离公式
distance = ((x1 - x2) ** 2 + (y1 - y2) ** 2) ** 0.5
print(f'两点间的距离为: {distance}')

两点间的距离为: 5.0
