# 变量和基本数据类型

本节将介绍Python中最重要和最基本的数据类型。

## 变量

变量是对Python对象的引用，可以通过赋值运算符来创建变量，例如：

In [1]:
a = 1
diameter = 3.
height = 5.
cylinder = [diameter, height]    # 引用列表

变量名可以有任意的大小写字母、下画线和数字组合而成。变量名不能以数字开头。注意变量名是区分大小写的。好的变量名是描述你工作的重要组成部分，因此建议使用描述性的变量名。

Python中有一些保留的关键字不能用作变量名（见下表）。尝试使用这些关键字作为变量名将引发语法错误。

 and | as | assert | break | class | continue | def | del 
 :----:|:----:|:----:|:----:|:----:|:----:|:----:|:----: 
 elif | else | except | exec | False | finally | for | from 
 global | if | import | in | is | lambda | None | nonlocal 
 not | or | pass | raise | return | True | try | while
 yield| 

与其他编程语言不同的是， Python 变量不需要进行类型声明。可以用一个多重赋值语句来创建多个变量：

In [2]:
a = b = c =1   # 变量 a、b、c的值均为1

变量在它们定义后也可以被修改

In [3]:
a = 1 
a = a + 1   # a 的值变为2
a = 3 * a   # a 的值变为6 
a

6

最后两个语句是通过使用增量运算符，将两个运算符分别直接与赋值运算符组合在一起来书写：

In [4]:
a += 1   # 相当于 a = a + 1
a *= 3   # 相当于 a = 3 * a
a

21

## 数值类型

像其他计算语言一样，Python 中也有数值类型

- 数值类型 int： 理论上至少是整个 $\mathbb{Z}$
- 数值类型 float： 是$\mathbb{R}$ 的有限子集
- 数值类型 complex： 是$\mathbb{C}$ 的有限子集

### 整数类型

整数类型是最简单的数值类型。 将 +、-或\*运算符应用于整数会返回一个整数，除法运算符//会返回一个整数，而除法运算符/可能返回一个浮点数

In [5]:
6 // 2    # 3
7 // 2    # 3
7 / 2     # 3.5

3.5

### 浮点数

如果在Python 中执行语句 a = 3.0, 就创建了一个浮点数（Python数据类型： float）。这些浮点数是有理数$\mathbb{Q}$ 的一个子集。

另外，常数可以用指数符号表示为 a = 30.0e-1 或简化为 a = 30.e-1。符合e将指数与尾数分开，表示式显示为数学形式则为$a = 30.0 \times 10^{-1}$.浮点数职的是这些数字的内部表示，并在大范围内考虑数字时反映了小数点的浮动位置。

将基本数学运算符 +、-、\*和/作用于菱格浮点数或一个整数与一个浮点数时，将返回一个浮点数。浮点数之间的运算很少返回像有理数运算一样的精确的预测结果：

In [6]:
0.4 - 0.3   #返回 0.10000000000000003

0.10000000000000003

在浮点数比较时，这个事实很重要：

In [7]:
0.4 - 0.3 == 0.1  #返回 False

False

### 无穷与非数字

在SciPy中，将特殊浮点数 inf 赋值给溢出结果：

In [8]:
from scipy import *

exp(1000.)    # inf

a = inf
3 - a  # -inf
3 + a  # inf

inf

使用inf 可能得不到数学意义上的结果。这在Python中时通过将另一个特殊的浮点数 nan 赋值给运算结果来表示的。nan 代表非数字，也就是数学预算的一个未定义的结果：

In [9]:
a + a # inf
a - a # nan
a / a # nan

nan

使用 nan 和inf 执行运算时有一些特殊的规则。例如，nan与任意数值（甚至本身）做比较，总是返回 False：

In [10]:
x = nan
x < 0 # False
x > 0 # False
x == x # False

False

浮点数 inf 的计算结果比预期的要多得多：

In [11]:
0 < inf     # True
inf <= inf  # True
inf == inf  # True
-inf < inf  # True
inf - inf   # nan
exp(-inf)   # 0
exp(1 / inf)#1

1.0

## NumPy 中的其他浮点类型

NumPy 还提供了其他的浮点类型，在其他编程语言中称为**双精度**和**单精度**数，即float64 和float32:

In [12]:
from numpy import *
a = pi              # 返回 3.141592653589793
a1 = float64(a)     # 返回 3.141592653589793
a2 = float32(a)     # 返回 3.1415927
a - a1              # 返回 0.0
a - a2              # 返回 -8.742278012618954e-08

-8.742278012618954e-08

倒数第二行表明变量a 和 a1 的京都是相同的。在前两行中它们只是展示的方式不同。精度的真正差异存在于变量a与其单精度副本a2之间。

NumPy 包的函数finfo 可用于展示有关这些浮点类型的信息：

In [13]:
f32 = finfo(float32)
f32.precision               # 6(十进制)
f64 = finfo(float64)
f64.precision               # 15(十进制)
f = finfo(float)
f.precision                 # 15(十进制)
f64.max                     # 1.7976931348623157e+308 (最大值)
f32.max                     # 3.4028235e+38 (最大值)
help(finfo)                 # 查看更多选项

Help on class finfo in module numpy:

class finfo(builtins.object)
 |  finfo(dtype)
 |  
 |  finfo(dtype)
 |  
 |  Machine limits for floating point types.
 |  
 |  Attributes
 |  ----------
 |  bits : int
 |      The number of bits occupied by the type.
 |  eps : float
 |      The smallest representable positive number such that
 |      ``1.0 + eps != 1.0``.  Type of `eps` is an appropriate floating
 |      point type.
 |  epsneg : floating point number of the appropriate type
 |      The smallest representable positive number such that
 |      ``1.0 - epsneg != 1.0``.
 |  iexp : int
 |      The number of bits in the exponent portion of the floating point
 |      representation.
 |  machar : MachAr
 |      The object which calculated these parameters and holds more
 |      detailed information.
 |  machep : int
 |      The exponent that yields `eps`.
 |  max : floating point number of the appropriate type
 |      The largest representable number.
 |  maxexp : int
 |      The smallest 

### 复数

在Python中，叙述的特征在于其为后缀带有字母j的浮点数，例如 z = 5.2j。 复数是浮点数和虚数的总和，例如 z = 3.5 + 5.2j。

在数学中，虚部表示为实数与虚数单位的乘积，但在Python中，虚数的表示方式不是乘积--- j只是一个后缀，表示该数为虚数。

In [14]:
b = 5.2
z = bj     # 返回错误
z = b*j    # 返回错误
z = b*1j   # 正确

NameError: name 'bj' is not defined

方法conjugate返回z的共轭：

In [15]:
z = 3.2 + 5.2j
z.conjugate()          # 返回(3.2-5.2j)

(3.2-5.2j)

### 实部和虚部

通过使用其属性real 和 imag，可以访问复数z的实部和虚部。这些属性是只读的：

In [16]:
z = 1j
z.real      # 0.0
z.imag      # 1.0
z.imag = 2  # 返回 AttributeError: readonly attribute

AttributeError: readonly attribute

复数是不可能被转化成实数的：

In [17]:
z = 1 + 0j
z == 1         # True
float(z)       # TypeError

TypeError: can't convert complex to float

## 布尔类型

布尔类型是以George Boole命名的数据类型。一个布尔类型的变量只能取两个值，即True或 False。这种数据类型主要用在逻辑表达式中，一些实例如下所示：

In [18]:
a = True
b = 30 > 45  # b的值为False

布尔表达式通常与if语句一起使用：
```python
if x > 0:
    print("positive")
else:
    print("nonpositive")
```   

### 布尔运算符

在Python中，可以用关键字and、or和not来执行布尔运算：

```python
True and False  # False
False or True   # True
(30 > 45) or (27 < 30)  # True
not True   # False
not (3 > 4)  # True
```

### 布尔类型转换

大多数Python对象均可被转换为布尔类型，这被称作**布尔类型转换**。内置函数bool可执行该转化。注意大多数对象都被转化为True（0除外），而空元组、空列表、空字符串或空数组则转换为False。

数组是不可能被转换为布尔值的，除非该数组不包含或只包含一个元素。下表汇总了一些布尔类型转换的guiz

| Bool| False | True |
| :----:| :----: | :----: |
| string | " | 'not empty' |
| number | 0 | $\neq$|
| list | [] | [...](not empty)|
| tuple | () | (......)(not empty)|
| array | array([]) | array([a])(a$\neq$0)|
|array | array([0])| |
|array | 若数组含有一个以上的元素，则引发异常

### 布尔类型自动转换

使用if 语句作用于一个非布尔类型的数据，可使其转换为布尔值。换句话说，以下两个语句总是等效的：
```python
if a:
    ...
if bool(a):  # 与上面完全一样
    ...
```
一个典型的示例是测试列表是否为空：
```python
# L 是一个列表
if L:
    print("list not empty")
else:
    print("list is empty")
```

空数组、空列表或空元组将返回False。还可以在if语句中使用一个变量，例如整数：
```python
# n 是一个整数
if n % 2:
    print("n is odd")
else:
    print("n is even")
```    
  
注意，在这里将%用于取模运算，将返回整数除法的余数。在该例中，将返回0 或 1总以为u对于2 执行取模运算之后的余数。

## 字符串类型

string是应用于文本的数据类型：

In [19]:
name = 'Johan Carlsson'
child = "Asa is Johan Carlsson's daughter"
book = """Aunt Julia
       and the Scriptwriter"""

字符串是有单引号或双引号括起来的。如果字符串包含多行，则必须用3个双引号或3个单引号括起来。

字符串可以使用简单的索引或者切片进行索引：

In [20]:
book[-1]  #返回 'r'
book[-12:] # 返回 'Scriptwriter'

'Scriptwriter'

字符串是不可改变的，也就是说，其子项不可更改，元组也享有这个只读属性。命令book[1] = 'a' 返回：
TypeError: 'str' object does not support item assignment

字符串'\n' 用于插入换字符， 't' 用于将水平制表符（TAB）插入到字符串中意使多行文本堆砌：
```python
print('Temperature:\t20\tC\nPressure:\t5\tPa')
```

这些字符串是有关转义字符的例子。转义字符总是以反斜杠（\）开头。一个多行字符串会自动包含转义字符：

In [21]:
a = """
A multiline
example"""

a    #返回 '\nA multiline\nexample'

'\nA multiline\nexample'

一个特殊的转义序列为"\\",它代表文本中的反斜杠本身：

In [22]:
latexfontsize = "\\tiny"

通过使用原始字符串可以实现相同的效果：

In [23]:
latexfs = r"\tiny"  #返回 “\tiny”
latexfontsize == latexfs  # 返回True

True

注意，在原始字符串中，反斜杠仍被保留在字符串中，用于转义一些特殊符号：

In [24]:
r'\''   # 返回 "\\'"
r"\\"  # 返回 '\\\\'
r"\"   # 返回一个错误

SyntaxError: EOL while scanning string literal (<ipython-input-24-f65a9d21cf43>, line 3)

### 用于字符串和字符串方法的运算

字符串加法运算即为字符串链接：
```python
last_name = 'Carlsson'
first_name = 'Johanna'
ful_name = first_name + '' + last_name # 返回 ‘Johanna Carlsson’
```

乘法只是重复的加法：
```python
game = 2 * 'Yo'  # 返回 ‘YoYo’
```

当比较字符串时，使用的是字符顺序，统一字母的排序其大写形式优先于其小写形式：
```python
'Anna' > 'Arvi'  # 返回false
'ANNA' < 'anna'  # 返回true
'10B' < '11A'    # 返回true
```

对于众多的字符串方法，这里仅提及其中其中最重要的方法

- **字符串分割:**通过使用耽搁或多个空格作为分割符，该方法可以从一个字符串生成列表。或者通过制定特定的字符串作为分为分隔符来为其提供一个参数
```python
text = 'quod erat    demonstrandum'
text.split()   # 返回 ['quod', 'erat', 'demonstrandum']
table = 'Johan;Carlsson;19890327'
table.split(';')  # 返回['Johan','Carlsson','19890327']
king = 'CarlXVIGustaf'
king.split('XVI')   # 返回['Carl', 'Gustaf']
```

- **将列表连接为字符串:** 这是字符串分割的反操作：
```python
sep = ';'
sep.join(['Johan','Carlsson','19890327']) # 返回'Johan';'Carlsson';'19890327'
```

- **字符串搜索:** 次方法返回字符串所匹配的第一个索引值，即给定搜索子串的起始位置.
```python
birthday = '20101210'
birthday.find('10')   # 返回 2
```

如果没有找到搜索的字符串，则方法的返回值为 -1.

### 字符串格式化

字符串通过使用format方法来实现

In [25]:
course_code = "NUMA21"
print("This course's name is {}".format(course_code)) # This course's name is NUMA21

This course's name is NUMA21


函数format是一个字符串方法，它会扫描字符串以便发现占位符，这些占位符是有大括号括起来的。这些占位符以指定的参数格式化方法被替换。占位符如何被替换取决于每个大括号中所定义的格式说明符。格式说明符以“:”作为其前缀来表示。

格式化方法提供了一系列可能性，使得可依据其类型来自定义对象的格式化。在科学计算中专用的是float类型的格式说明符。我们可以选择标准的形式{:f},也可以选择带指数符号的形式{:e}:

In [26]:
quantity = 33.45
print("{:f}".format(quantity))     # 33.450000
print("{:1.1f}".format(quantity))  # 33.5
print("{:.2e}".format(quantity))   # 3.35e+01

33.450000
33.5
3.35e+01


格式说明符允许制定舍入精度（小数点后面数字所表示的位数）。此外，可以设置格式说明符所包含的代表数字的前导空格的总数。

In [27]:
print("{name} {value:.1f}".format(name="quantity",value = quantity)) 
# 输出 quantity 33.5

quantity 33.5


在此例中，将需要插入其值的对象的名称作为格式化方法的参数。第一个大括号对被第一个参数替换，接下来的大括号对被后续的参数替换。或者使用健值对语法也会很方便。 这里处理了两个值，分别打印了没有格式说明符的字符串name以及固定保留一位小数的浮点值。

一个字符串可能包含一对大括号，其不应该被视为format方法的占位符。这种情况下要使用双括号：

In [28]:
r"we {} in Latex \begin{{equation}}".format('like')  
#返回 'we like in Latex \\begin{equation}'

'we like in Latex \\begin{equation}'