在学习Python的过程中难免会遇到许多疑惑，这篇分享记录了我在学习过程中一些疑问以及我在查阅一些资料后对于这些问题的回答。其实每个问题单独拿出来讲都可以写一篇文章，这里对于大多数问题我只做到了浅尝则止。如果有欠缺的地方欢迎大家指出，感谢!

# 问题目录

1. 怎么理解在Python中，所有东西都是对象(object)？
2. 为什么说Python的变量相当于“标签”，而不是一个“容器”？
3. 为什么两个变量都等于299，他们的内存地址不同？
4. 说Python是动态型编程语言是什么意思？
5. 怎么理解Python中的mutable(可变)和immutable(不可变)？
6. round(4.5)＝4，这里为什么不是四舍五入？
7. 为什么0.1+0.1+0.1不等于0.3？
8. Python中is和==的区别？
9. Python字符串前面加r是什么意思？例如r'c:\folder'
10. Python3的f-string的用法?例如f'a={x}'
11. 为什么Python中a,b = b,a可以交换a,b的值？
12. 循环中continue和break的区别。

## 怎么理解在Python中，所有东西都是对象(object)？

Python是一个面向对象的编程语言，一个对象指一个类(class)的实例，它包含了一些属性(attributes)和一些方法（methods）。调用一个对象的属性和方法是在对象后面接"."。不同对象之间也可以进行操作，比如１＋５=6，　或者'a'+'c'= 'ac'。

In [1]:
# 数字是对象
a = 100
print(type(a))
# 调用对象a的属性
#print(a.__doc__)
# 使用对象a的方法，比特长度
print(a.bit_length())

<class 'int'>
7


In [2]:
print('======一个简单的类=======')
# 我们创建一个简单的类
class human:
    def __init__(self):
        self.maxlifespan = 100
    def eat(self):
        print('吃了一餐!')
# 我们用新建的类来创建一个对象
mike = human()
print(type(mike))
# 我们调用mike的属性
print('mike 的最大生命长度为:',mike.maxlifespan)
# 调用mike的方法
mike.eat()

<class '__main__.human'>
mike 的最大生命长度为: 100
吃了一餐!


## 为什么说Python的变量相当于“标签”，而不是一个“容器”？

In [3]:
# Python的运算符 = 是引用，而非赋值运算，
# 所以 v1 = 15 的含义是创建一个值为 15 的 int 对象
# 再将 v1 指向该对象的地址。
v1 = 15
# 同理创建了一个变量标签v2指向对象20。
v2 = 20
v3 = 15
# 函数id(对象)返回一个唯一的值，可以代表内存中一个唯一的位置。
# 所以相同的id意味着相同的内存地址。
# 打印出v1的id。　
print(f'v1指向的id为{id(v1)}')
print(f'v2指向的id为{id(v2)}')
print(f'v3指向的id为{id(v3)}')
print('改变v1的值后：')
v1 = v1+5
print(f'v1指向的id为{id(v1)}')

v1指向的id为94711155393600
v2指向的id为94711155393760
v3指向的id为94711155393600
改变v1的值后：
v1指向的id为94711155393760


可以看到v1和v3都指向同一个地址。而我们对v1重新引用：把v1+5后，v1又指向了v2指向的地址，即int对象20的地址。由此可以看出pyhton中的变量并不是像一个容器（容器指，如果有新的改动就回去修改这个变量中（容器中）的内容，而保持内存地址不变）一样，在数据改变后变量的指向的内存地址也改变了，所以它更像标签一个样指向一个对象内存地址。如果重写引用，则这个标签又会指向一个新对象的地址。

## 为什么两个变量都等于299，他们的内存地址不同？

In [4]:
a = 5
b = 5
print(f'a的id是{id(a)}')
print(f'b的id是{id(b)}')
v1 = 299
v2 = 299
print(f'v1的id是{id(v1)}')
print(f'v2的id是{id(v2)}')

a的id是94711155393280
b的id是94711155393280
v1的id是140176265117456
v2的id是140176265117328


造成id不同的原因是: Python把[-5,256]的数字会预先存到内存变为全球变量，换句话说这个范围内的数字在内存中只被创建一次，你把python中-5到256之间的值引用给任何变量或者使用这些对象，相同数字他们指向的内存地址都是相同的。而这个范围以外的数字会在你创建它的时候写入内存，就算是同一个数字，比如都是299，他们所存储的地址都是不同的。

使用这个机制的原因是为了优化速度，小的整数在代码中使用频率更高，这样预先存入内存中并只创建一次，从而方便快速访问。而其他数字使用频率低的，只有在使用的时候才在内存中创建。在完成使用后，python会把他们从内存中清除。

同样的，所有标识符(identifiers)比如变量名，函数名，类名等都会被存在内存中并只创建一次（这个过程叫做intern，intern指把标识符的是存入内存中，并只创建一次作为全球变量）。此外，有些类似标识符的字符也会被intern。

In [5]:
# 函数名作为identifier会被interned.
def foo():
    pass
a = foo
b = foo
print(f'a的地址为{id(a)}, b的地址为{id(b)}')
# 类似identifer的字符串也会被interned.
a = 'hello'
b = 'hello'
print(f'a的地址为{id(a)}, b的地址为{id(b)}')

a的地址为140176264853120, b的地址为140176264853120
a的地址为140176264965936, b的地址为140176264965936


## 说Python是动态型编程语言是什么意思？

编程语言主要分为静态型(Static Typing)及动态型(Dynamic Typing)。在一些新兴的语言中则有推论型(Infered types),它其实正好处在静态型和动态型中间，这里我们不做展开。静态型主要有C, C++, C#, Java 等。而动态型主要有Javascript, PHP, Python等。我们用一个例子来简单解答下什么是静态型，如果对这个感兴趣可以去网上查阅更多资料了解。

In [6]:
# 简单来说静态型的变量没有任何数据类型，只有它所指向对象有数据类型。
# 因此我们使用Python的时候不需要提前定义变量，而静态型语言则需要
# 在使用一个变量前，提前定义他是什么类型的变量。
a = 'apple'
print(type(a))
a = 10
print(type(a))
a = lambda x: x*2
print(type(a))

<class 'str'>
<class 'int'>
<class 'function'>


## 怎么理解Python中的mutable和immutable？

Python中，任何东西都是对象(object)。

[一个对象就包含了一个id（你可以把它想像成一个内存地址），一个对象类型（type，即对象本身）,一个值（value）。在一个对象被创建的时候，id和类型就不会再被改变了，但是有些对象的值是可以改变的。根据对象的值是否可以改变，对象分为mutable和immutable。mutable的对象就是在对象创建后，其值可以改变，而immutable的对象在创建后其值无法再改变，除非创建一个新的对象](https://docs.python.org/2.0/ref/objects.html#:~:text=Objects%20are%20Python's%20abstraction%20for,or%20by%20relations%20between%20objects.&text=Every%20object%20has%20an%20identity,the%20object's%20address%20in%20memory.)。

常见的immutable objects:
* string
* int, float, decimal, bool, complex
* tuple

常见的mutable objects:
* list
* dict
* set

In [7]:
# immutable objects
a = 'f'
print(f'a的id是{id(a)}')
a = 'f' + 'oo'
print(f'更新后a的id是{id(a)}')

a的id是140176340510256
更新后a的id是140176309222704


In [8]:
# mutable objects
a = [1, 'ty', 'go']
print(f'a的id是{id(a)}')
a.append(10)
print(f'更新后a的id是{id(a)}')

a的id是140176265282096
更新后a的id是140176265282096


可以看到immutable对象更新值后id改变了，说明更新后的a是一个新的对象。而mutable对象在更新值后id并没有改变，依然是同一个对象。

## round(4.5)＝4，这里为什么不是四舍五入？

round()所使用的方法叫做银行家舍入(Banker's rounding)，即“四舍六入五取偶”，而不是我们小时候学的“四舍五入”。简单来说，小于4舍或者大于6入，但如果舍入位是5，则舍入后最后一位为最靠近的偶数。

In [9]:
print(round(4.5))
print(round(5.5))

print(round(1.225, 2))
print(round(1.235, 2))

4
6
1.23
1.24


那为什么要使用银行家舍入？　答案是它更精确。我们来看一个例子：

In [10]:
# 假设我们有10个数代表10个金额
a = [d - 0.005 for d in range(1,10)]
print(a)
print('所有金额的平均值为：', sum(a)/len(a))
# 如果使用简单的四舍五入法,这里第二位小数都要加一，
# 我们可以使用math.ceil()。在这里例子里和四舍五入法是一样的效果。
import math
b = [math.ceil(d) for d in a]
print('每个数四舍五入后的平均值为：', sum(b)/len(b))
c = [round(d, 2) for d in a]
print('每个数使用银行家舍入后的平均值为：', sum(c)/len(c))

[0.995, 1.995, 2.995, 3.995, 4.995, 5.995, 6.995, 7.995, 8.995]
所有金额的平均值为： 4.995
每个数四舍五入后的平均值为： 5.0
每个数使用银行家舍入后的平均值为： 4.997777777777778


从上面例子我们可以看到使用银行家舍入(Banker's rounding)后，均值的误差比单纯四舍五入的误差要小。所以round()的时候使用更为科学的银行家舍入。

## 为什么0.1+0.1+0.1不等于0.3？

计算机记录存储数据是使用二进制的。在表示浮点型(float)的时候有些数是不能精确表示的，[因为它是以二进制的分数存储的(比如1/8)](https://docs.python.org/2/tutorial/floatingpoint.html)。

In [11]:
# 比如0.1,当我们显示小数点后25位的时候。
print(format(0.1, '.25f'))
# 正因为是二进制存储的过程，有些数（1/8）是可以正确表示的。
print(format(0.125, '.25f'))

0.1000000000000000055511151
0.1250000000000000000000000


In [12]:
#那我们如何让0.1+0.1+0.1=0.3呢？
a = 0.1 + 0.1 + 0.1
b = 0.3
print(a == b)

False


In [13]:
#我们可以使用math.isclose()进行比较。
from math import isclose
print(isclose(a, b))

True


In [14]:
# 在isclose中有２个参数
# rel_tol 相对误差
# abs_tol 绝对误差
# 比如我们需要比较以下数字的时候,我们需要相对误差去比较。
# 因为他们相对来说是比较接近的。
a = 999999999.01
b = 999999999.02
# 而在比较以下数字的时候，它们的绝对误差是比较小的。
x = 0.0000001
y = 0.0000002
# 我们可以把相对误差和绝对误差组合起来使用
print('a = b:', isclose(a, b, abs_tol=0.0001, rel_tol=0.01))
print('x = y:', isclose(x, y, abs_tol=0.0001, rel_tol=0.01))

a = b: True
x = y: True


## Python中is和==的区别？

Python中is比较的是对象(object)的id是否相同，而==对比的是对象的值是否相同。

In [15]:
# Python在[-5,256]的范围内引用数字，都是指向同一个对象。
a = 5
b = 5
print('a is b :', a is b)
print('a == b :', a == b)
print('a的id是：',id(a))
print('b的id是：',id(b))

a is b : True
a == b : True
a的id是： 94711155393280
b的id是： 94711155393280


In [16]:
a = 999
b = 999
print('a is b :', a is b)
print('a == b :', a == b)
print('a的id是：',id(a))
print('b的id是：',id(b))

a is b : False
a == b : True
a的id是： 140176265012464
b的id是： 140176265011856


从上面可以看出，当比较时是同一个id，则用is或者==都是True。而在id不同值一样的情况下只用有==才会是True。

## Python字符串前面加r是什么意思？

字符串前面最常用的用法是在打开路经的时候：r'c:\yourpath'

'r'的作用是防止字符转义。比如'\t'代表tab。具体用法参考[官方文档](https://docs.python.org/2.0/ref/strings.html)

In [17]:
# 不加r
print('c:\this is a test\new folder\text.txt')
# 加r防止字符转义
print('====添加r后===')
print(r'c:\this is a test\new folder\text.txt')
# 在\前加一个\也可以正确显示
print('====添加\后===')
print('c:\\this is a test\\new folder\\text.txt')

c:	his is a test
ew folder	ext.txt
====添加r后===
c:\this is a test\new folder\text.txt
====添加\后===
c:\this is a test\new folder\text.txt


## Python3的f-string的用法?例如f'a={x}'

f-string,亦称为格式化字符串常量（formatted string literals），是Python3.6新引入的一种字符串格式化方法，主要目的是使格式化字符串的操作更加简便。

f-string在形式上是以 f 或 F 修饰符引领的字符串（f'xxx' 或 F'xxx'），以大括号 {} 标明被替换的字段；[f-string在本质上并不是字符串常量，而是一个在运行时运算求值的表达式](https://docs.python.org/3/whatsnew/3.6.html#whatsnew36-pep498)，与str.format()的用法相似。

f-string采用 {content:format} 设置字符串格式，其中 content 是替换并填入字符串的内容，可以是变量、表达式或函数等，format 是格式描述符，可以省略。详细语法可以查阅[官方文档](https://docs.python.org/3/library/string.html#format-string-syntax)。


In [18]:
# {}中直接填变量
a = 99.99
print(f'The price is {a}')
# 填入函数
print(f'The length is {len(range(5))}')
# 多行f-string
print(f'''
This
{'is'}
a
{'test'}
''')
# 使用{content:format}设置
a = 99.9989
print(f'a is {a:.3f}')
import datetime
d = datetime.datetime.today().date()
print(f'Today\'s date is {d:%Y/%m/%d}.')

The price is 99.99
The length is 5

This
is
a
test

a is 99.999
Today's date is 2020/08/26.


## 为什么Python中a,b = b,a可以交换a,b的值？

解释这个问题之前要了解python的两个知识点。
* 元组(tuple)如何创建
* 什么是unpack

In [19]:
# 在一开始学习的时候我们最常用的方式
a = (6,7)
# 也许会认为创建tuple的必要条件是()
# 但其实创建元组的必要条件是逗号,
b = 6,
print(type(b))

<class 'tuple'>


我们看到即使是一个数加上逗号也是一个元组。那问题中等式右侧b,a就组成了一个元组。接下来就使用unpack的方式让a指向元组的第一个元素，b指向元组的第二个元素。

In [20]:
# 所以a,b = b,a可以分成以下２步
a = 6
b = 7
# 第一步构建元组c
c = b,a
#　第二步使用unpack让变量引用新的对象
a,b = c
print(f'a:{a}, b:{b}')

a:7, b:6


## 循环中continue和break的区别。

Python中，break和continue语句用来改变循环的进程。

一般循环会一直运行到条件为false则结束循环，但是有时候我们希望提前结束整个循环或者结束本轮循环而不用判断条件是否是false。break的作用就是直接结束整个循环，而continue的作用是结束本轮循环。

In [21]:
# break的用法
# c 记录循环了几次
c = 0
for i in range(10):
    if i>5:
        print(f'It reaches {i},let\'s take a break!')
        break
    c += 1
print(c)

It reaches 6,let's take a break!
6


当运行到break后，整个循环就马上结束了。

In [22]:
# break的用法
# c 记录循环了几次
c = 0
for i in range(10):
    if i == 5:
        print(f'It reaches {i},let\'s take a break!')
        continue
    c += 1
print(c)

It reaches 5,let's take a break!
9


当运行到continue后，本轮循环之后的语句就会直接跳过进入下一个循环。所以这里c只记录到了9而不是10。