#  list[]列表

## 1. 什么是 Python 列表

**Python**列表是一种数据结构，它以指定的顺序 (或序列) 存储值或对象的集合。**Python**列表的一些特征有：
- 它们是可变的，这意味着它们可以被改变或更新。
- **Python**列表可以存储不同类型的对象和不同的数据类型。因此，例如一个列表可以包含 `int`、`float` 和 `str` 值的混合。一个列表还可以包含子列表、数组和其它**Python**数据结构。
- **Python**列表是用**方括号**创建的，对象用**逗号**分隔,像这样` [1,2,3]`

### 1.1 Python 列表中的项目可以使用索引进行子集处理

列表中的每个值都被称为一个项目。由于列表是按指定顺序排列的项的序列，所以列表中每个项的位置或顺序号都有一个标签。这个顺序标签被称为**索引**。**索引**允许列表是可迭代的，这意味着可以按照项目在列表对象中出现的顺序访问列表中的每个项目。

### 1.2 列表索引

可以在 **Python** 中使用一个索引值来访问列表中的对象。默认情况下，Python 的索引总是从 `[0]` 开始，而不是 `[1]`。因此，Python 列表中的第一个项目有一个索引 `[0]`，列表中的第二个项目有一个索引 `[1]`，以此类推，可以使用一个项的索引来访问它的值。例如，使用索引 `[1]` 来获取以下列表中第 2 项 `(0.75)` 的值 `[0.70, 0.75, 1.85]`。

## 2. 如何创建列表

用以下语法创建Python列表：`list_name = [item_1, item_2, item_3]`

这些值（列表中的项目）括在方括号`[]`内，并使用逗号相互分隔。还可以创建`str`值列表，使用引号将各个文本字符串括起来`""`即可

In [1]:
months = ["January", "February", "March"]
months

['January', 'February', 'March']

还可以创建一个包含不同类型数据（例如int、float、str）的列表，包括其他定义的变量

In [2]:
jan = 0.70
boulder_avg_precip = [1, jan, "January"]
boulder_avg_precip

[1, 0.7, 'January']

**为什么值`jan`会转换为0.7呢？**

与上节一样，课使用type（）函数确定对象类型

In [3]:
type(boulder_avg_precip)

list

## 2.1 使用len()打印列表的长度

要有效地使用列表索引，了解列表的长度会很有帮助。在这种情况下，长度是指列表中存储了多少项目。可以使用`len()`函数通过将列表的名称作为参数或输入来查询长度，如下所示：`len(list_name)`

In [4]:
months

['January', 'February', 'March']

In [5]:
print("The length of the months list is:", len(months))

The length of the months list is: 3


## 3. 访问存储在列表中的对象：索引

上诉提及索引，大家尝试索引`months`列表的第三个值吧。如果想索引最后一个值，可以用`-1`做索引，例如`months[-1]`，查看一下是不是`months`最后一个值吧。以此类推，可以获取倒数第2个、倒数第3个，`months[-2]` `months[-3]`,当然倒数第4个就越界了

## 4. 更新（替换）列表中的项目

除了查询值之外，我们还可以使用列表索引来更新列表中的项目，方法是为该索引位置分配一个新值，例如：`months[index] = value`

In [6]:
months[1] = "Feb"
months

['January', 'Feb', 'March']

## 5. 将项目插入列表

还可以使用列表索引将新项目插入到列表中，方法是指定新值位于哪个索引位置，如：`list_name.insert(0, value)`

下面示例中，月份列表不完整，并且将**一月的值**插入到列表的**开头**，如下：

In [7]:
# Month list missing the first value for January
months = ["February", "March"]

# check index value at 0
months[0]

'February'

In [8]:
# Modify list to add January at the beginning
months.insert(0, "January")
months

['January', 'February', 'March']

In [9]:
# Check index value at 0 in modified list
months[0]

'January'

## 6. 从列表中删除项目

可以使用`del`语句从现有列表中删除不需要的项目： `del list_name[index]`

在使用列表索引修改列表之前，最好检查一下列表的长度

In [10]:
del months[2]
months

['January', 'February']

删除列表末尾元素也可用`pop()`方法

In [11]:
a = [1,2,3,4]
a.pop()
a

[1, 2, 3]

要删除指定位置的元素，用`pop(i)`方法，其中`i`是索引位置，需要注意的是，索引是从`0`开始的：

In [12]:
a.pop(0)
a

[2, 3]

## 7. 将项目附加到列表

要在列表的**末尾**添加一个项目，可以使用与列表相关的 `.append() `函数。调用这个方法向列表中添加数值:`listname.append(value)`

In [13]:
months.append("March")
months

['January', 'February', 'March']

还可以使用添加操作`+`将项目添加到列表中：`listname = [value] + listname`

In [14]:
months = ["月份"] + months
months

['月份', 'January', 'February', 'March']

In [15]:
months = [123] + months

months

[123, '月份', 'January', 'February', 'March']

# dict{} 字典

**Python**内置了字典：`dict`的支持，`dict`全称`dictionary`，使用`{}`与**键-值**（`key-value`）存储，具有极快的查找速度。

举个例子，假设要根据同学的名字查找对应的成绩，如果用`list`实现，需要两个`list`：

In [16]:
names = ['Michael', 'Bob', 'Tracy']
scores = [95, 75, 85]

给定一个名字，要查找对应的成绩，就先要在`names`中找到对应的位置，再从`scores`取出对应的成绩，`list`越长，耗时越长。如果用`dict`实现，只需要一个“名字”-“成绩”的对照表，直接根据名字查找成绩，无论这个表有多大，查找速度都不会变慢。写一个`dict`如下：

In [17]:
d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}
d['Michael']

95

为什么`dict`查找速度这么快？因为`dict`的实现原理和查字典是一样的。假设字典包含了1万个汉字，我们要查某一个字，一个办法是把字典从第一页往后翻，直到找到我们想要的字为止，这种方法就是在list中查找元素的方法，list越大，查找越慢。

第二种方法是先在字典的索引表里（比如部首表）查这个字对应的页码，然后直接翻到该页，找到这个字。无论找哪个字，这种查找速度都非常快，不会随着字典大小的增加而变慢。

`dict`就是第二种实现方式，给定一个名字，比如`'Michael'`，`dict`在内部就可以直接计算出`Michael`对应的存放成绩的“页码”，也就是`95`这个数字存放的内存地址，直接取出来，所以速度非常快。

可以猜到，这种`key-value`存储方式，在放进去的时候，必须根据`key`算出`value`的存放位置，这样，取的时候才能根据`key`直接拿到`value`。

把数据放入`dict`的方法，除了初始化时指定外，还可以通过`key`放入：

In [18]:
d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}
d['Adam'] = 67
d

{'Michael': 95, 'Bob': 75, 'Tracy': 85, 'Adam': 67}

由于一个key只能对应一个value，所以，多次对一个key放入value，后面的值会把前面的值冲掉：

In [19]:
d['Jack'] = 90
d['Jack']

90

In [20]:
d['Jack'] = 88
d['Jack']

88

如果key不存在，dict就会报错：

In [21]:
d['Thomas']

KeyError: 'Thomas'

要避免`key`不存在的错误，有两种办法，一是通过`in`判断`key`是否存在:

In [22]:
'Thomas' in d

False

二是通过`dict`提供的`get()`方法，如果`key`不存在，可以返回`None`，或者自己指定的`value`：

In [23]:
d.get('Thomas')
d.get('Thomas', -1)

-1

**注意** : 返回None的时候Python的交互环境不显示结果。

要删除一个`key`，用`pop(key)`方法，对应的`value`也会从`dict`中删除：

In [24]:
d.pop('Bob')

75

In [25]:
d

{'Michael': 95, 'Tracy': 85, 'Adam': 67, 'Jack': 88}

和`list`比较，`dict`有以下几个特点：

1. 查找和插入的速度极快，不会随着key的增加而变慢；
2. 需要占用大量的内存，内存浪费多。

而`list`相反：

1. 查找和插入的时间随着元素的增加而增加；
2. 占用空间小，浪费内存很少。

所以，`dict`是用空间来换取时间的一种方法。

`dict`可以用在需要高速查找的很多地方，在**Python**代码中几乎无处不在，正确使用`dict`非常重要，需要牢记的第一条就是dict的key必须是**不可变对象**。
    
这是因为`dict`根据`key`来计算`value`的存储位置，如果每次计算相同的`key`得出的结果不同，那`dict`内部就完全混乱了。这个通过`key`计算位置的算法称为哈希算法（Hash）。

要保证hash的正确性，作为`key`的对象就不能变。在**Python**中，字符串、整数等都是不可变的，因此，可以放心地作为`key`。而`list`是可变的，就不能作为`key`：

In [26]:
key = [1, 2, 3]   
d[key] = 'a list'

TypeError: unhashable type: 'list'

# tuple() 元组

另一种有序列表叫元组：`tuple`。`tuble`用的是小括号`()`。`tuple`和`list`非常类似，但是`tuple`一旦初始化就不能修改，比如列出同学的名字:`classmates = ('Michael', 'Bob', 'Tracy')`

现在，`classmates`这个`tuple`不能变了，它也没有`append()`，`insert()`这样的方法。其他获取元素的方法和`list`是一样的，我们可以正常地使用`classmates[0]`，`classmates[-1]`，但**不能赋值**成另外的元素。

**不可变的tuple有什么意义？**

因为`tuple`不可变，所以代码更安全！如果可能，能用`tuple`代替`list`就尽量用`tuple`。

定义一个只有1个元素的tuple，如果我们这么定义：

In [27]:
t = (1)
t

1

定义的不是`tuple`，是`1`这个数！这是因为括号`()`既可以表示`tuple`，又可以表示数学公式中的小括号，这就产生了歧义，因此，**Python**规定，这种情况下，按小括号进行计算，计算结果自然是`1`。

所以，只有1个元素的tuple定义时必须加一个逗号`,`，来消除歧义：

In [28]:
t = (1,)
t

(1,)

## “可变的”tuple

In [29]:
t = ('a', 'b', ['A', 'B'])
t[2][0] = 'X'
t[2][1] = 'Y'
t

('a', 'b', ['X', 'Y'])

这个`tuple`定义的时候有3个元素，分别是`'a'`，`'b'`和一个list。不是说`tuple`一旦定义后就不可变了吗？怎么后来又变了？

当我们把`list`的元素`'A'`和`'B'`修改为`'X'和'Y'`后，表面上看，`tuple`的元素确实变了，但其实变的不是`tuple`的元素，而是`list`的元素。所以，`tuple`所谓的“不变”是说，`tuple`的每个元素，指向永远不变。即指向`'a'`，就不能改成指向`'b'`，指向一个`list`，就不能改成指向其他对象，但指向的这个`list`本身是可变的！

理解了“指向不变”后，要创建一个内容也不变的`tuple`怎么做？那就必须保证`tuple`的每一个元素本身也不能变。

## 练习

请用索引取出下面`list`的指定元素：

```Python
L = [
    ['Apple', 'Google', 'Microsoft'],
    ['Java', 'Python', 'Ruby', 'PHP'],
    ['Adam', 'Bart', 'Lisa']
]

#打印Apple:

print(?)

#打印Python:

print(?)

#打印Lisa:

print(?)
```

# set() 集合

`set`和`dict`类似，也是一组`key`的集合，但不存储`value`。由于`key`不能重复，所以，在`set`中，没有重复的`key`。

要创建一个set，需要提供一个list作为输入集合：

In [30]:
s = set([1, 2, 3])
s

{1, 2, 3}

注意，传入的参数`[1, 2, 3]`是一个`list`，而显示的`{1, 2, 3}`只是告诉你这个set内部有1，2，3这3个元素，显示的顺序也不表示`set`是有序的。

重复元素在`set`中自动被过滤：

In [31]:
s = set([1, 1, 2, 2, 3, 3])
s

{1, 2, 3}

**添加元素**

通过`add(key)`方法可以添加元素到`set`中，可以重复添加，但不会有效果：

In [32]:
s.add(4)
s

{1, 2, 3, 4}

**删除元素**

通过`remove(key)`方法可以删除元素：

In [33]:
s.remove(4)
s

{1, 2, 3}

`set`可以看成数学意义上的无序和无重复元素的集合，因此，两个`set`可以做数学意义上的交集、并集等操作：

In [34]:
s1 = set([1, 2, 3])
s2 = set([2, 3, 4])
s1 & s2

{2, 3}

In [35]:
s1 | s2

{1, 2, 3, 4}

`set`和`dict`的唯一区别仅在于没有存储对应的`value`，但是，`set`的原理和`dict`一样，所以，同样不可以放入可变对象，因为无法判断两个可变对象是否相等，也就无法保证`set`内部“不会有重复元素”。试试把`list`放入`set`，看看是否会报错。