# 介绍

在做数据科学研究时，你需要一种方法来组织数据，以便能够有效地使用它。Python有许多数据结构可用来保存数据，例如列表、集合、字典和元组。在本教程中，将学习如何使用Python列表。


# 学习动机

在[花瓣到金属](https://www.kaggle.com/c/tpu-getting-started)赛事中，目标是根据它的图像来分类一朵花的种类。(这是计算机视觉中的一个常见任务，称为图像分类。)为了实现这一目标，需要组织数据中花卉物种的名称。

一种方法是将名称组织在Python字符串中。

In [1]:
flowers = "pink primrose,hard-leaved pocket orchid,canterbury bells,sweet pea,english marigold,tiger lily,moon orchid,bird of paradise,monkshood,globe thistle"

print(type(flowers))
print(flowers)

<class 'str'>
pink primrose,hard-leaved pocket orchid,canterbury bells,sweet pea,english marigold,tiger lily,moon orchid,bird of paradise,monkshood,globe thistle


更好的方法是用Python列表表示相同的数据。要创建列表，需要使用方括号(`[`，`]`)，并用逗号分隔每一项。列表中的每一项都是Python字符串，因此都用引号括起来。

In [2]:
flowers_list = ["pink primrose", "hard-leaved pocket orchid", "canterbury bells", "sweet pea", "english marigold", "tiger lily", "moon orchid", "bird of paradise", "monkshood", "globe thistle"]

print(type(flowers_list))
print(flowers_list)

<class 'list'>
['pink primrose', 'hard-leaved pocket orchid', 'canterbury bells', 'sweet pea', 'english marigold', 'tiger lily', 'moon orchid', 'bird of paradise', 'monkshood', 'globe thistle']


看上去用Python字符串还是用列表表示信息没有太大区别。但正如你将看到的，使用列表可以更容易地完成很多任务。例如，列表可以让你更容易：
- 在指定位置(first, second, third, 等等)获取一个元素
- 检查项数
- 添加和删除项目。


# 列表

## 长度 Length
我们可以用`len()`来计算任何列表中元素的数量，`len()`是`length`的缩写。你只需要提供括号中的列表名。

In [4]:
# 该列表有10个元素
print(len(flowers_list))

10


## 索引 Indexing

我们可以根据列表中的任何元素在列表中的位置(first, second, third, 等等)来引用它。这称为**索引**。

请注意，Python索引是从0开始的，这意味着:
- 要提取列表中的第一个元素，使用0
- 要提取列表中的第二个元素，使用1
- 要提取列表中的最后一个元素，需要使用比列表长度小1的值

In [5]:
print("First entry:", flowers_list[0])
print("Second entry:", flowers_list[1])

# 该列表的长度为10，可引用的最后一个元素为9
print("Last entry:", flowers_list[9])

First entry: pink primrose
Second entry: hard-leaved pocket orchid
Last entry: globe thistle


**注**：你可能已经注意到，在上面的代码单元格中，我们使用单个`print()`来打印多个项目(包括Python字符串(如`"First entry:"`)和列表中的值(如`flowers_list[0]`)。要在Python中使用一个命令打印多个内容，只需用逗号分隔它们就可以。


## 切片 Slicing

你也可以提取列表的一部分(例如，前3个元素或后2个元素)。这称为**切片**。例如:
- 要提取第一个`x`条目，你可以使用`[:x]`
- 要提取最后的`y`条目，你可以使用`[-y:]`

In [6]:
print("First three entries:", flowers_list[:3])
print("Final two entries:", flowers_list[-2:])

First three entries: ['pink primrose', 'hard-leaved pocket orchid', 'canterbury bells']
Final two entries: ['monkshood', 'globe thistle']


正如上面代码运行的结果，当我们对列表进行切片时，它返回一个新的、缩短的列表。


## 删除 Remove
使用`.remove()`从列表中删除一个元素，并将你想要删除的元素放在括号中。

In [7]:
flowers_list.remove("globe thistle")
print(flowers_list)

['pink primrose', 'hard-leaved pocket orchid', 'canterbury bells', 'sweet pea', 'english marigold', 'tiger lily', 'moon orchid', 'bird of paradise', 'monkshood']


## 添加项目 Adding items

使用`.append()`可以将元素添加到列表中，并将你想添加的元素放在括号中。

In [8]:
flowers_list.append("snapdragon")
print(flowers_list)

['pink primrose', 'hard-leaved pocket orchid', 'canterbury bells', 'sweet pea', 'english marigold', 'tiger lily', 'moon orchid', 'bird of paradise', 'monkshood', 'snapdragon']


## 列表不仅仅用于字符串

到目前为止，我们只处理过每个元素都是字符串的列表。但列表可以包含任何数据类型的元素，包括布尔值、整数和浮点数。

例如，考虑2000年4月第一周一家零售商店的精装书销售情况。

In [9]:
hardcover_sales = [139, 128, 172, 139, 191, 168, 170]

在这里，`hardcover_sales`是一个整数列表。与处理字符串时类似，你仍然可以做一些操作，如获取长度、提取单个元素和扩展列表。

In [10]:
print("Length of the list:", len(hardcover_sales))
print("Entry at index 2:", hardcover_sales[2])

Length of the list: 7
Entry at index 2: 172


你也可以用`min()`得到最小值，用`max()`得到最大值。

In [11]:
print("Minimum:", min(hardcover_sales))
print("Maximum:", max(hardcover_sales))

Minimum: 128
Maximum: 191


要将列表中的每一项全部相加，使用`sum()`。

In [12]:
print("Total books sold in one week:", sum(hardcover_sales))

Total books sold in one week: 1107


我们也可以对列表的切片进行类似的计算。在下一个码元格中，我们取前五天的总和(`sum(hardcover_sales[:5])`)，然后除以5得到前五天的平均图书销量。

In [13]:
print("Average books sold in first five days:", sum(hardcover_sales[:5])/5)

Average books sold in first five days: 153.8


# 课后练习

**练习创建和修改列表practice5_intro-to-lists.ipynb**。