### 3.1 Data Structutes and Sequences

#### Tuple
Tuple là một dãy (sequence) các đối tượng Python có độ dài cố định và không thể thay đổi – nghĩa là một khi đã được gán giá trị, bạn không thể sửa đổi nội dung của nó nữa.   

Cách đơn giản nhất để tạo một tuple là dùng một dãy các giá trị, cách nhau bằng dấu phẩy và đặt trong dấu ngoặc đơn:

In [21]:
tup = (4, 5, 6)
tup

(4, 5, 6)

Ta cũng có thể viết:

In [22]:
tup = 4, 5, 6
tup

(4, 5, 6)

Bạn có thể chuyển bất kì sequence hoặc iterator nào thành 1 tuple bằng cách:

In [23]:
tuple([4, 0, 2])

(4, 0, 2)

In [24]:
tup = tuple('string')
tup

('s', 't', 'r', 'i', 'n', 'g')

Có thể access các phần tử trong tuple bằng cách dùng [].  
Chỉ số index bắt đầu từ 0.

In [25]:
tup[0]

's'

Khi bạn định nghĩa các tuple trong những biểu thức phức tạp hơn, thường sẽ cần phải đặt các giá trị trong dấu ngoặc đơn.  

Một ví dụ về tuple chứa các tuple:

In [26]:
nested_tup = (4, 5, 6), (7, 8)
nested_tup

((4, 5, 6), (7, 8))

In [27]:
nested_tup[0]

(4, 5, 6)

In [28]:
nested_tup[1]

(7, 8)

Mặc dù các đối tượng được lưu trong một tuple có thể là các đối tượng có thể thay đổi (mutable), nhưng một khi tuple đã được tạo, bạn không thể thay đổi đối tượng được lưu tại từng vị trí trong tuple.

In [29]:
tup = tuple(['foo', [1, 2], True])

tup[2] = False

TypeError: 'tuple' object does not support item assignment

Nếu 1 đối tượng bên trong tuple là kiểu có thể thay đổi (mutable), chẳng hạn như list, bạn có thể thay đổi nội dung của nó in place:

In [30]:
tup[1].append(3)

tup

('foo', [1, 2, 3], True)

Bạn có thể nối các tuple bằng (+) để tạo ra tuple dài hơn:

In [31]:
(4, None, 'foo') + (6, 0) + ('bar',)

(4, None, 'foo', 6, 0, 'bar')

Khi nhân tuple với 1 số nguyên, giống như list. Nó sẽ nối nhiều bản copies của tuple đó:

In [32]:
('foo', 'bar') * 4

('foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'bar')

##### Unpacking tuples
Nếu bạn cố gắng gán giá trị cho một biểu thức có dạng giống như tuple gồm nhiều biến, Python sẽ cố gắng giải nén (unpack) giá trị ở phía bên phải dấu bằng:

In [33]:
tup = (4, 5, 6)
a, b, c = tup
b

5

Cũng có thể unpack nested tuple:

In [34]:
tup = (4, 5, (6, 7))
a, b, (c, d) = tup
d

7

Thay vì swap các biến bằng cách này:

In [35]:
tmp = a
a = b
b = tmp

Với Python, bạn có thể swap như sau:

In [36]:
a, b = 1, 2
b, a = a, b

Một cách sử dụng phổ biến của việc giải nén biến (variable unpacking) là khi lặp qua các chuỗi gồm các tuple hoặc list.

In [37]:
seq = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]

for a, b, c in seq:
    print(f"a={a}, b={b}, c={c}")

a=1, b=2, c=3
a=4, b=5, c=6
a=7, b=8, c=9


Có một số tình huống mà bạn có thể muốn “lấy ra” một vài phần tử từ đầu của một tuple. Có một cú pháp đặc biệt có thể làm điều này, đó là `*rest`, cú pháp này cũng được sử dụng trong khai báo hàm để thu nhận một danh sách đối số vị trí có độ dài tùy ý:

In [38]:
values = 1, 2, 3, 4, 5

a, b, *rest = values

In [39]:
a

1

In [40]:
b

2

In [41]:
rest 

[3, 4, 5]

Phần `rest` này đôi khi là thứ bạn muốn bỏ qua; không có gì đặc biệt với cái tên `rest` cả. Theo thông lệ, nhiều lập trình viên Python sẽ sử dụng dấu gạch dưới (_) cho những biến không cần thiết:

In [42]:
a, b, *_ = values

##### Tuple methods

`count` đếm số lần xuất hiện của 1 giá trị

In [43]:
a = (1, 2, 2, 2, 3, 4, 2)
a.count(2)

4

#### List

Trái ngược với tuple, danh sách (list) có độ dài thay đổi và nội dung của chúng có thể được chỉnh sửa ngay tại chỗ. List là một kiểu có thể thay đổi (mutable). Bạn có thể khai báo list bằng dấu ngoặc vuông [] hoặc bằng hàm list()

In [44]:
a_list = [2, 3, 7, None]

In [45]:
tup = ("foo", "bar", "baz")

In [46]:
b_list = list(tup)

In [47]:
b_list

['foo', 'bar', 'baz']

In [48]:
b_list[1] = "peekaboo"

In [49]:
b_list 

['foo', 'peekaboo', 'baz']

Hàm dựng sẵn `list` thường được sử dụng trong xử lý dữ liệu như một cách để hiện thực hóa (materialize) một iterator hoặc generator expression

In [50]:
gen = range(10)

In [51]:
gen

range(0, 10)

In [52]:
list(gen)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

##### Adding and removing elements

Các phần tử có thể được thêm vào cuối danh sách bằng phương thức `append`:

In [53]:
b_list.append("dwarf")
b_list

['foo', 'peekaboo', 'baz', 'dwarf']

Sử dụng `insert`, bạn có thể chèn một phần tử vào một vị trí cụ thể trong danh sách:

In [54]:
b_list.insert(1, "red")
b_list

['foo', 'red', 'peekaboo', 'baz', 'dwarf']

Chỉ số chèn (insertion index) phải nằm trong khoảng từ 0 đến độ dài của danh sách, bao gồm cả hai giá trị này.

Phép toán ngược lại với insert là `pop`, dùng để xóa và trả về một phần tử tại một chỉ số cụ thể:

In [55]:
b_list.pop(2)

'peekaboo'

In [56]:
b_list

['foo', 'red', 'baz', 'dwarf']

Các phần tử có thể được xóa theo giá trị bằng phương thức `remove`, phương thức này sẽ tìm giá trị đầu tiên phù hợp và xóa nó khỏi danh sách:

In [57]:
b_list.append("foo")

In [58]:
b_list

['foo', 'red', 'baz', 'dwarf', 'foo']

In [60]:
b_list.remove("foo")

In [61]:
b_list

['red', 'baz', 'dwarf']

Kiểm tra xem một danh sách có chứa một giá trị hay không bằng cách sử dụng từ khóa `in`:

In [62]:
"dwarf" in b_list

True

In [63]:
"dwarf" not in b_list

False

Việc kiểm tra xem một danh sách có chứa một giá trị hay không sẽ chậm hơn nhiều so với việc kiểm tra với `dictionary` và `set` (sẽ được giới thiệu sau), vì Python quét tuần tự (linear scan) qua các giá trị trong danh sách. Trong khi đó, với `dictionary` và `set` (dựa trên bảng băm – hash table), Python có thể kiểm tra trong thời gian hằng số (constant time).

##### Concatenating and combining lists

Tương tự như với tuple, cộng hai danh sách (list) bằng toán tử `+` sẽ nối chúng lại với nhau:

In [64]:
[4, None, "foo"] + [7, 8, (2, 3)]

[4, None, 'foo', 7, 8, (2, 3)]

Nếu bạn đã có một danh sách được định nghĩa sẵn, bạn có thể thêm nhiều phần tử vào danh sách đó bằng cách sử dụng phương thức `extend`:

In [65]:
x = [4, None, "foo"]
x.extend([7, 8, (2, 3)])

In [66]:
x

[4, None, 'foo', 7, 8, (2, 3)]

Lưu ý rằng việc nối danh sách bằng phép cộng `(+)` là một thao tác **tương đối tốn kém**, vì một danh sách mới phải được tạo ra và các phần tử phải được sao chép vào đó.
Việc sử dụng `extend` để thêm phần tử vào một danh sách có sẵn – đặc biệt nếu bạn đang xây dựng một danh sách lớn – thường là **lựa chọn tốt hơn**.

##### Sorting

Bạn có thể sắp xếp một danh sách ngay tại chỗ (in place) — tức là không tạo ra một đối tượng mới — bằng cách gọi hàm `sort` của nó:

In [67]:
a = [7, 2, 5, 1, 3]

In [69]:
a.sort()

In [70]:
a

[1, 2, 3, 5, 7]

Hàm `sort` có một vài tùy chọn có thể sẽ hữu ích trong một số trường hợp. Một trong số đó là khả năng truyền vào một khóa sắp xếp phụ (secondary sort key) — tức là một hàm trả về giá trị dùng để sắp xếp các đối tượng.

Ví dụ, chúng ta có thể sắp xếp một tập hợp các chuỗi theo độ dài của chúng:

In [71]:
b = ["saw", "small", "He", "foxes", "six"]

In [72]:
b.sort(key=len)

In [73]:
b

['He', 'saw', 'six', 'small', 'foxes']

##### Sclicing

Bạn có thể chọn các phần của hầu hết các kiểu chuỗi (sequence) bằng cách sử dụng cú pháp cắt lát (slice notation), mà ở dạng cơ bản bao gồm `start:stop` được truyền vào toán tử chỉ mục `[]`:

In [74]:
seq = [7, 2, 3, 7, 5, 6, 0, 1]

In [75]:
seq[1:5]

[2, 3, 7, 5]

Các lát cắt (slice) cũng có thể được gán bằng một chuỗi (sequence):

In [76]:
seq[3:5] = [6, 3]

In [77]:
seq

[7, 2, 3, 6, 3, 6, 0, 1]

Bạn có thể bỏ qua chỉ số bắt đầu (start) hoặc chỉ số kết thúc (stop), trong trường hợp đó, chúng sẽ mặc định là đầu chuỗi và cuối chuỗi, tương ứng:

In [78]:
seq[:5]

[7, 2, 3, 6, 3]

In [79]:
seq[3:]

[6, 3, 6, 0, 1]

Chỉ số âm sẽ cắt (slice) chuỗi dựa theo vị trí tính từ cuối chuỗi:

In [80]:
seq[-4:]

[3, 6, 0, 1]

In [81]:
seq[-6:-2]

[3, 6, 3, 6]

Bạn cũng có thể sử dụng bước nhảy (step) sau dấu hai chấm thứ hai, ví dụ như để lấy mỗi phần tử cách nhau một phần tử (cách một phần tử):

In [82]:
seq[::2]

[7, 3, 3, 0]

Truyền vào -1 sẽ giúp đảo ngược list/tuple

In [83]:
seq[::-1]

[1, 0, 6, 3, 6, 3, 2, 7]

#### Dictionary

Từ điển (dictionary hay dict) có thể là cấu trúc dữ liệu tích hợp quan trọng nhất trong Python.
Trong các ngôn ngữ lập trình khác, từ điển đôi khi được gọi là hash maps hoặc mảng kết hợp (associative arrays).

Một từ điển lưu trữ tập hợp các cặp khóa – giá trị (key-value), trong đó khóa và giá trị đều là các đối tượng Python.
Mỗi khóa được liên kết với một giá trị, vì vậy giá trị đó có thể được *truy xuất, chèn, sửa đổi hoặc xóa* một cách thuận tiện, chỉ cần biết khóa tương ứng.

Một cách để tạo từ điển là sử dụng dấu ngoặc nhọn `{}` và dấu hai chấm `:` để phân tách khóa và giá trị:

In [84]:
empty_dict = {}

In [85]:
d1 = {"a": "some value", "b": [1, 2, 3, 4]}

In [86]:
d1

{'a': 'some value', 'b': [1, 2, 3, 4]}

Bạn có thể truy cập, chèn hoặc gán (cập nhật) phần tử trong từ điển bằng cú pháp giống như khi truy cập phần tử trong list hoặc tuple:

In [87]:
d1[7] = "an integer"

In [88]:
d1

{'a': 'some value', 'b': [1, 2, 3, 4], 7: 'an integer'}

In [89]:
d1["b"]

[1, 2, 3, 4]