### 3.1 Data Structutes and Sequences

#### Tuple
Tuple là một dãy (sequence) các đối tượng Python có độ dài cố định và không thể thay đổi – nghĩa là một khi đã được gán giá trị, bạn không thể sửa đổi nội dung của nó nữa.   

Cách đơn giản nhất để tạo một tuple là dùng một dãy các giá trị, cách nhau bằng dấu phẩy và đặt trong dấu ngoặc đơn:

In [20]:
tup = (4, 5, 6)
tup

(4, 5, 6)

Ta cũng có thể viết:

In [21]:
tup = 4, 5, 6
tup

(4, 5, 6)

Bạn có thể chuyển bất kì sequence hoặc iterator nào thành 1 tuple bằng cách:

In [22]:
tuple([4, 0, 2])

(4, 0, 2)

In [23]:
tup = tuple('string')
tup

('s', 't', 'r', 'i', 'n', 'g')

Có thể access các phần tử trong tuple bằng cách dùng [].  
Chỉ số index bắt đầu từ 0.

In [24]:
tup[0]

's'

Khi bạn định nghĩa các tuple trong những biểu thức phức tạp hơn, thường sẽ cần phải đặt các giá trị trong dấu ngoặc đơn.  

Một ví dụ về tuple chứa các tuple:

In [25]:
nested_tup = (4, 5, 6), (7, 8)
nested_tup

((4, 5, 6), (7, 8))

In [26]:
nested_tup[0]

(4, 5, 6)

In [27]:
nested_tup[1]

(7, 8)

Mặc dù các đối tượng được lưu trong một tuple có thể là các đối tượng có thể thay đổi (mutable), nhưng một khi tuple đã được tạo, bạn không thể thay đổi đối tượng được lưu tại từng vị trí trong tuple.

In [28]:
tup = tuple(['foo', [1, 2], True])

tup[2] = False

TypeError: 'tuple' object does not support item assignment

Nếu 1 đối tượng bên trong tuple là kiểu có thể thay đổi (mutable), chẳng hạn như list, bạn có thể thay đổi nội dung của nó in place:

In [29]:
tup[1].append(3)

tup

('foo', [1, 2, 3], True)

Bạn có thể nối các tuple bằng (+) để tạo ra tuple dài hơn:

In [30]:
(4, None, 'foo') + (6, 0) + ('bar',)

(4, None, 'foo', 6, 0, 'bar')

Khi nhân tuple với 1 số nguyên, giống như list. Nó sẽ nối nhiều bản copies của tuple đó:

In [31]:
('foo', 'bar') * 4

('foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'bar')

##### Unpacking tuples
Nếu bạn cố gắng gán giá trị cho một biểu thức có dạng giống như tuple gồm nhiều biến, Python sẽ cố gắng giải nén (unpack) giá trị ở phía bên phải dấu bằng:

In [32]:
tup = (4, 5, 6)
a, b, c = tup
b

5

Cũng có thể unpack nested tuple:

In [33]:
tup = (4, 5, (6, 7))
a, b, (c, d) = tup
d

7

Thay vì swap các biến bằng cách này:

In [34]:
tmp = a
a = b
b = tmp

Với Python, bạn có thể swap như sau:

In [35]:
a, b = 1, 2
b, a = a, b

Một cách sử dụng phổ biến của việc giải nén biến (variable unpacking) là khi lặp qua các chuỗi gồm các tuple hoặc list.

In [36]:
seq = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]

for a, b, c in seq:
    print(f"a={a}, b={b}, c={c}")

a=1, b=2, c=3
a=4, b=5, c=6
a=7, b=8, c=9


Có một số tình huống mà bạn có thể muốn “lấy ra” một vài phần tử từ đầu của một tuple. Có một cú pháp đặc biệt có thể làm điều này, đó là `*rest`, cú pháp này cũng được sử dụng trong khai báo hàm để thu nhận một danh sách đối số vị trí có độ dài tùy ý:

In [37]:
values = 1, 2, 3, 4, 5

a, b, *rest = values

In [None]:
a

1

In [38]:
b

2

In [39]:
rest 

[3, 4, 5]

Phần `rest` này đôi khi là thứ bạn muốn bỏ qua; không có gì đặc biệt với cái tên `rest` cả. Theo thông lệ, nhiều lập trình viên Python sẽ sử dụng dấu gạch dưới (_) cho những biến không cần thiết:

In [40]:
a, b, *_ = values

##### Tuple methods

`count` đếm số lần xuất hiện của 1 giá trị

In [41]:
a = (1, 2, 2, 2, 3, 4, 2)
a.count(2)

4

#### List

Trái ngược với tuple, danh sách (list) có độ dài thay đổi và nội dung của chúng có thể được chỉnh sửa ngay tại chỗ. List là một kiểu có thể thay đổi (mutable). Bạn có thể khai báo list bằng dấu ngoặc vuông [] hoặc bằng hàm list()

In [42]:
a_list = [2, 3, 7, None]

In [43]:
tup = ("foo", "bar", "baz")

In [44]:
b_list = list(tup)

In [45]:
b_list

['foo', 'bar', 'baz']

In [46]:
b_list[1] = "peekaboo"

In [47]:
b_list 

['foo', 'peekaboo', 'baz']

Hàm dựng sẵn `list` thường được sử dụng trong xử lý dữ liệu như một cách để hiện thực hóa (materialize) một iterator hoặc generator expression

In [48]:
gen = range(10)

In [49]:
gen

range(0, 10)

In [50]:
list(gen)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

##### Adding and removing elements

Các phần tử có thể được thêm vào cuối danh sách bằng phương thức `append`:

In [51]:
b_list.append("dwarf")
b_list

['foo', 'peekaboo', 'baz', 'dwarf']

Sử dụng `insert`, bạn có thể chèn một phần tử vào một vị trí cụ thể trong danh sách:

In [52]:
b_list.insert(1, "red")
b_list

['foo', 'red', 'peekaboo', 'baz', 'dwarf']

Chỉ số chèn (insertion index) phải nằm trong khoảng từ 0 đến độ dài của danh sách, bao gồm cả hai giá trị này.

Phép toán ngược lại với insert là `pop`, dùng để xóa và trả về một phần tử tại một chỉ số cụ thể:

In [53]:
b_list.pop(2)

'peekaboo'

In [54]:
b_list

['foo', 'red', 'baz', 'dwarf']

Các phần tử có thể được xóa theo giá trị bằng phương thức `remove`, phương thức này sẽ tìm giá trị đầu tiên phù hợp và xóa nó khỏi danh sách:

In [55]:
b_list.append("foo")

In [56]:
b_list

['foo', 'red', 'baz', 'dwarf', 'foo']

In [57]:
b_list.remove("foo")

In [58]:
b_list

['red', 'baz', 'dwarf', 'foo']

Kiểm tra xem một danh sách có chứa một giá trị hay không bằng cách sử dụng từ khóa `in`:

In [59]:
"dwarf" in b_list

True

In [60]:
"dwarf" not in b_list

False

Việc kiểm tra xem một danh sách có chứa một giá trị hay không sẽ chậm hơn nhiều so với việc kiểm tra với `dictionary` và `set` (sẽ được giới thiệu sau), vì Python quét tuần tự (linear scan) qua các giá trị trong danh sách. Trong khi đó, với `dictionary` và `set` (dựa trên bảng băm – hash table), Python có thể kiểm tra trong thời gian hằng số (constant time).

##### Concatenating and combining lists

Tương tự như với tuple, cộng hai danh sách (list) bằng toán tử + sẽ nối chúng lại với nhau:

In [61]:
[4, None, "foo"] + [7, 8, (2, 3)]

[4, None, 'foo', 7, 8, (2, 3)]

Nếu bạn đã có một danh sách được định nghĩa sẵn, bạn có thể thêm nhiều phần tử vào danh sách đó bằng cách sử dụng phương thức `extend`:

In [62]:
x = [4, None, "foo"]
x.extend([7, 8, (2, 3)])

In [63]:
x

[4, None, 'foo', 7, 8, (2, 3)]