## Chapter 3: Built-in Data Structures, Functions, and Files

### 3.1 Data Structutes and Sequences

#### Tuple
Tuple là một dãy (sequence) các đối tượng Python có độ dài cố định và không thể thay đổi – nghĩa là một khi đã được gán giá trị, bạn không thể sửa đổi nội dung của nó nữa.   

Cách đơn giản nhất để tạo một tuple là dùng một dãy các giá trị, cách nhau bằng dấu phẩy và đặt trong dấu ngoặc đơn:

In [93]:
tup = (4, 5, 6)
tup

(4, 5, 6)

Ta cũng có thể viết:

In [94]:
tup = 4, 5, 6
tup

(4, 5, 6)

Bạn có thể chuyển bất kì sequence hoặc iterator nào thành 1 tuple bằng cách:

In [95]:
tuple([4, 0, 2])

(4, 0, 2)

In [96]:
tup = tuple('string')
tup

('s', 't', 'r', 'i', 'n', 'g')

Có thể access các phần tử trong tuple bằng cách dùng [].  
Chỉ số index bắt đầu từ 0.

In [97]:
tup[0]

's'

Khi bạn định nghĩa các tuple trong những biểu thức phức tạp hơn, thường sẽ cần phải đặt các giá trị trong dấu ngoặc đơn.  

Một ví dụ về tuple chứa các tuple:

In [98]:
nested_tup = (4, 5, 6), (7, 8)
nested_tup

((4, 5, 6), (7, 8))

In [99]:
nested_tup[0]

(4, 5, 6)

In [100]:
nested_tup[1]

(7, 8)

Mặc dù các đối tượng được lưu trong một tuple có thể là các đối tượng có thể thay đổi (mutable), nhưng một khi tuple đã được tạo, bạn không thể thay đổi đối tượng được lưu tại từng vị trí trong tuple.

In [101]:
tup = tuple(['foo', [1, 2], True])

tup[2] = False

TypeError: 'tuple' object does not support item assignment

Nếu 1 đối tượng bên trong tuple là kiểu có thể thay đổi (mutable), chẳng hạn như list, bạn có thể thay đổi nội dung của nó in place:

In [102]:
tup[1].append(3)

tup

('foo', [1, 2, 3], True)

Bạn có thể nối các tuple bằng (+) để tạo ra tuple dài hơn:

In [103]:
(4, None, 'foo') + (6, 0) + ('bar',)

(4, None, 'foo', 6, 0, 'bar')

Khi nhân tuple với 1 số nguyên, giống như list. Nó sẽ nối nhiều bản copies của tuple đó:

In [104]:
('foo', 'bar') * 4

('foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'bar')

##### Unpacking tuples
Nếu bạn cố gắng gán giá trị cho một biểu thức có dạng giống như tuple gồm nhiều biến, Python sẽ cố gắng giải nén (unpack) giá trị ở phía bên phải dấu bằng:

In [105]:
tup = (4, 5, 6)
a, b, c = tup
b

5

Cũng có thể unpack nested tuple:

In [106]:
tup = (4, 5, (6, 7))
a, b, (c, d) = tup
d

7

Thay vì swap các biến bằng cách này:

In [107]:
tmp = a
a = b
b = tmp

Với Python, bạn có thể swap như sau:

In [108]:
a, b = 1, 2
b, a = a, b

Một cách sử dụng phổ biến của việc giải nén biến (variable unpacking) là khi lặp qua các chuỗi gồm các tuple hoặc list.

In [109]:
seq = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]

for a, b, c in seq:
    print(f"a={a}, b={b}, c={c}")

a=1, b=2, c=3
a=4, b=5, c=6
a=7, b=8, c=9


Có một số tình huống mà bạn có thể muốn “lấy ra” một vài phần tử từ đầu của một tuple. Có một cú pháp đặc biệt có thể làm điều này, đó là `*rest`, cú pháp này cũng được sử dụng trong khai báo hàm để thu nhận một danh sách đối số vị trí có độ dài tùy ý:

In [110]:
values = 1, 2, 3, 4, 5

a, b, *rest = values

In [111]:
a

1

In [112]:
b

2

In [113]:
rest 

[3, 4, 5]

Phần `rest` này đôi khi là thứ bạn muốn bỏ qua; không có gì đặc biệt với cái tên `rest` cả. Theo thông lệ, nhiều lập trình viên Python sẽ sử dụng dấu gạch dưới (_) cho những biến không cần thiết:

In [114]:
a, b, *_ = values

##### Tuple methods

`count` đếm số lần xuất hiện của 1 giá trị

In [115]:
a = (1, 2, 2, 2, 3, 4, 2)
a.count(2)

4

#### List

Trái ngược với tuple, danh sách (list) có độ dài thay đổi và nội dung của chúng có thể được chỉnh sửa ngay tại chỗ. List là một kiểu có thể thay đổi (mutable). Bạn có thể khai báo list bằng dấu ngoặc vuông [] hoặc bằng hàm list()

In [116]:
a_list = [2, 3, 7, None]

In [117]:
tup = ("foo", "bar", "baz")

In [118]:
b_list = list(tup)

In [119]:
b_list

['foo', 'bar', 'baz']

In [120]:
b_list[1] = "peekaboo"

In [121]:
b_list 

['foo', 'peekaboo', 'baz']

Hàm dựng sẵn `list` thường được sử dụng trong xử lý dữ liệu như một cách để hiện thực hóa (materialize) một iterator hoặc generator expression

In [122]:
gen = range(10)

In [123]:
gen

range(0, 10)

In [124]:
list(gen)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

##### Adding and removing elements

Các phần tử có thể được thêm vào cuối danh sách bằng phương thức `append`:

In [125]:
b_list.append("dwarf")
b_list

['foo', 'peekaboo', 'baz', 'dwarf']

Sử dụng `insert`, bạn có thể chèn một phần tử vào một vị trí cụ thể trong danh sách:

In [126]:
b_list.insert(1, "red")
b_list

['foo', 'red', 'peekaboo', 'baz', 'dwarf']

Chỉ số chèn (insertion index) phải nằm trong khoảng từ 0 đến độ dài của danh sách, bao gồm cả hai giá trị này.

Phép toán ngược lại với insert là `pop`, dùng để xóa và trả về một phần tử tại một chỉ số cụ thể:

In [127]:
b_list.pop(2)

'peekaboo'

In [128]:
b_list

['foo', 'red', 'baz', 'dwarf']

Các phần tử có thể được xóa theo giá trị bằng phương thức `remove`, phương thức này sẽ tìm giá trị đầu tiên phù hợp và xóa nó khỏi danh sách:

In [129]:
b_list.append("foo")

In [130]:
b_list

['foo', 'red', 'baz', 'dwarf', 'foo']

In [131]:
b_list.remove("foo")

In [132]:
b_list

['red', 'baz', 'dwarf', 'foo']

Kiểm tra xem một danh sách có chứa một giá trị hay không bằng cách sử dụng từ khóa `in`:

In [133]:
"dwarf" in b_list

True

In [134]:
"dwarf" not in b_list

False

Việc kiểm tra xem một danh sách có chứa một giá trị hay không sẽ chậm hơn nhiều so với việc kiểm tra với `dictionary` và `set` (sẽ được giới thiệu sau), vì Python quét tuần tự (linear scan) qua các giá trị trong danh sách. Trong khi đó, với `dictionary` và `set` (dựa trên bảng băm – hash table), Python có thể kiểm tra trong thời gian hằng số (constant time).

##### Concatenating and combining lists

Tương tự như với tuple, cộng hai danh sách (list) bằng toán tử `+` sẽ nối chúng lại với nhau:

In [135]:
[4, None, "foo"] + [7, 8, (2, 3)]

[4, None, 'foo', 7, 8, (2, 3)]

Nếu bạn đã có một danh sách được định nghĩa sẵn, bạn có thể thêm nhiều phần tử vào danh sách đó bằng cách sử dụng phương thức `extend`:

In [136]:
x = [4, None, "foo"]
x.extend([7, 8, (2, 3)])

In [137]:
x

[4, None, 'foo', 7, 8, (2, 3)]

Lưu ý rằng việc nối danh sách bằng phép cộng `(+)` là một thao tác **tương đối tốn kém**, vì một danh sách mới phải được tạo ra và các phần tử phải được sao chép vào đó.
Việc sử dụng `extend` để thêm phần tử vào một danh sách có sẵn – đặc biệt nếu bạn đang xây dựng một danh sách lớn – thường là **lựa chọn tốt hơn**.

##### Sorting

Bạn có thể sắp xếp một danh sách ngay tại chỗ (in place) — tức là không tạo ra một đối tượng mới — bằng cách gọi hàm `sort` của nó:

In [138]:
a = [7, 2, 5, 1, 3]

In [139]:
a.sort()

In [140]:
a

[1, 2, 3, 5, 7]

Hàm `sort` có một vài tùy chọn có thể sẽ hữu ích trong một số trường hợp. Một trong số đó là khả năng truyền vào một khóa sắp xếp phụ (secondary sort key) — tức là một hàm trả về giá trị dùng để sắp xếp các đối tượng.

Ví dụ, chúng ta có thể sắp xếp một tập hợp các chuỗi theo độ dài của chúng:

In [141]:
b = ["saw", "small", "He", "foxes", "six"]

In [142]:
b.sort(key=len)

In [143]:
b

['He', 'saw', 'six', 'small', 'foxes']

##### Sclicing

Bạn có thể chọn các phần của hầu hết các kiểu chuỗi (sequence) bằng cách sử dụng cú pháp cắt lát (slice notation), mà ở dạng cơ bản bao gồm `start:stop` được truyền vào toán tử chỉ mục `[]`:

In [144]:
seq = [7, 2, 3, 7, 5, 6, 0, 1]

In [145]:
seq[1:5]

[2, 3, 7, 5]

Các lát cắt (slice) cũng có thể được gán bằng một chuỗi (sequence):

In [146]:
seq[3:5] = [6, 3]

In [147]:
seq

[7, 2, 3, 6, 3, 6, 0, 1]

Bạn có thể bỏ qua chỉ số bắt đầu (start) hoặc chỉ số kết thúc (stop), trong trường hợp đó, chúng sẽ mặc định là đầu chuỗi và cuối chuỗi, tương ứng:

In [148]:
seq[:5]

[7, 2, 3, 6, 3]

In [149]:
seq[3:]

[6, 3, 6, 0, 1]

Chỉ số âm sẽ cắt (slice) chuỗi dựa theo vị trí tính từ cuối chuỗi:

In [150]:
seq[-4:]

[3, 6, 0, 1]

In [151]:
seq[-6:-2]

[3, 6, 3, 6]

Bạn cũng có thể sử dụng bước nhảy (step) sau dấu hai chấm thứ hai, ví dụ như để lấy mỗi phần tử cách nhau một phần tử (cách một phần tử):

In [152]:
seq[::2]

[7, 3, 3, 0]

Truyền vào -1 sẽ giúp đảo ngược list/tuple

In [153]:
seq[::-1]

[1, 0, 6, 3, 6, 3, 2, 7]

#### Dictionary

Từ điển (dictionary hay dict) có thể là cấu trúc dữ liệu tích hợp quan trọng nhất trong Python.
Trong các ngôn ngữ lập trình khác, từ điển đôi khi được gọi là hash maps hoặc mảng kết hợp (associative arrays).

Một từ điển lưu trữ tập hợp các cặp khóa – giá trị (key-value), trong đó khóa và giá trị đều là các đối tượng Python.
Mỗi khóa được liên kết với một giá trị, vì vậy giá trị đó có thể được **truy xuất, chèn, sửa đổi** hoặc **xóa** một cách thuận tiện, chỉ cần biết khóa tương ứng.

Một cách để tạo từ điển là sử dụng dấu ngoặc nhọn `{}` và dấu hai chấm `:` để phân tách khóa và giá trị:

In [154]:
empty_dict = {}

In [155]:
d1 = {"a": "some value", "b": [1, 2, 3, 4]}

In [156]:
d1

{'a': 'some value', 'b': [1, 2, 3, 4]}

Bạn có thể truy cập, chèn hoặc gán (cập nhật) phần tử trong từ điển bằng cú pháp giống như khi truy cập phần tử trong list hoặc tuple:

In [157]:
d1[7] = "an integer"

In [158]:
d1

{'a': 'some value', 'b': [1, 2, 3, 4], 7: 'an integer'}

In [159]:
d1["b"]

[1, 2, 3, 4]

Bạn có thể kiểm tra xem 1 `dictionary` có chứa một khóa (key) hay không bằng cú pháp giống như khi kiểm tra một giá trị trong `list` hoặc `tuple`

In [160]:
"b" in d1

True

Bạn có thể **xóa** các giá trị trong từ điển bằng cách sử dụng từ khóa `del `hoặc phương thức `pop` (phương thức này vừa trả về giá trị, vừa xóa khóa khỏi từ điển)

In [161]:
d1[5] = "some value"

In [162]:
d1

{'a': 'some value', 'b': [1, 2, 3, 4], 7: 'an integer', 5: 'some value'}

In [163]:
d1["dummy"] = "another value"

In [164]:
d1

{'a': 'some value',
 'b': [1, 2, 3, 4],
 7: 'an integer',
 5: 'some value',
 'dummy': 'another value'}

In [165]:
del d1[5]

In [166]:
d1

{'a': 'some value',
 'b': [1, 2, 3, 4],
 7: 'an integer',
 'dummy': 'another value'}

In [167]:
ret = d1.pop("dummy")

In [168]:
ret

'another value'

In [169]:
d1

{'a': 'some value', 'b': [1, 2, 3, 4], 7: 'an integer'}

Các phương thức `keys()` và `values()` trả về các trình lặp (iterators) chứa các *khóa* và *giá trị* của từ điển, tương ứng. Thứ tự của các khóa phụ thuộc vào thứ tự chèn vào từ điển, và hai phương thức này trả về *khóa* và *giá trị* theo đúng thứ tự tương ứng đó.

In [170]:
list(d1.keys())

['a', 'b', 7]

In [171]:
list(d1.values())

['some value', [1, 2, 3, 4], 'an integer']

Nếu bạn cần lặp qua cả *khóa* và *giá trị*, bạn có thể sử dụng phương thức `items()` để lặp qua các cặp **khóa–giá trị** dưới dạng các tuple gồm 2 phần tử

In [173]:
list(d1.items())

[('a', 'some value'), ('b', [1, 2, 3, 4]), (7, 'an integer')]

Bạn có thể gộp một từ điển vào một từ điển khác bằng cách sử dụng phương thức `update`

In [174]:
d1.update({"b": "foo", "c": 12})

In [175]:
d1

{'a': 'some value', 'b': 'foo', 7: 'an integer', 'c': 12}

Phương thức `update` thay đổi từ điển tại chỗ, vì vậy bất kỳ khóa nào đã tồn tại trong dữ liệu được truyền vào `update` sẽ bị **ghi đè**, và giá trị cũ sẽ bị **loại bỏ**.

##### Creating dictionaries from sequences

In [176]:
tuples = zip(range(5), reversed(range(5)))

In [177]:
tuples

<zip at 0x104cba540>

In [178]:
mapping = dict(tuples)

In [179]:
mapping

{0: 4, 1: 3, 2: 2, 3: 1, 4: 0}

##### Default values

In [180]:
words = ["apple", "bat", "bar", "atom", "book"]

In [181]:
by_letter = {}

In [182]:
for word in words:
    letter = word[0]
    by_letter.setdefault(letter, []).append(word)

In [183]:
by_letter

{'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book']}

Mô-đun tích hợp sẵn collections có một lớp hữu ích là `defaultdict`, giúp việc này trở nên dễ dàng hơn. Để tạo một `defaultdict`, bạn truyền vào một kiểu dữ liệu hoặc hàm dùng để tạo giá trị mặc định cho mỗi vị trí trong từ điển.

In [184]:
from collections import defaultdict

In [186]:
by_letter = defaultdict(list)

In [187]:
for word in words:
    by_letter[word[0]].append(word)

##### Valid dictionary key types

Mặc dù giá trị trong một từ điển (dictionary) có thể là bất kỳ đối tượng Python nào, nhưng khóa (key) thường phải là các đối tượng bất biến (immutable), như các kiểu đơn giản (int, float, string) hoặc tuple (với điều kiện tất cả phần tử trong tuple cũng phải bất biến). Thuật ngữ kỹ thuật cho tính chất này là “có thể băm được” (hashability). Bạn có thể kiểm tra một đối tượng có thể dùng làm khóa trong từ điển hay không bằng hàm hash.

In [192]:
print(hash("hello"))  # OK, chuỗi là immutable

-2283579009878801840


In [189]:
print(hash((1, 2, 3)))  # OK, tuple với toàn số nguyên

529344067295497451


In [190]:
print(hash([1, 2, 3]))  # Sai, list là mutable -> lỗi TypeError

TypeError: unhashable type: 'list'

Để sử dụng một danh sách (list) làm khóa (key), một cách là chuyển nó thành một tuple, vì tuple có thể được băm (hash) miễn là các phần tử bên trong nó cũng có thể được băm:

In [193]:
d = {}

In [194]:
d[tuple([1, 2, 3])] = 5

In [195]:
d

{(1, 2, 3): 5}

#### Set

Một tập hợp (`set`) là một tập hợp không có thứ tự gồm các phần tử duy nhất. Có hai cách để tạo một `set`: bằng hàm `set` hoặc bằng cách dùng ký hiệu tập hợp với dấu ngoặc nhọn `{}`:

In [196]:
set([2, 2, 2, 1, 3, 3])

{1, 2, 3}

In [197]:
{2, 2, 2, 1, 3, 3}

{1, 2, 3}

Set hỗ trợ các phép toán tập hợp trong toán học như hợp (union), giao (intersection), hiệu (difference) và hiệu đối xứng (symmetric difference).

In [199]:
a = {1, 2, 3, 4, 5}

In [200]:
b = {3, 4, 5, 6, 7, 8}

The union of these two sets is the set of distinct elements occurring in either set. This can be computed with either the `union` method or the `|` binary operator:

In [201]:
a.union(b)

{1, 2, 3, 4, 5, 6, 7, 8}

In [202]:
a | b

{1, 2, 3, 4, 5, 6, 7, 8}

The intersection contains the elements occurring in both sets. The `&` operator or the `intersection` method can be used:

In [203]:
a.intersection(b)

{3, 4, 5}

In [204]:
a & b

{3, 4, 5}

![image.png](attachment:image.png)

Tất cả các phép toán tập hợp logic đều có phiên bản tương ứng thực hiện tại chỗ (in-place), cho phép bạn thay thế nội dung của tập hợp bên trái phép toán bằng kết quả.

In [205]:
c = a.copy()

In [206]:
c |= b

In [207]:
c

{1, 2, 3, 4, 5, 6, 7, 8}

In [208]:
d = a.copy()

In [209]:
d &= b

In [210]:
d

{3, 4, 5}

Giống như các khóa trong từ điển, các phần tử trong tập hợp thường phải là bất biến (immutable), và chúng phải có thể băm được (hashable) — tức là khi gọi hàm hash trên giá trị đó thì không xảy ra lỗi. Để lưu trữ các phần tử giống như danh sách (hoặc các chuỗi có thể thay đổi khác) trong một tập hợp, bạn có thể chuyển chúng thành tuple:

In [211]:
my_data = [1, 2, 3, 4]

In [212]:
my_set = {tuple(my_data)}

In [213]:
my_set

{(1, 2, 3, 4)}

Bạn cũng có thể kiểm tra xem một tập hợp có phải là tập con của (được chứa trong) hoặc tập cha của (chứa tất cả phần tử của) một tập hợp khác hay không:

In [214]:
a_set = {1, 2, 3, 4, 5}

In [215]:
{1, 2, 3}.issubset(a_set)

True

In [216]:
a_set.issuperset({1, 2, 3})

True

Sets are equal if and only if their contents are equal:

In [217]:
{1, 2, 3} == {3, 2, 1}

True

#### Built-In Sequence Functions

##### enumerate

return a sequence of (i, value) tuples

In [None]:
for index, value in enumerate(collection):
    # do something with value

##### sorted

return a new sorted list from the elements of any sequence

In [219]:
sorted([7, 1, 2, 6, 0, 3, 2])

[0, 1, 2, 2, 3, 6, 7]

In [221]:
sorted("horse race")

[' ', 'a', 'c', 'e', 'e', 'h', 'o', 'r', 'r', 's']

##### zip

`zip` “pairs” up the elements of a number of lists, tuples, or other sequences to create a
list of tuples:

In [222]:
seq1 = ["foo", "bar", "baz"]

In [223]:
seq2 = ["one", "two", "three"]

In [224]:
zipped = zip(seq1, seq2)

In [225]:
list(zipped)

[('foo', 'one'), ('bar', 'two'), ('baz', 'three')]

`zip` can take an arbitrary number of sequences, and the number of elements it
produces is determined by the shortest sequence:

In [226]:
seq3 = [False, True]

In [227]:
list(zip(seq1, seq2, seq3))

[('foo', 'one', False), ('bar', 'two', True)]

##### reversed

`reversed` iterates over the elements of a sequence in reverse order:

In [228]:
list(reversed(range(10)))

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

#### List, Set, and Dictionary Comprehensions

List comprehensions là một tính năng tiện lợi và được sử dụng rộng rãi trong ngôn ngữ Python. Chúng cho phép bạn tạo ra một danh sách mới một cách ngắn gọn bằng cách:
- lọc các phần tử của một tập hợp,
- biến đổi các phần tử vượt qua điều kiện lọc,
- tất cả được viết trong một biểu thức ngắn gọn.


In [229]:
strings = ["a", "as", "bat", "car", "dove", "python"]

In [230]:
[x.upper() for x in strings if len(x) > 2]

['BAT', 'CAR', 'DOVE', 'PYTHON']

In [231]:
unique_lengths = {len(x) for x in strings}

In [232]:
unique_lengths

{1, 2, 3, 4, 6}

In [233]:
set(map(len, strings))

{1, 2, 3, 4, 6}

In [234]:
loc_mapping = {value: index for index, value in enumerate(strings)}

In [236]:
loc_mapping

{'a': 0, 'as': 1, 'bat': 2, 'car': 3, 'dove': 4, 'python': 5}

##### Nested list comprehensions

In [237]:
all_data = [["John", "Emily", "Michael", "Mary", "Steven"],
            ["Maria", "Juan", "Javier", "Natalia", "Pilar"]]

In [238]:
names_of_interest = []

In [240]:
result = [name for names in all_data for name in names
            if name.count("a") >= 2]

In [241]:
result

['Maria', 'Natalia']

another example:

In [242]:
some_tuples = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]

In [243]:
flattened = [x for tup in some_tuples for x in tup]

In [244]:
flattened

[1, 2, 3, 4, 5, 6, 7, 8, 9]

In [245]:
[[x for x in tup] for tup in some_tuples]

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

### 3.2 Functions

In [246]:
def my_function(x, y):
    return x + y

In [247]:
my_function(1, 2)

3

#### Namespaces, Scope, and Local Functions

In [249]:
a = []

In [250]:
def func():
    for i in range(5):
        a.append(i)

In [251]:
func()

In [252]:
a

[0, 1, 2, 3, 4]

In [253]:
func()

In [254]:
a

[0, 1, 2, 3, 4, 0, 1, 2, 3, 4]

#### Returning Multiple Values

In [255]:
def f():
    a = 5
    b = 6
    c = 7
    return {"a" : a, "b" : b, "c" : c}

In [256]:
f()

{'a': 5, 'b': 6, 'c': 7}

#### Functions Are Objects

In [257]:
states = [" Alabama ", "Georgia!", "Georgia", "georgia", "FlOrIda",
            "south carolina##", "West virginia?"]

In [260]:
import re
def clean_strings(strings):
    result = []
    for value in strings:
        value = value.strip()
        value = re.sub("[!#?]", "", value)
        value = value.title()
        result.append(value)
    return result

In [261]:
clean_strings(states)

['Alabama',
 'Georgia',
 'Georgia',
 'Georgia',
 'Florida',
 'South Carolina',
 'West Virginia']

In [263]:
def remove_punctuation(value):
    return re.sub("[!#?]", "", value)

clean_ops = [str.strip, remove_punctuation, str.title]

def clean_strings(strings, ops):
    result = []
    for value in strings:
        for func in ops:
            value = func(value)
        result.append(value)
    return result

In [264]:
clean_strings(states, clean_ops)

['Alabama',
 'Georgia',
 'Georgia',
 'Georgia',
 'Florida',
 'South Carolina',
 'West Virginia']

In [265]:
for x in map(remove_punctuation, states):
    print(x)

 Alabama 
Georgia
Georgia
georgia
FlOrIda
south carolina
West virginia


#### Anonymous (Lambda) Functions

In [267]:
def apply_to_list(some_list, f):
    return [f(x) for x in some_list]

In [268]:
ints = [4, 0, 1, 5, 6]

In [269]:
apply_to_list(ints, lambda x: x * 2)

[8, 0, 2, 10, 12]

another example

In [270]:
strings = ["foo", "card", "bar", "aaaa", "abab"]

In [271]:
strings.sort(key=lambda x: len(set(x)))

In [272]:
strings

['aaaa', 'foo', 'abab', 'bar', 'card']

#### Generators

Generator là một cách tiện lợi để tạo ra một đối tượng có thể lặp (iterable), tương tự như khi viết một hàm thông thường. Tuy nhiên, khác với hàm thông thường chỉ trả về một giá trị duy nhất và sau đó kết thúc, generator có thể trả về một chuỗi giá trị, tạm dừng và tiếp tục thực thi mỗi lần được gọi.

In [273]:
def squares(n=10):
    print(f"Generating squares from 1 to {n ** 2}")
    for i in range(1, n + 1):
        yield i ** 2

In [274]:
gen = squares()

In [275]:
gen

<generator object squares at 0x104be90e0>

In [276]:
for x in gen:
    print(x, end=" ")

Generating squares from 1 to 100
1 4 9 16 25 36 49 64 81 100 

##### Generator expressions

In [277]:
gen = (x ** 2 for x in range(100))

In [278]:
gen

<generator object <genexpr> at 0x104bb1150>

In [279]:
sum(x ** 2 for x in range(100))

328350

##### itertools module

In [280]:
import itertools

def first_letter(x):
    return x[0]


In [281]:
names = ["Alan", "Adam", "Wes", "Will", "Albert", "Steven"]

In [282]:
for letter, names in itertools.groupby(names, first_letter):
    print(letter, list(names))

A ['Alan', 'Adam']
W ['Wes', 'Will']
A ['Albert']
S ['Steven']


![image.png](attachment:image.png)

#### Errors and Exception Handling

![image.png](attachment:image.png)

- Xử lý exception bằng try....except

In [283]:
try:
    x = int("abc")
except ValueError:
    print("Không chuyển đổi được chuỗi sang số.")

Không chuyển đổi được chuỗi sang số.


- Thêm else và finally

In [284]:
try:
    x = 10 / 2
except ZeroDivisionError:
    print("Không chia được cho 0.")
else:
    print("Chia thành công:", x)
finally:
    print("Luôn luôn chạy đoạn này.")

Chia thành công: 5.0
Luôn luôn chạy đoạn này.


### 3.3 Files and the Operating System

To open a file for reading or writing, use the built-in open function with either a
relative or absolute file path and an optional file encoding:

In [286]:
path = "examples/segismundo.txt"
f = open(path, encoding="utf-8")

for line in f:
    print(line)

Sueña el rico en su riqueza,

que más cuidados le ofrece;



sueña el pobre que padece

su miseria y su pobreza;



sueña el que a medrar empieza,

sueña el que afana y pretende,

sueña el que agravia y ofende,



y en el mundo, en conclusión,

todos sueñan lo que son,

aunque ninguno lo entiende.





In [287]:
lines = [x.rstrip() for x in open(path, encoding="utf-8")]

In [288]:
lines

['Sueña el rico en su riqueza,',
 'que más cuidados le ofrece;',
 '',
 'sueña el pobre que padece',
 'su miseria y su pobreza;',
 '',
 'sueña el que a medrar empieza,',
 'sueña el que afana y pretende,',
 'sueña el que agravia y ofende,',
 '',
 'y en el mundo, en conclusión,',
 'todos sueñan lo que son,',
 'aunque ninguno lo entiende.',
 '']

In [289]:
f.close()

In [290]:
with open(path, encoding="utf-8") as f:
    lines = [x.rstrip() for x in f]

![image.png](attachment:image.png)

![image.png](attachment:image.png)

![image.png](attachment:image.png)