# Đảo ngược Dictionary
Đôi khi chúng ta có 1 dictionary trong tay, và muốn có thể nhảy tới đúng key và value của nó. Dĩ nhiên, có nhiều mối lo lắng như “làm cách nào để chúng ta có thể đối phó với các ‘clone value’?” và “sẽ ra sao nếu các value đang không ‘hashable’?”. Điều đó nói rằng, trong các trường hợp đơn giản, sẽ có vài cách hóa giải:

## Đảo ngược từ điển (invert dictionary) có giá trị duy nhất (unique key).

# Sắp xếp 1 List các String
Sắp xếp là 1 task thông thường mà bạn sẽ được mong đợi để biết cách triển khai thực hiện trong ngành Khoa học Máy tính. Cho dù việc sắp xếp các thuật toán trong hầu hết các chương trình giảng dạy cần sự tập trung cao độ, không ai sẽ nói cho bạn biết về độ phức tạp mà việc sắp xếp mang lại. Ví dụ: sắp xếp các con số khá đơn giản, vậy còn sắp xếp các string sẽ ra sao? Làm cách nào để ta quyết định 1 thứ tự thích hợp? Không sao cả, có khá nhiều sự lựa chọn trong Python:  

In [9]:
my_list = ["leaf", "cherry", "fish"]

### Phương pháp duyệt trâu sử dụng bubble sort

In [3]:
size = len(my_list)
for i in range(size): 
    for j in range(size): 
        if my_list[i] < my_list[j]: 
            temp = my_list[i] 
            my_list[i] = my_list[j] 
            my_list[j] = temp

### Sắp xếp danh sách chung (nhanh nhất)

In [9]:
my_list.sort() # prints ["Fish", "cherry", "leaf"]

### Sắp xếp danh sách tuỳ chỉnh bằng casefold

In [2]:
my_list.sort(key=str.casefold) # prints ["cherry", "Fish", "leaf"]

['cherry', 'fish', 'leaf']

### Sắp xếp bằng hàm sorted

In [5]:
my_list = sorted(my_list) # prints ["Fish", "cherry", "leaf"]

### Sắp xếp danh sách tùy chỉnh bằng casefold (>= Python 3.3)

In [None]:
my_list = sorted(my_list, key=str.casefold) # prints ["cherry", "Fish", "leaf"]

### Sắp xếp danh sách tùy chỉnh bằng locale hiện tại

In [4]:
import locale
from functools import cmp_to_key
my_list = sorted(my_list, key=cmp_to_key(locale.strcoll))

['cherry', 'fish', 'leaf']

### Sắp xếp danh sách đảo ngược tùy chỉnh bằng casefold (> = Python 3.3)

In [10]:
my_list = sorted(my_list, key=str.casefold, reverse=True)

['leaf', 'fish', 'cherry']

# Phân tích 1 Bảng tính
(Parsing a Spreadsheet)

1 trong những trường hợp sử dụng thú vị cho Python là vì ‘data science’. Nhưng không may, tuy nhiên, điều đó có nghĩa là bạn phải xử lý rất nhiều ‘raw data’ trong các định dạng khác nhau như file văn bản và bảng tính. May mắn rằng, Python có nhiều tiện ích được built-in cho việc đọc các định dạng file khác nhau. Ví dụ, chúng ta có thể phân tích 1 bảng tính 1 cách dễ dàng bằng cách: 

### Phương pháp duyệt trâu

In [3]:
csv_mapping_list = []
with open("data.csv") as my_data:
  line_count = 0
  for line in my_data:
    row_list = [val.strip() for val in line.split(",")]
    if line_count == 0:
      header = row_list
    else:
      row_dict = {}
      for i, key in enumerate(header):
        row_dict[key] = row_list[i]
      csv_mapping_list.append(row_dict)
    line_count += 1
csv_mapping_list

[{'cdatetime': '1/1/06 0:00',
  'address': '3108 OCCIDENTAL DR',
  'district': '3',
  'beat': '3C',
  'grid': '1115',
  'crimedescr': '10851(A)VC TAKE VEH W/O OWNER',
  'ucr_ncic_code': '2404',
  'latitude': '38.55042047',
  'longitude': '-121.3914158'},
 {'cdatetime': '1/1/06 0:00',
  'address': '2082 EXPEDITION WAY',
  'district': '5',
  'beat': '5A',
  'grid': '1512',
  'crimedescr': '459 PC  BURGLARY RESIDENCE',
  'ucr_ncic_code': '2204',
  'latitude': '38.47350069',
  'longitude': '-121.4901858'},
 {'cdatetime': '1/1/06 0:00',
  'address': '4 PALEN CT',
  'district': '2',
  'beat': '2A',
  'grid': '212',
  'crimedescr': '10851(A)VC TAKE VEH W/O OWNER',
  'ucr_ncic_code': '2404',
  'latitude': '38.65784584',
  'longitude': '-121.4621009'},
 {'cdatetime': '1/1/06 0:00',
  'address': '22 BECKFORD CT',
  'district': '6',
  'beat': '6C',
  'grid': '1443',
  'crimedescr': '476 PC PASS FICTICIOUS CHECK',
  'ucr_ncic_code': '2501',
  'latitude': '38.50677377',
  'longitude': '-121.4269508

### Phương pháp CSV reader

In [6]:
import csv
csv_mapping_list = []
with open("data.csv") as my_data:
  csv_reader = csv.reader(my_data, delimiter=",")
  line_count = 0
  for line in csv_reader:
     if line_count == 0:
       header = line
     else:
       row_dict = {key: value for key, value in zip(header, line)}
       csv_mapping_list.append(row_dict)
     line_count += 1
csv_mapping_list

[{'cdatetime': '1/1/06 0:00',
  'address': '3108 OCCIDENTAL DR',
  'district': '3',
  'beat': '3C        ',
  'grid': '1115',
  'crimedescr': '10851(A)VC TAKE VEH W/O OWNER',
  'ucr_ncic_code': '2404',
  'latitude': '38.55042047',
  'longitude': '-121.3914158'},
 {'cdatetime': '1/1/06 0:00',
  'address': '2082 EXPEDITION WAY',
  'district': '5',
  'beat': '5A        ',
  'grid': '1512',
  'crimedescr': '459 PC  BURGLARY RESIDENCE',
  'ucr_ncic_code': '2204',
  'latitude': '38.47350069',
  'longitude': '-121.4901858'},
 {'cdatetime': '1/1/06 0:00',
  'address': '4 PALEN CT',
  'district': '2',
  'beat': '2A        ',
  'grid': '212',
  'crimedescr': '10851(A)VC TAKE VEH W/O OWNER',
  'ucr_ncic_code': '2404',
  'latitude': '38.65784584',
  'longitude': '-121.4621009'},
 {'cdatetime': '1/1/06 0:00',
  'address': '22 BECKFORD CT',
  'district': '6',
  'beat': '6C        ',
  'grid': '1443',
  'crimedescr': '476 PC PASS FICTICIOUS CHECK',
  'ucr_ncic_code': '2501',
  'latitude': '38.5067737

### Phương pháp CSV DictReader

In [7]:
import csv
with open("data.csv") as my_data: 
    csv_mapping_list = list(csv.DictReader(my_data))
csv_mapping_list

[OrderedDict([('cdatetime', '1/1/06 0:00'),
              ('address', '3108 OCCIDENTAL DR'),
              ('district', '3'),
              ('beat', '3C        '),
              ('grid', '1115'),
              ('crimedescr', '10851(A)VC TAKE VEH W/O OWNER'),
              ('ucr_ncic_code', '2404'),
              ('latitude', '38.55042047'),
              ('longitude', '-121.3914158')]),
 OrderedDict([('cdatetime', '1/1/06 0:00'),
              ('address', '2082 EXPEDITION WAY'),
              ('district', '5'),
              ('beat', '5A        '),
              ('grid', '1512'),
              ('crimedescr', '459 PC  BURGLARY RESIDENCE'),
              ('ucr_ncic_code', '2204'),
              ('latitude', '38.47350069'),
              ('longitude', '-121.4901858')]),
 OrderedDict([('cdatetime', '1/1/06 0:00'),
              ('address', '4 PALEN CT'),
              ('district', '2'),
              ('beat', '2A        '),
              ('grid', '212'),
              ('crimedescr', '10851

# Sắp xếp 1 List các Dictionary
1 khi bạn đã có 1 list các dictionary, bạn có thể sẽ muốn tổ chức chúng trong vài trật tự cụ thể. Ví dụ: nếu các dictionary có 1 key cho date, ta có thể thử sắp xếp chúng theo thứ tự theo niên đại. May thay, sắp xếp là một nhiệm vụ tương đối nhẹ nhàng: 

In [12]:
csv_mapping_list = [
  { "Name": "Jeremy", "Age": 25, "Favorite Color": "Blue" }, 
  { "Name": "Ally", "Age": 41, "Favorite Color": "Magenta" }, 
  { "Name": "Jasmine", "Age": 29, "Favorite Color": "Aqua" }
]

### Sắp xếp tùy chỉnh

In [11]:
# Custom sorting
size = len(csv_mapping_list)
for i in range(size):
    min_index = i
    for j in range(i + 1, size):
        if csv_mapping_list[min_index]["Age"] > csv_mapping_list[j]["Age"]:
            min_index = j
    csv_mapping_list[i], csv_mapping_list[min_index] = csv_mapping_list[min_index], csv_mapping_list[i]
    
csv_mapping_list

[{'Name': 'Jeremy', 'Age': 25, 'Favorite Color': 'Blue'},
 {'Name': 'Jasmine', 'Age': 29, 'Favorite Color': 'Aqua'},
 {'Name': 'Ally', 'Age': 41, 'Favorite Color': 'Magenta'}]

###  Hàm sắp xếp danh sách

In [13]:
csv_mapping_list.sort(key=lambda item: item.get("Age"))
csv_mapping_list

[{'Name': 'Jeremy', 'Age': 25, 'Favorite Color': 'Blue'},
 {'Name': 'Jasmine', 'Age': 29, 'Favorite Color': 'Aqua'},
 {'Name': 'Ally', 'Age': 41, 'Favorite Color': 'Magenta'}]

### Sắp xếp danh sách bằng itemgetter

In [None]:
from operator import itemgetter
f = itemgetter('Name')
csv_mapping_list.sort(key=f)

### Hàm sắp xếp Iterable 

In [None]:
csv_mapping_list = sorted(csv_mapping_list, key=lambda item: item.get("Age"))

# Viết 1 List Comprehension
1 trong những đề tài Python yêu thích của mình là nói về các list comprehension. Như những ai đã có thời gian dài sử dụng các ngôn ngữ nhu Java, C/C++ và C#, mình chưa từng thấy thứ gì giống như là 1 list comprehension cho tới khi mình tập tành với Python. Giờ đây, mình khá là bị cuốn hút với chúng. Kết quả là, mình đã đặt chúng cùng nhau trong 1 list toàn bộ:

### Định nghĩa danh sách 1D chung

In [15]:
my_list = [2, 5, -4, 6]

### Sao chép danh sách 1D

In [16]:
[item for item in my_list]

[2, 5, -4, 6]

### Sao chép và scale giá trị phần tử trong danh sách 1D

In [17]:
[2 * item for item in my_list]

[4, 10, -8, 12]

### Sao chép và lọc ra những thành phần không âm từ danh sách 1D

In [18]:
[item for item in my_list if item < 0]

[-4]

### Sao chép, lọc và scale giá trị phần tử trong danh sách 1D

In [19]:
[2 * item for item in my_list if item < 0]

[-8]

### Tạo tất cả các cặp có thể từ hai danh sách

In [14]:
[(a, b) for a in (1, 3, 5) for b in (2, 4, 6)]

[(1, 2), (1, 4), (1, 6), (3, 2), (3, 4), (3, 6), (5, 2), (5, 4), (5, 6)]

### Khởi tạo lại danh sách thành 2D

In [20]:
my_list = [[1, 2], [3, 4]]

### Sao chép danh sách 2D

In [21]:
[[item for item in sub_list] for sub_list in my_list]

[[1, 2], [3, 4]]

### Sao chép danh sách n chiều

In [22]:
def deep_copy(to_copy): 
    if type(to_copy) is list: 
        return [deep_copy(item) for item in to_copy] 
    else: 
        return to_copy
    
deep_copy(my_list)

[[1, 2], [3, 4]]

# Gộp 2 Dictionary
Trong bộ sưu tập này, ta đã nói rất nhiều về việc xử lý các cấu trúc data như list và dictionary. Vâng, cái này cũng sẽ tương tự. Cụ thể hơn là, chúng ta đang xem về việc gộp 2 dictionary lại với nhau. Dĩ nhiên, việc hợp nhất 2 dictionary sẽ mang vài rủi ro. Ví dụ: Nếu có các key bị lặp (duplicate key) thì sẽ ra sao? Thật may vì ta sẽ có các giải pháp cho nó:

In [28]:
yusuke_power = {"Yusuke Urameshi": "Spirit Gun"}
hiei_power = {"Hiei": "Jagan Eye"}
powers = dict()

### Duyệt trâu

In [25]:
for dictionary in (yusuke_power, hiei_power): 
    for key, value in dictionary.items(): 
        powers[key] = value
powers

{'Yusuke Urameshi': 'Spirit Gun', 'Hiei': 'Jagan Eye'}

### Dictionary Comprehension

In [27]:
powers = {key: value for d in (yusuke_power, hiei_power) for key, value in d.items()}
powers

{'Yusuke Urameshi': 'Spirit Gun', 'Hiei': 'Jagan Eye'}

### Sao chép và cập nhật

In [None]:
powers = yusuke_power.copy()
powers.update(hiei_power)

### Giải nén từ điển (Python 3.5+)

In [None]:
powers = {**yusuke_power, **hiei_power}

### Hàm tương thích ngược cho bất kỳ số lượng dicts

In [31]:
def merge_dicts(*dicts: dict): 
    merged_dict = dict() 
    for dictionary in dicts: 
        merge_dict.update(dictionary) 
    return merged_dict

merge_dicts({yusuke_power, hiei_power})

TypeError: unhashable type: 'dict'

# Định dạng 1 String
Dù thích hay không, chúng ta cũng sẽ tự thấy rằng mình mình hay vùi dập các lệnh print xuyên suốt dòng code cho mục đích debug nhanh hơn. Sau tất cả, 1 lệnh print được đặt đúng chỗ có thể giúp bạn tiết kiệm được khá nhiều thời gian. Tuy nhiên, không phải lúc này cũng dễ dàng và tiện lợi để hiển thị đúng thứ ta muốn. Nhưng không sao cả, Python có khá nhiều lựa chọn cho ‘format’: 

In [None]:
name = "Jeremy"
age = 25

### Định dạng chuỗi bằng cách sử dụng nối

In [None]:
print("My name is " + name + ", and I am " + str(age) + " years old.")

### Định dạng chuỗi bằng print nhiều lần

In [None]:
print("My name is ", end="")
print(name, end="")
print(", and I am ", end="")
print(age, end="")
print(" years old.")

### Định dạng chuỗi bằng cách sử dụng join

In [None]:
print(''.join(["My name is ", name, ", and I am ", str(age), " years old"]))

### Định dạng chuỗi bằng toán tử module

In [None]:
print("My name is %s, and I am %d years old." % (name, age))

### Định dạng chuỗi bằng hàm format với các tham số được sắp xếp

In [None]:
print("My name is {}, and I am {} years old".format(name, age))

### Định dạng chuỗi bằng hàm format với các tham số được đặt tên

In [None]:
print("My name is {n}, and I am {a} years old".format(a=age, n=name))

### Định dạng chuỗi bằng f-Strings (Python 3.6+)

In [None]:
print(f"My name is {name}, and I am {age} years old")

# Print trên cùng 1 Dòng
Đi cùng với dòng tương tự như việc định dạng các string, đôi lúc bạn chỉ cần để print trên cùng 1 dòng trong Python. Cũng như lệnh “ print “ hiện tại được thiết kế, nó tự động áp dụng 1 dòng mới tới cuối dòng string của bạn. May thay, có 1 vài cách bên cạnh đó:

### Tương thích ngược (nhanh nhất)

In [12]:
import sys
sys.stdout.write("Breaking Bad")

Breaking Bad

### Chỉ với Python 3

In [None]:
print("Mob Psycho 100", end="")

# Kiểm tra Hiệu năng

### Phương pháp duyệt trâu

In [18]:
import datetime
start_time = datetime.datetime.now()
[(a, b) for a in (1, 3, 5) for b in (2, 4, 6)] 
# example snippet
end_time = datetime.datetime.now()
print(end_time - start_time)

0:00:00


### Phương pháp timeit 

In [15]:
import timeit
min(timeit.repeat("[(a, b) for a in (1, 3, 5) for b in (2, 4, 6)]"))

0.9091194999996333

### Phương pháp cProfile 

In [14]:
import cProfile
cProfile.run("[(a, b) for a in (1, 3, 5) for b in (2, 4, 6)]")

         4 function calls in 0.000 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.000    0.000 <string>:1(<listcomp>)
        1    0.000    0.000    0.000    0.000 <string>:1(<module>)
        1    0.000    0.000    0.000    0.000 {built-in method builtins.exec}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}


