# Các mẹo trong Python

## Câu lệnh trong điều kiện

Trong python, các câu lệnh điều kiện if...else có thể viết ngắn gọn và đơn giản như sau:

```python
# Don't
def factorial(n):
  if n == 0:
    return 1
  else:
    return n * factorial(n-1)

# Do
def factorial(n):
  return 1 if n == 0 else n * factorial(n-1)
```

Ví dụ 2

```python
# Dont
def __init__(self, name, contents=None):
  self.name = name
  if contents == None:
    contents = []
  self.pouch_contents = contents
# Do
def __init__(self, name, contents = None):
  self.name = name
  self.pouch_contents = [] if contents = None else contents
```

## Any vs All

Hàm `any` trong trong python cho phép trả ra kết quả nếu 1 trong các điều kiện là `TRUE`

In [1]:
any(x > 2 for x in [1, 2, 4])

True

Khác với `any`, `all` sẽ kiểm tra tất cả điều kiện

In [2]:
all(x > 2 for x in [1, 2, 4])

False

## Debug 

Sử dụng `%xmode` hoặc `%debug` để tìm lỗi. Xem ví dụ dưới đây

In [3]:
def func_1(a,b):
    return(a/b)

In [4]:
func_1(8,3)

2.6666666666666665

In [5]:
#| eval: false
func_1(7,0)

ZeroDivisionError: division by zero

Sử dụng `%xmode` cho phép hiển thị thêm các thông tin lỗi trong `jupyter notebook`

In [6]:
%xmode Verbose

Exception reporting mode: Verbose


In [7]:
#| eval: false
func_1(8,0)

ZeroDivisionError: division by zero

## Kiểm tra thời gian chạy code

Python cho phép sử dụng profiling. Hai `magic command` hay dùng nhất là `%time` & `%timeit`.
`%timeit` cho phép hiển thị thông tin chính xác với nhiều thông số hơn.

In [10]:
%time sum(range(100))

CPU times: total: 0 ns
Wall time: 0 ns


4950

In [11]:
#| eval: false
%timeit sum(range(100))

2.33 µs ± 81.6 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


## Profiling với memory 

cài đặt `memory_profiler` trên với `anaconda prompt`

`pip install memory_profiler`

In [12]:
#| eval: false
%load_ext memory_profiler

ModuleNotFoundError: No module named 'memory_profiler'

In [13]:
#| eval: false
def sum_of_lists(N):
           total = 0
           for i in range(5):
               L = [j ^ (j >> i) for j in range(N)]
               total += sum(L)
           return total

In [14]:
#| eval: false
%memit sum_of_lists(10000)

UsageError: Line magic function `%memit` not found.


In [15]:
#| eval: false
sum_of_lists(10000)

211713248

## Phân biệt các dấu gạch dưới trong Python

Dâu gạch dưới `_` có nhiều ý nghĩa khác nhau trong Python và có nhiều cách sử dụng như sau

### Lưu giá trị từ trước

Cách này chỉ sử dụng với Ipython

In [16]:
x = 10

In [17]:
_

211713248

### Bỏ qua giá trị không cần thiết

In [18]:
a,_, c = (1, 2, 3)

In [19]:
a, c

(1, 3)

In [20]:
# Ignore nhiều giá trị
a, *_, b = (1,2,3,4,5,6,7)
print(a); print(b)

1
7


### Sử dụng trong loop

In [21]:
for _ in range(5):
    print(_)

0
1
2
3
4


In [22]:
languages = ['R', 'Python', 'Scala']
for _ in languages:
    print(_)

R
Python
Scala


### Phân cách hàng nghìn

In [23]:
x = 1_000_000
print(x)

1000000


### Đặt tên có chứa `_`

Trong Python, có 4 cách đặt tên chứa `_`:
- Một dấu đằng trước: `_name`
- Một dấu đằng sau: `name_`
- Hai dấu đằng trước: `__name`
- Hai dấu ở hai bên: `__name__`

#### Một dấu đằng trước

Cho phép bỏ qua hàm khi import

In [24]:
# Tạo file my_functions.py 

```python
## filename: my_functions.py
## Ví dụ để hiểu rõ chức năng của dấu gạch dưới trong python

def func():
    return "Anh Hoang Duc"

def _private_func():
    return 7
```

In [25]:
#| eval: false
from my_functions import *

In [26]:
#| eval: false
func()

'Anh Hoang Duc'

In [27]:
#| eval: false
_private_func()

NameError: name '_private_func' is not defined

Trong cách import trên, hàm `_private_func` đã không được import vào trong môi trường làm việc. Ta có thể import vào môi trường làm việc như sau

In [28]:
#| eval: false
import my_functions

my_functions.func()

my_functions._private_func()

7

#### Gạch dưới cuối tên

Sử dụng khi dùng làm keyword

In [29]:
#| eval: false
def function(class):
    return print(class)

SyntaxError: invalid syntax (3330074424.py, line 2)

In [30]:
def function(class_):
    return print(class_)

In [31]:
function(9)

9


#### Hai gạch dưới đầu tên


## List object trong môi trường làm việc 

Hiển thị tất cả các biến trong môi trường: sử dụng `%whos`

In [33]:
x, y = 7, 'test' 

In [34]:
#| eval: false
%whos

Variable       Type        Data/Info
------------------------------------
a              int         1
b              int         7
c              int         3
func           function    <function func at 0x000001FBCAF8E520>
func_1         function    <function func_1 at 0x000001FBCA4FE5C0>
function       function    <function function at 0x000001FBCAF8DE40>
languages      list        n=3
my_functions   module      <module 'my_functions' fr<...>source\\my_functions.py'>
sum_of_lists   function    <function sum_of_lists at 0x000001FBCA331760>
x              int         7
y              str         test


Sử dụng `%who_ls data_type`

In [35]:
#| eval: false
import pandas as pd
df = pd.DataFrame({'x' : [1,2,3]})
x = [1,2,3]

%who_ls DataFrame

['df']

In [36]:
#| eval: false
%who_ls list

['languages', 'x']

In [37]:
#| eval: false
%who_ls DataFrame list

['df', 'languages', 'x']

## Hiển thị nhiều kết quả trong 1 cell

Trong jupyter notebook, kết quả trong 1 cell chỉ được hiển thị 1 lần. ta có thể khắc phục như sau

In [38]:
#| eval: false
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

In [39]:
#| eval: false
x, y = 7, 8

In [40]:
#| eval: false
x
y
x * y

7

8

56

## Assign string thành object

**Problem**: Tạo cùng lúc nhiều object, gán mỗi object với 1 giá trị

In [41]:
import numpy as np
df_name = ["df1", "df2", "df3"]

In [42]:
for i in df_name:
    globals()[i] = np.random.random(1)
    print(i)
    print(eval(i))

df1
[0.21859902]
df2
[0.51883594]
df3
[0.75769141]


In [43]:
for i in df_name:
    del globals()[i]

## Evaluation

Tương tự như R, Python có thể sử dụng evaluation để thực hiện lập trình

In [44]:
my_df = 7

In [45]:
eval('my_df')

7

## Xóa toàn bộ environment

In [46]:
#| eval: false
# Xóa dataframe
all_var = %who_ls DataFrame

In [47]:
#| eval: false
for i in all_var:
    print(globals()[i])

   x
0  1
1  2
2  3


In [48]:
for _ in all_var:
    del globals()[_]

In [49]:
#| eval: false
%who_ls

['InteractiveShell',
 'a',
 'all_var',
 'b',
 'c',
 'df_name',
 'func',
 'func_1',
 'function',
 'i',
 'languages',
 'my_df',
 'my_functions',
 'np',
 'pd',
 'sum_of_lists',
 'x',
 'y']

In [50]:
#| eval: false
# Delete all
%reset -f

## Lưu code từ cell thành file

Sử dụng magic command %%writefile

```python
%%writefile 09.test_script/03_test_script.py
def joke():
    print('My job')
```

## Mở một loạt file text và sửa nội dung

In [51]:
#| eval: false
def replace_md(file, find, replace):
    with open(file, encoding="utf8") as f:
        s = f.read()
        s = s.replace(find, replace)
    with open(file,'w', encoding="utf8") as f:
        f.write(s)

import glob, os
os.chdir("../_book")
for file in glob.glob("*.md"):
    replace_md(file = file, find = '<img src="', replace = '![](')
    replace_md(file = file, find = '" width="672" />', replace = ')\n\n')

FileNotFoundError: [WinError 2] The system cannot find the file specified: '../_book'

## Chạy file python từ bat

In [52]:
#| eval: false
python script.py

SyntaxError: invalid syntax (3594411081.py, line 2)

## Auto format

Ta có thể sử dụng package `black` để auto format lại các file trong python.

- Tất cả string để lại dưới dạng ngoặc kép (double quoted)
- Loại các khoảng trắng không cần thiết
- Chuẩn hóa các đoạn code dài

```python
black script.py
```