In [None]:
%%html
<style>
    table, th, td {
        font-size: 18px;
    }
    
    .data {
        color: #fb6f84;
    }
    
    .basic {
        color: #5dead5;
    }
    
    .title {
        color: #7c3bed;
        font-weight: bold;
    }
    
</style>

# <center> Giới thiệu </center>

# Tại sao nên dùng Python?

- #### Dễ dùng, dễ học và miễn phí.
- #### Nhiều thư viện / code được làm sẵn, chỉ việc dùng.
- #### Cộng đồng lớn, cả về người dùng và lập trình viên (là ngôn ngữ phổ biến nhất).
- #### Hỗ trợ rất nhiều lĩnh vực khác nhau: AI, data, scientific computing, web, game, automation, hacking...

# Mục tiêu khóa học

#### $\Rightarrow$ Dùng *python* để xử lý các tác vụ **phân tích dữ liệu**.

### Định hướng:
- #### Python phục vụ **data analysis**.
- #### "Vừa đủ" khái niệm để thực hành.
- #### Thực hành và thực hành.

# Nội dung

| <div class='title'>Buổi</div> | <div class='title'>Nội dung</div> |
|:---:|---|
| **1** | Giới thiệu, cài đặt và một số khái niệm với Python. |
| <div class='basic'>**2**</div> | Python cơ bản 1 |
| <div class='basic'>**3**</div> | Python cơ bản 2 |
| <div class='basic'>**4**</div> | `numpy` |
| <div class='data'>**5**</div> | `pandas` 1 |
| <div class='data'>**6**</div> | `pandas` 2 |
| <div class='data'>**7**</div> | `pandas` 3 |
| <div class='data'>**8**</div> | Visualization |
| **9** | Data Analysis |
| **10** | Tổng kết |

# Cài đặt

## Cần cài những gì?
- #### Python interpreter (console).
- #### Code editor (Jupyter Notebook/Lab, VSCode).
- #### Libraries.

## Anaconda
#### ➡ Tải về: https://www.anaconda.com/products/individual
#### ➡ Set path (không nên set path khi dùng macOS hay linux).
#### ➡ Cài thêm một số gói.

## Jupyter
#### ➡ Jupyter notebook.
#### ➡ Jupyter lab.

## Google Colab (cloud)
https://colab.research.google.com/

# Demo

## In thông tin ra console

In [None]:
'whatever'

In [None]:
'wont be printed'
'whatever'

In [None]:
print('wont be printed')
'whatever'

In [None]:
n = 15

for i in range(n):
    num_spaces = n - i - 1
    num_dots = 2*i + 1
    print(' '*num_spaces, '+'*num_dots)

## Tính toán

In [None]:
from math import sin, cos, pi

x = 5*pi/3
print(f"sin({x/pi:.1f}π) + cos({x/pi:.1f}π) = {sin(x) + cos(x):.2f}")

## Vẽ hình và thiết kế giao diện

In [None]:
import matplotlib.pyplot as plt
import matplotlib.animation
import numpy as np
from IPython.display import HTML

t = np.linspace(0,2*np.pi)
x = np.sin(t)

fig, ax = plt.subplots()
ax.axis([0,2*np.pi,-1,1])
l, = ax.plot([],[], 'b')

def animate(i): 
    l.set_data(t[:i], x[:i])

ani = matplotlib.animation.FuncAnimation(fig, animate, frames=len(t))
HTML(ani.to_jshtml())

## Lấy thông tin từ internet

In [None]:
import requests
from bs4 import BeautifulSoup

url = 'https://news.google.com/topstories?hl=vi&gl=VN&ceid=VN:vi'
page = requests.get(url).content
soup = BeautifulSoup(page, 'html.parser')
t = soup.select('a.DY5T1d.RZIKme')
titles = [item.text for item in t]

print(*titles, sep='\n' + '---'*30 + '\n')

## Tổng hợp và phân tích dữ liệu

In [None]:
from underthesea import word_tokenize
from collections import Counter

text = ' '.join(titles)

counts = Counter([token for token in word_tokenize(text) if token not in [',', '.', ':']])
counts.most_common()[:15]

# Một số tác vụ thường dùng

## Mở `jupyter notebook` trong một thư mục

- Mở thư mục bằng Windows Explorer.

- Mở PowerShell: chuột phải vào vùng trống (giữ Shift), chọn "Open PowerShell..."

- Gõ vào "jupyter lab", nhấn Enter.

## Cấu trúc của `jupyter notebook`

## Chạy code trên `jupyter notebook`

## Một số phím tắt

__Run__: Ctrl+Enter

__Run and advance__: Shift+Enter

__Command mode__: Esc

__Markdown__: Esc m

__Code__: Esc y

__Copy__: Esc c

__Cut__: Esc x

__Paste__: Esc v

__Add cell below__: Esc b

__Add cell above__: Esc a

## Cài đặt thêm thư viện

In [None]:
pip install library_name
conda install library_name

# Hàm `print` và `input`

In [None]:
print('This content will be printed')  # print a string

In [None]:
print("This content will be printed")

In [None]:
print(This content will be printed)

In [None]:
print('aa', 'bb', "cc")

In [None]:
print('This is the first line')
print('\tThis is the second line')  # backslash t(ab)
print()
print('\tThis is the \nthird line')  # backslash n(ewline) / r(eturn)

In [None]:
a = input('Nhap vao query: ')
a  # print(a)

In [None]:
a = input('Nhap vao query: ')
print(a, '<--- this is from input')

In [None]:
int(a) / 2  # integer

# Đọc code

In [None]:
1 + 1

In [None]:
a = 2
b = 3
a + b

In [None]:
a, b = 2, 3
a, b

In [None]:
a_1 = 2
b = 3
a_1*b

In [None]:
a_b_c_1_2_3 = 1  # underscore
a_b_c_1_2_3

In [None]:
a = 2
b = 3
a**b

In [None]:
a = 'a'
b = 'b'
a + b

In [None]:
a = 'ab'
a*5

In [None]:
a = 'a'
b = 'b'
a*b

In [None]:
a = 2
b = 0
a/b

In [None]:
s = 100
f's is {s**2}--{a}'  # f-string

In [None]:
name = 'Mr. A'
my_name = 'Mr. B'

s = f'''Dear {name}
Bla bla bla...
Best regards,
{my_name}.'''  # '''...''' <=> doc-string

print(s)

In [None]:
def f(x):   # def <=> define
    num = x*3
    num += 2  # num = num + 2
    return num

f(10)

In [None]:
numbers = [2,3,4,5]

mysum = 0
for i in numbers:
    mysum = mysum + i

mysum

In [None]:
numbers = [2,3,4,5]
my_sum = 0

for i in numbers:
    my_sum = my_sum + i
    my_sum = my_sum * 2

print(my_sum)

In [None]:
from math import pi

r = float(input("Input the radius of the circle : "))   # float = real number
print("The area of the circle with radius " + str(r) + " is: " + str(pi * r**2))
print("The area of the circle with radius", r, "is:", pi * r**2)
print(f'The area of the circle with radius {r} is: {pi * r**2}')

In [None]:
print(f'The area of the circle with radius {r} is: {round(pi * r**2, 2)}')

In [None]:
print(f'The area of the circle with radius {r} is: {pi * r**2:.4f}')

In [None]:
color_list = ["Red", "Green", "White", "Black"]  # list
print(color_list[0], color_list[-1])  # index {0,1,2,3,...}

# Cách gọi hàm từ thư viện

In [None]:
import math

In [None]:
math.sin(3.1415)
math.log(2.7)

In [None]:
from math import sin, cos, log, pi

In [None]:
import math as m

m.sin(m.pi)

In [None]:
from math import *

log10(e + sin(pi))

In [None]:
from pylab import *

plot(sin(linspace(-5,5,100)))

# Một số "jupyter magic" thường dùng

## Đo thời gian (time, timeit)

In [None]:
%%time
from time import sleep

sleep(2)

In [None]:
%time from time import sleep

sleep(2)

In [None]:
from time import sleep

%time sleep(2)

In [None]:
%timeit -n 10 -r 1 print('Hello')

## Ghi file và đọc nội dung file vào cell (writefile, load)

In [None]:
%%writefile ...
Lorem Ipsum is simply dummy text of the printing and typesetting industry. Lorem Ipsum has been the industry's standard dummy text ever since the 1500s, when an unknown printer took a galley of type and scrambled it to make a type specimen book. It has survived not only five centuries, but also the leap into electronic typesetting, remaining essentially unchanged. It was popularised in the 1960s with the release of Letraset sheets containing Lorem Ipsum passages, and more recently with desktop publishing software like Aldus PageMaker including versions of Lorem Ipsum.

In [None]:
# %load ...