# Machine Learning Mastery With Python
## Chương 1-4: Tổng quan Python và Cách Đọc Dữ Liệu

Notebook này hướng dẫn tổng quan về Python, các thư viện nền tảng cho Machine Learning, và các cách đọc dữ liệu từ file CSV

---

## Mục lục
1. [Giới thiệu Python & Thư viện](#gioi-thieu)
2. [Cú pháp Python cơ bản](#cu-phap)
3. [Làm quen với Numpy, Pandas, Matplotlib](#thu-vien)
4. [Đọc dữ liệu từ CSV](#doc-csv)
5. [Tổng kết](#tong-ket)

<a id="gioi-thieu"></a>
## 1. Giới thiệu Python & Thư viện nền tảng

Python là ngôn ngữ rất phổ biến cho Machine Learning vì:
- Cú pháp dễ đọc, dễ học
- Thư viện mạnh mẽ: numpy, pandas, matplotlib, scikit-learn

**Cài đặt thư viện (chạy một lần trên máy):**
```bash
pip install numpy pandas matplotlib scikit-learn
```

In [None]:
# Import các thư viện cơ bản cho Machine Learning
import numpy as np 
import pandas as pd 
import matplotlib.pyplot as plt

<a id="cu-phap"></a>
## 2. Cú pháp Python cơ bản

Một số cú pháp quan trọng giúp bạn đọc/viết code Python dễ dàng hơn.

In [None]:
# Gán giá trị và in ra
a, b, c = 1, 2, 3
print(a, b, c)  # In ra: 1 2 3

# List (danh sách)
mylist = [1, 2, 3]
mylist.append(4)
print(mylist)  # [1, 2, 3, 4]

# Dictionary (từ điển)
mydict = {'a': 1, 'b': 2}
print(mydict['a'])  # 1

# Functions (hàm)
def mysum(x, y):
    return x + y

print(mysum(5, 7))  # 12

<a id="thu-vien"></a>
## 3. Làm quen với Numpy, Pandas, Matplotlib

Các thư viện nền tảng cho Machine Learning:  
- **numpy**: thao tác mảng số liệu  
- **pandas**: xử lý dữ liệu dạng bảng  
- **matplotlib**: vẽ biểu đồ

In [None]:
# Numpy array
arr = np.array([1, 2, 3])
print("Shape of arr:", arr.shape)  # (3,)

In [None]:
# Pandas DataFrame
df = pd.DataFrame({'A': [1,2], 'B':[3,4]})
print(df)

In [None]:
# Matplotlib plot
plt.plot([1,2,3], [4,5,6])
plt.xlabel('x')
plt.ylabel('y')
plt.title('Demo plot')
plt.show()

<a id="doc-csv"></a>
## 4. Đọc dữ liệu từ file CSV

Dữ liệu Machine Learning thường ở dạng CSV. Có nhiều cách đọc file CSV trong Python:
- Dùng thư viện chuẩn `csv`
- Dùng `numpy`
- Dùng `pandas` (khuyến nghị)


In [None]:
import csv
with open('pima-indians-diabetes.data.csv', 'r') as file:
    reader = csv.reader(file)
    for i, row in enumerate(reader):
        print(row)
        if i == 4: break  # In 5 dòng đầu

In [None]:
data_np = np.loadtxt('pima-indians-diabetes.data.csv', delimiter=',')
print(data_np[:5])  # In 5 dòng đầu

In [None]:
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data_pd = pd.read_csv('pima-indians-diabetes.data.csv', names=names)
print(data_pd.head())

<a id="tong-ket"></a>
## 5. Tổng kết

- Đã làm quen với Python và các thư viện nền tảng cho Machine Learning.
- Đã biết cách đọc dữ liệu CSV bằng nhiều phương pháp.
- Sẵn sàng cho các bước phân tích dữ liệu và xây dựng mô hình tiếp theo.

