# Introduction to Python (giới thiệu lập trình Python)

Authors: Khanh Vu (UCI), Duc Hoang (MIT). Adapted from: Mathieu Blondel. 

# Python 1a: Welcome

Welcome to the first practical work of the week! In this practical, we will learn about the programming language Python as well as NumPy and Matplotlib, two fundamental tools for data science and machine learning in Python.

Chào mừng đến với bài thực hành đầu tiên của tuần! Trong bài thực hành này, chúng ta sẽ tìm hiểu về ngôn ngữ lập trình Python cũng như NumPy và Matplotlib, hai công cụ cơ bản cho khoa học dữ liệu và học máy.

This week, we will use Jupyter notebooks and Google colab as the primary way to practice machine learning. Notebooks are a great way to mix executable code with rich contents (HTML, images, equations written in LaTeX). Colab allows to run notebooks on the cloud for free without any prior installation, while leveraging the power of [GPUs](https://en.wikipedia.org/wiki/Graphics_processing_unit).

Tuần này, chúng ta sẽ sử dụng Jupyter Notebooks và Google Colab làm phương thức chính để thực hành học máy. Notebooks là một cách tuyệt vời để kết hợp code có thể thực thi với nội dung phong phú (HTML, hình ảnh, các phương trình viết bằng LaTeX). Colab cho phép chạy notebooks trên đám mây miễn phí mà không cần cài đặt trước, trong khi vẫn tận dụng sức mạnh của GPUs.

The document that you are reading is not a static web page, but an interactive environment called a notebook, that lets you write and execute code. Notebooks consist of so-called code cells, blocks of one or more Python instructions. For example, here is a code cell that stores the result of a computation (the number of seconds in a day) in a variable and prints its value:

Tài liệu bạn đang đọc không phải là một trang web tĩnh, mà là một môi trường tương tác được gọi là notebook, cho phép bạn viết và thực thi mã lệnh. Các notebook bao gồm các ô mã (code cells), là các khối chứa một hoặc nhiều lệnh Python. Ví dụ, dưới đây là một ô mã lưu kết quả của một phép tính (số giây trong một ngày) vào một biến và in ra giá trị của nó:

In [None]:
seconds_in_a_day = 24 * 60 * 60
seconds_in_a_day

Click on the "play" button to execute the cell. You should be able to see the result. Alternatively, you can also execute the cell by pressing Ctrl + Enter if you are on Windows / Linux or Command + Enter if you are on a Mac.

Nhấn vào nút "play" để chạy ô mã. Bạn sẽ thấy kết quả hiển thị. Ngoài ra, bạn cũng có thể chạy ô mã bằng cách nhấn Ctrl + Enter nếu bạn đang sử dụng Windows / Linux hoặc Command + Enter nếu bạn đang sử dụng Mac.

Variables that you defined in one cell can later be used in other cells:

Các biến mà bạn đã định nghĩa trong một ô có thể được sử dụng sau đó trong các ô khác:

In [None]:
seconds_in_a_week = 7 * seconds_in_a_day
seconds_in_a_week

Note that the order of execution is important. For instance, if we do not run the cell storing seconds_in_a_day beforehand, the above cell will raise an error, as it depends on this variable. To make sure that you run all the cells in the correct order, you can also click on "Runtime" in the top-level menu, then "Run all".

Lưu ý rằng thứ tự thực thi là quan trọng. Ví dụ, nếu chúng ta không chạy ô mã lưu giá trị seconds_in_a_day trước, thì ô mã phía trên sẽ phát sinh lỗi vì nó phụ thuộc vào biến này. Để đảm bảo rằng bạn chạy tất cả các ô mã theo đúng thứ tự, bạn cũng có thể nhấp vào "Runtime" trong menu ở trên, sau đó chọn "Run all".

**Exercise.** Add a cell below this cell: click on this cell then click on "+ Code". In the new cell, compute the number of seconds in a year by reusing the variable *seconds_in_a_day*. Run the new cell.

Bài tập. Thêm một ô mã bên dưới ô này: nhấp vào ô này sau đó nhấp vào “+ Code”. Trong ô mới, hãy tính số giây trong một năm bằng cách tái sử dụng biến seconds_in_a_day. Chạy ô mới.

### Integers / Số Nguyên

* An integer is a whole number that could hold a zero, positive or negative value.
* Integers can be of any length, it is only limited by the memory available.

* Số nguyên là một số nguyên có thể có giá trị bằng không, dương hoặc âm.
* Số nguyên có thể có độ dài bất kỳ, chỉ bị giới hạn bởi bộ nhớ có sẵn.

In [None]:
a = 12345678901234567890123456789012345678901234567890
print(a)

In [None]:
b = a + 11
print(b)

- The underlying type of a Python integer, irrespective of the base used to specify it, is called `int`.
- We can use the `type()` function to determine the type of any Python data item.

- Kiểu cơ bản của một số nguyên trong Python, bất kể cơ số được sử dụng để xác định nó, được gọi là int.
- Chúng ta có thể sử dụng hàm type() để xác định kiểu của bất kỳ dữ liệu nào trong Python.

In [None]:
type(10)

In [None]:
type(b)

- We can also use the `isinstance()` function to check if a data item belongs to a particular data type.

- Chúng ta cũng có thể sử dụng hàm isinstance() để kiểm tra xem một dữ liệu có thuộc một kiểu dữ liệu cụ thể hay không.

In [None]:
a = 12345678901234567890123456789012345678901234567890
print(a, "is of type", type(a))
print(a, "is integer?", isinstance(a, int))

#### Integer Arithmetic / Số học số nguyên

In Python, __variables are not declared__. The type of a variable is determined when it is assigned a value.

Trong Python, biến không cần khai báo. Kiểu của một biến được xác định khi nó được gán một giá trị.

In [None]:
a = 1
b = 2
c = 3
d = 4
e = 5
f = 6
g = 7
h = 8

In [None]:
print(a + b)

In [None]:
print(c - d)

In [None]:
print(e * f)

In [None]:
print(g / h)

**What do you see in the operation `g / h`?**
- In Python the symbol `/` is used for floating point division.
- For integer division, use instead `//`.

**Bạn thấy gì trong phép toán g / h?**
- Trong Python, ký hiệu / được sử dụng cho phép chia số thực (floating point division).
- Để chia lấy phần nguyên, hãy sử dụng // thay thế.

### Floating Point Numbers / Số Thực

* The float type in Python designates a floating-point number.
* Float values are specified with a decimal point.
* A floating-point number is accurate up to 15 decimal places.
* The character e or E followed by a positive or negative integer may be appended to specify scientific notation.

* Kiểu float trong Python dùng để biểu diễn số thực.
* Giá trị float được xác định bằng dấu thập phân.
* Số thực có độ chính xác lên đến 15 chữ số thập phân.
* Ký tự e hoặc E theo sau bởi một số nguyên dương hoặc âm có thể được thêm vào để biểu diễn theo ký hiệu khoa học.

In [None]:
print(type(7.94))
print(type(.56))
print(type(56.))
print(type(2.6e-5))

In [None]:
a = 0.1234567890123456789
print(a, "is of type", type(a))
print(a, "is float?", isinstance(a, float))

* Floating point numbers are represented internally as binary (base-2) fractions.
* Most decimal fractions cannot be represented exactly as binary fractions, so in most cases the internal representation of a floating-point number is an approximation of the actual value.

* Số thực được biểu diễn nội bộ dưới dạng phân số nhị phân (cơ số 2).
* Hầu hết các phân số thập phân không thể được biểu diễn chính xác dưới dạng phân số nhị phân, vì vậy trong hầu hết các trường hợp, biểu diễn nội bộ của một số thực chỉ là một xấp xỉ của giá trị thực tế.

## Conditionals / Cấu trúc điều kiện

As their name indicates, conditionals are a way to execute code depending on whether a condition is True or False. As in other languages, Python supports `if` and `else` but `else if` is contracted into `elif`, as the example below demonstrates.

Như tên gọi của chúng, câu lệnh điều kiện là một cách để thực thi mã tùy thuộc vào việc một điều kiện là True hay False. Giống như các ngôn ngữ khác, Python hỗ trợ if và else, nhưng else if được viết gọn thành elif, như ví dụ dưới đây minh họa.

In [None]:
my_variable = 5
if my_variable < 0:
    print("negative")
elif my_variable == 0:
    print("null")
else: # my_variable > 0
    print("positive")

Here `<` and `>` are the strict `less` and `greater than` operators, while `==` is the equality operator (not to be confused with `=`, the variable assignment operator). The operators `<=` and `>=` can be used for less (resp. greater) than or equal comparisons.

Ở đây, < và > là các toán tử so sánh nghiêm ngặt "nhỏ hơn" và "lớn hơn", trong khi == là toán tử so sánh bằng (không nên nhầm lẫn với =, toán tử gán giá trị cho biến). Các toán tử <= và >= được sử dụng để so sánh "nhỏ hơn hoặc bằng" và "lớn hơn hoặc bằng".

## Boolean

Booleans are used to store two values i.e True and False

Giá trị Boolean được sử dụng để lưu trữ hai giá trị: True và False.

In [None]:
true=True
print(type(true))
true=123
type(true)

In [None]:
type(False)

Booleans can be used when there is a need to compare two or more values.

```python
   x == y    # x is equal to y
   x != y    # x is not equal to y
   x > y     # x is greater than y
   x < y     # x is less than y
   x >= y    # x is greater than or equal to y
   x <= y    # x is less than or equal to y
```

Giá trị Boolean có thể được sử dụng khi cần so sánh hai hoặc nhiều giá trị.

```python
   x == y    # x bằng y  
   x != y    # x không bằng y  
   x > y     # x lớn hơn y  
   x < y     # x nhỏ hơn y  
   x >= y    # x lớn hơn hoặc bằng y  
   x <= y    # x nhỏ hơn hoặc bằng y  
```

In [None]:
print(3==4)
print(bool(3==4))

## Lists 

Lists are a container type for ordered sequences of elements. Lists can be initialized empty

Danh sách (List) là một kiểu dữ liệu dùng để lưu trữ một dãy các phần tử có thứ tự. Danh sách có thể được khởi tạo rỗng.

In [None]:
my_list = []

or with some initial elements

hoặc với một số phần tử ban đầu.

In [None]:
my_list = [1, 2, 3]

Lists have a dynamic size and elements can be added (appended) to them

List có kích thước động và có thể thêm phần tử mới bằng phương thức append()

In [None]:
my_list.append(4)
my_list

We can access individual elements of a list (indexing starts from 0)

Chúng ta có thể truy cập từng phần tử trong list (chỉ mục bắt đầu từ 0).

In [None]:
my_list[2]

We can access "slices" of a list using `my_list[i:j]` where `i` is the start of the slice (again, indexing starts from 0) and `j` the end of the slice. For instance:

Chúng ta có thể truy cập "các lát cắt" (slices) của danh sách bằng cách sử dụng my_list[i:j], trong đó i là vị trí bắt đầu của lát cắt (chỉ mục bắt đầu từ 0) và j là vị trí kết thúc. Ví dụ:

In [None]:
my_list[1:3]

Omitting the second index means that the slice shoud run until the end of the list

Bỏ qua chỉ mục thứ hai có nghĩa là lát cắt sẽ chạy đến cuối danh sách.

In [None]:
my_list[1:]

We can check if an element is in the list using `in`

Chúng ta có thể kiểm tra xem một phần tử có trong danh sách hay không bằng cách sử dụng toán tử in.

In [None]:
5 in my_list

The length of a list can be obtained using the `len` function

Độ dài của danh sách có thể được lấy bằng hàm len().

In [None]:
len(my_list)

## Strings / Chuỗi

Strings are used to store text. They can delimited using either single quotes or double quotes

Chuỗi (String) được sử dụng để lưu trữ văn bản. Chúng có thể được giới hạn bằng dấu nháy đơn (') hoặc dấu nháy kép (").

In [None]:
string1 = "some text"
string2 = 'some other text'

Strings behave similarly to lists. As such we can access individual elements in exactly the same way

Chuỗi hoạt động tương tự như danh sách. Do đó, chúng ta có thể truy cập từng phần tử theo cùng một cách.

In [None]:
string1[3]

and similarly for slices

và tương tự đối với các lát cắt (slices).

In [None]:
string1[5:]

String concatenation is performed using the `+` operator

Nối chuỗi được thực hiện bằng toán tử +.

In [None]:
string1 + " " + string2

## Loops / Vòng lặp

Loops are a way to execute a block of code multiple times. There are two main types of loops: while loops and for loops.

Vòng lặp là cách để thực thi một khối mã nhiều lần. Có hai loại vòng lặp chính: vòng lặp while và vòng lặp for.

In [None]:
i = 0
while i < len(my_list):
    print(my_list[i])
    i += 1 # equivalent to i = i + 1

In [None]:
for i in range(len(my_list)):
    print(my_list[i])

If the goal is simply to iterate over a list, we can do so directly as follows

Nếu mục tiêu chỉ là duyệt qua một danh sách, chúng ta có thể làm như sau:

In [None]:
for element in my_list: # for-each loop
    print(element)

## Functions / Hàm

To improve code readability, it is common to separate the code into different blocks, responsible for performing precise actions: functions. A function takes some inputs and process them to return some outputs.

Để cải thiện khả năng đọc mã, người ta thường tách mã thành các khối khác nhau, chịu trách nhiệm thực hiện các hành động cụ thể: hàm (functions). Một hàm nhận vào một số đầu vào và xử lý chúng để trả về một số đầu ra.

In [None]:
def square(x):
    return x ** 2

def multiply(a, b):
    return a * b

# Functions can be composed. 
# Hàm có thể được kết hợp.
square(multiply(3, 2))

To improve code readability, it is sometimes useful to explicitly name the arguments

Để cải thiện khả năng đọc mã, đôi khi việc đặt tên rõ ràng cho các đối số là hữu ích.

In [None]:
square(multiply(a=3, b=2))

## Exercises / Bài tập

**Exercise 1.** Using a conditional, write the [relu](https://en.wikipedia.org/wiki/Rectifier_(neural_networks)) function defined as follows

Bài tập 1. Sử dụng câu lệnh điều kiện, hãy viết hàm ReLU được định nghĩa như sau:
​

$\text{relu}(x) = \left\{
   \begin{array}{rl}
     x, & \text{if }  x \ge 0 \\
     0, & \text{otherwise }.
   \end{array}\right.$

In [None]:
def relu(x):
    # Write your function here
    return

relu(-3)

**Exercise 2.** Using a foor loop, write a function that computes the [Euclidean norm](https://en.wikipedia.org/wiki/Norm_(mathematics)#Euclidean_norm) of a vector, represented as a list.

Bài tập 2. Sử dụng vòng lặp for, hãy viết một hàm tính chuẩn Euclid (Euclidean norm) của một vectơ được biểu diễn dưới dạng danh sách.

In [None]:
def euclidean_norm(vector):
    # Write your function here
    return

import numpy as np
my_vector = [0.5, -1.2, 3.3, 4.5]
# The result should be roughly 5.729746940310715
euclidean_norm(my_vector)

**Exercise 3.** Using a for loop and a conditional, write a function that returns the maximum value in a vector.

Bài tập 3. Sử dụng vòng lặp for và câu lệnh điều kiện, hãy viết một hàm trả về giá trị lớn nhất trong một vectơ (danh sách).

In [None]:
def vector_maximum(vector):
    # Write your function here
    return

**Bonus exercise.** if time permits, write a function that sorts a list in ascending order (from smaller to bigger) using the [bubble sort](https://en.wikipedia.org/wiki/Bubble_sort) algorithm.

Bài tập bổ sung. Nếu có thời gian, hãy viết một hàm sắp xếp danh sách theo thứ tự tăng dần (từ nhỏ đến lớn) bằng thuật toán Bubble Sort.

In [None]:
def bubble_sort(my_list):
    # Write your function here
    return

my_list = [1, -3, 3, 2]
# Should return [-3, 1, 2, 3]
bubble_sort(my_list)

### Arrays / Mảng

* Mảng là một cấu trúc dữ liệu lưu trữ các phần tử cùng kiểu dữ liệu tại các vị trí liên tiếp trong bộ nhớ. Trong Python, chúng mình thường sử dụng module 'array' hoặc thư viện NumPy để làm việc với mảng. 
* Một ví dụ thực tế có thể kể đến của Mảng (Arrays) là bãi đỗ xe. Trong bãi đỗ xe sẽ có các ô đỗ xe riêng, thường đều được gán một con số khác biệt nhất định. Những ô này thường chứa các phương tiện khác nhau, ví dụ như có những ô đang chứa ô tô, xe máy, cũng có thể có những ô đang trống. Nhưng không phải tất cả các bãi đỗ xe đều giống nhau. Có thể có bãi chỉ dành cho xe ô tô và xe đạp không được phép đỗ tại đó. Một bãi đỗ xe có giới hạn tương ứng với cấu trúc dữ liệu mảng có kiểu dữ liệu xác định, chỉ cho phép lưu trữ các phần tử có cùng kiểu dữ liệu. 


* Thao tác cơ bản đầu tiên với mảng: Chèn phần tử (Insertion)
* Thêm phần tử vào mảng có thể được thực hiện ở cuối mảng, đầu mảng hoặc tại một vị trí cụ thể.

In [None]:
my_array = [1,2,3,4]
my_array.append(5)      #Thêm vào cuối: [1,2,3,4,5] 
my_array.insert(0,0)    #Thêm vào vị trí 0: [0,1,2,3,4,5] 
my_array.insert(3,2.5)  #Thêm vào vị trí 3: [0,1,2,2.5,3,4,5]

## Going further / Đi xa hơn

Clearly, it is impossible to cover all the language features in this short introduction. To go further, we recommend the following resources:

* List of Python [tutorials](https://wiki.python.org/moin/BeginnersGuide/Programmers)
* 2-hour [course](https://www.youtube.com/watch?v=d9I6owcZ5zQ&ab_channel=VniTeach-Gi%C3%A1ovi%C3%AAn4.0) on Youtube


Khoá học mình không thể bao quát tất cả các tính năng của ngôn ngữ trong phần giới thiệu ngắn này. Để tìm hiểu sâu hơn, chúng tôi khuyến nghị các tài nguyên sau:

* Danh sách các [hướng dẫn Python](https://wiki.python.org/moin/BeginnersGuide/Programmers)
* [khóa học](https://www.youtube.com/watch?v=d9I6owcZ5zQ&ab_channel=VniTeach-Gi%C3%A1ovi%C3%AAn4.0) 2 giờ trên Youtube





