# Buổi 2: Giới thiệu về thuật toán và cấu trúc dữ liệu
- ý nghĩa của thuật toán và cấu trúc dữ liệu.
- Mối quan hệ giữa thuật toán và cấu trúc dữ liệu.
- Các cấu trúc dữ liệu sẵn có trong Python.

Thuật toán: Là một tập hợp hữu hạn các bước cần thực hiện để giải quyết một vấn đề nào đó

Ý nghĩa: Ví dụ với bài toán sắp xếp
+ Bài toán sắp xếp dễ thấy nhất trong chức năng sắp xếp file cua windowns(thời gian, type, ...) hoặc sắp xép video trên kênh youtube(thời gian, lượt xem, thể loại, ...)
+ Giả sử cần sắp xếp 1 tỉ (10^9) số, thuật toán đơn giản nhất: "tìm số lớn nhất" và đặt lên đầu đến khi hoàn tất, sẽ cần khoảng "10^18" phép tính. Một máy tính hiện đại cần khoảng 1s để xử lý "10^9" câu lệnh ===> cần hơn "30 năm" để sắp xếp.
+ Với các thuật toán hiệu quả hơn (Merge sort, Quick Sort) thì chỉ cần thực hiện khoảng 10^10 phép tính => Khoảng 10s để sắp xếp.
+ Máy tính hoạt động cần phần cứng và điện để hoạt động nên thời gian chạy càng lâu thì càng tốn kém, nhất là đối với hệ thống lớn => thuật toán sinh ra để giải quyết các bài toán theo cách hiệu quả nhất.

Độ phức tạp: Là thước đo độ hiệu quả của thuật toán dựa theo kích cỡ tập dữ liệu đầu vào.
- Có thể chia ra thành độ phức tạp về "không gian" (kích cỡ bộ nhớ mà thuật toán cần để xử lý)
- Người ta thường dùng ký pháp O-lớn để nói về độ phức tạp của thuật toán. Ký pháp này thể hiện độ phức tạp trong trường hợp xấu nhất. Ký pháp này không thể hiện thời gian chạy thực tế của thuật toán, mà thể hiện mức độ thay đổi về thời gian chạy (hoặc bộ nhớ) của thuật toán khi kích cỡ dữ liệu đầu vào thay đổi. Tuy nhiên, ta vẫn có thể dùng ký pháp này để ước lượng thời gian chạy thực tế.

- VD: Một thuật toán sắp xếp có độ phức tạp về thời gian là O(N^2) thực thi trong 0.1s khi kích cỡ đầu vào là 10^4 số. Như vậy, khi kích cỡ đầu vào tăng gấp đôi (2*10^4), ta có thể ước tính thời gian thực thi sẽ tăng gấp 2^2 = 4 lần, tức khoảng 0.4s.

## 1.1 Độ phức tạp về thời gian
DPTVTG Thể hiện số phép toán mà thuật toán phải xử lý, từ đó ảnh hưởng đến thời gian thi hành của thuật toán.

Ví dụ: Bài toán tính tổng các số nguyên từ 1 đến n (n>1).

In [1]:
# Method 1: Sử dụng vòng lặp. Time complexity O(n)
def cal_sum_n_v1(n):
    result = 0
    for i in range(n+1):
        result = result + i ## += i
    return result

cal_sum_n_v1(5)

15

In [2]:
# Method 2: Sử dụng toán học. Time complexity O(1)
def cal_sum_n_v2(n):
    result = (n + 1) * n // 2
    return result


cal_sum_n_v2(5)

15

Thời gian thực hiện của 2 thậut toán trên: 

In [6]:
import time
import math
## Hàm tính thời gian chạy code của 1 func
def cal_time(func):
    start_time = time.time()
    result = func()
    real_time = time.time() - start_time ## thời gian chạy hàm
    return real_time, result

In [7]:
BIG_NUMS = {
    'ONE MILLION': 1000000,
    'TEN MILLION': 10000000,
    'ONE HUNDRED MILLION': 100000000,
    }

for name, num in BIG_NUMS.items():
    print("Execution time of {} numbers".format(name))
    time1, res1 = cal_time(lambda: cal_sum_n_v1(num))
    time2, res2 = cal_time(lambda: cal_sum_n_v2(num))
    
    print('-O(n) algorithm: {} secs | result = {}'.format(time1, res1))
    print('-O(n) algorithm: {} secs | result = {}'.format(time1, res2))
    print()

Execution time of ONE MILLION numbers
-O(n) algorithm: 0.2913939952850342 secs | result = 500000500000
-O(n) algorithm: 0.2913939952850342 secs | result = 500000500000

Execution time of TEN MILLION numbers
-O(n) algorithm: 1.8893790245056152 secs | result = 50000005000000
-O(n) algorithm: 1.8893790245056152 secs | result = 50000005000000

Execution time of ONE HUNDRED MILLION numbers
-O(n) algorithm: 20.5762460231781 secs | result = 5000000050000000
-O(n) algorithm: 20.5762460231781 secs | result = 5000000050000000

