## FILE & DIRECTORY HANDLING

### I. File handling

**1. File open**

> cú pháp mở file
>```python
> file = open("filename", "mode")
>```
> * `filename` - là đường dẫn của file cần thao tác.
> * `mode` - là chế độ mở file. Tùy vào mục đích khác nhau khi mở file mà `mode` có các giá trị khác nhau. Dưới đây là một số giá trị thường dùng của tham số `mode`.
>   * `r` - Mở file chỉ để đọc. Khi mở file, con trỏ sẽ ở vị trí đầu tiên của file. Đây là chế độ mặc định.
>   * `rb` - Mở file để đọc file nhị phân. Con trỏ sẽ ở vị trí đầu tiên của file. Đây là chế độ mặc định.
>   * `r+` - Mở file để đọc và ghi. Con trỏ ở vị trí đầu tiên của file.
>   * `rb+` - Mở file để đọc và ghi file nhị phân. Con trỏ ở vị trí đầu tiên của file.
>   * `w` - Mở file chỉ để ghi. Ở chế độ này, các nội dung có sẵn trong file sẽ bị thay thế bởi nội dung mới ghi vào. Nếu file không tồn tại, một file mới sẽ được tạo ra.
>   * `b` - Mở file nhị phân.
>   * `t` - Mở file text. Đây là chế độ mặc định.
>   * `w+` - Mở file để đọc và ghi. Các nội dung trong file sẽ bị ghi đè. Nếu file không tồn tại thì file mới sẽ được tạo ra để ghi và đọc.
>   * `a` - Mở file để thêm nội dung. Con trỏ sẽ ở cuối file, do đó nội dung ghi vào sẽ được thêm vào cuối file, nội dung có sẵn không bị ghi đè. Nếu file không tồn tại, một file mới sẽ được tạo ra.
>   ....

**Một số ví dụ mở file với các giá trị khác nhau của tham số `mode`**

In [17]:
file = open('student.txt', 'r')

In [None]:
file = open('student.txt', 'w')

In [None]:
file = open('student.txt', 'a')

In [None]:
file = open('data.txt', 'rb')

In [18]:
file = open("student.txt", "w+")
print ("Name of the file: ", file.name)
print ("File is closed?: ", file.closed)
print ("Opening mode: ", file.mode)
print ("Encoding: ", file.encoding)
file.close()

Name of the file:  student.txt
File is closed?:  False
Opening mode:  w+
Encoding:  UTF-8


In [19]:
file

<_io.TextIOWrapper name='student.txt' mode='w+' encoding='UTF-8'>

**2. File reading**

> Để đọc nội dung trong file, file được mở với chế độ để đọc. Một số hàm được cung cấp sẵn để lấy nội dung từ file:
> * `read(size)` - Lấy toàn bộ nội dung trong file. Tham số `size` là số bytes cần đọc, trong trường hợp không cung cấp giá trị, hoặc mang giá trị âm thì hàm đọc hết toàn bộ nội dung của file.
> * `readline(size)` - Mỗi lần gọi hàm sẽ lấy nội dung của một dòng. Tham số `size` là số bytes lớn nhất đọc được của dòng đó, trong trường hợp không cung cấp giá trị, hoặc mang giá trị âm thì hàm đọc hết toàn bộ nội dung của dòng đó.
> * `readlines(size)` - Kết quả trả về là một list chứa toàn bộ các dòng. Tham số `size` là số bytes cần đọc, trong trường hợp không cung cấp giá trị thì đọc toàn bộ file.

**Ví dụ**

In [22]:
file = open("student.txt", "r")
rows = file.read()
print(rows)
file.close()

Hello world
Apple
Donkey
goldfish


In [23]:
type(rows)

str

In [24]:
file = open("student.txt", "r")
row = file.readline()
print(row)
file.close()

Hello world



In [25]:
file = open("student.txt", "r")
while True:
    row = file.readline()
    if not row:
        break
    print(row)
file.close()

Hello world

Apple

Donkey

goldfish


In [26]:
file = open("student.txt", "r")
rows = file.readlines()
print(rows)
file.close()

['Hello world\n', 'Apple\n', 'Donkey\n', 'goldfish']


**3. File writing**

> Để ghi nội dung vào file, file phải được mở ở chế độ ghi file `w`, `a`. Một số hàm được cung cấp để ghi nội dung vào file.
> * `write()` - ghi nội dung vào file.
> * `writelines()` - ghi list dữ liệu vào file.

In [29]:
file = open("data.txt", "w")
file.write("Start learning\n")
file.write("python programming course")
print ("Ghi thành công...")
file.close()

Ghi thành công...


In [31]:
file = open("data.txt", "a")
file.write("\nSwift programming course")
print ("Ghi thành công...")
file.close()

Ghi thành công...


In [32]:
data = ['apple\n', 'donkey\n', 'goldfish']
file = open("data.txt", "w")
file.writelines(data)
print ("Ghi thành công...")
file.close()

Ghi thành công...


***Note***
> Khi muốn làm việc với các file có đuôi mở rộng khác .txt như mp3, exe, jpg...thì phải mở file với mode là 'b'.

In [33]:
file = open('datab.bin', 'wb')
file.write(b'python programming...')
file.close()

In [None]:
file = open('datab2.bin', 'wb')
data = "Hello World".encode('utf-8')  
file.write(data)
file.close()

***Note***

Mở file với `mode = 'w+'` và sử dụng hàm `seek()` để đưa con trỏ về vị trí bất kỳ trong file, sau đó để ghi hoặc đọc file từ vị trí đó.

Cú pháp: 
```python 
file_Object.seek(offset) 
```

**4. File close**
> Khi làm việc với file bằng hàm `open()`, Python cung cấp hàm `close()` để đóng file khi kết thúc thao tác truy cập đọc hoặc ghi nội dung. Thao tác này là cần thiết để giải phóng bộ nhớ và tránh mất dữ liệu.

In [34]:
file = open("data1.txt", "w")
file.write("Hello, World!")
print ("Ghi thành công...")

Ghi thành công...


In [35]:
file.close()

**5. Automatic file closing using `with` statement**

> Sử dụng cú pháp này khi làm việc với file, file sẽ được tự động đóng khi kết thúc thao tác, thậm chí khi xuất hiện lỗi khi ghi hoặc đọc file.

In [37]:
with open("data1.txt", "w") as file:
    file.write("Hello, World11111111")
    print ("Ghi thành công...")

Ghi thành công...


**6. File rename**

> Để đổi tên file, hàm `rename()` trong module `os` được sử dụng.
> Cú pháp:
> ```python
> os.rename(current_file_name, new_file_name)
>```
> * `current_file_name` - tên file muốn đổi tên.
> * `new_file_name` - tên mới.

In [38]:
import os

os.rename('data.txt', 'data_finall.txt')
print('Đổi tên thành công...')

Đổi tên thành công...


**7. File deletion**

> Sử dụng hàm `remove()` trong module `os` để xoá file.
> Cú pháp:
>```python
> os.remove(file_to_delete)
>```
> * `file_to_delete` - tên file cần xoá.

In [40]:
import os

os.remove('data1.txt')
print('Xoá file thành công...')

Xoá file thành công...


### II. Directory handling

> Để làm việc với các folder, python cung cấp một số module như `os` và `os.path`.

**1. Checking if a directory exists**

> `os.path.exists()` là hàm dùng để kiểm tra sự tồn tại của một folder.

In [42]:
folder = r'/Users/caocao12'
if os.path.exists(folder):
    print(f'The directory "{folder}" exists.')
else:
    print(f'The directory "{folder}" does not exists.')

The directory "/Users/caocao12" does not exists.


**2. Directory creation**

> Sử dụng hàm `os.mkdir()` để tạo một folder mới nếu folder đó chưa tồn tại.

In [44]:
os.mkdir('python2')
print('Tạo folder mới thành công!')

Tạo folder mới thành công!


**3. Current working directory**

> Dùng hàm `os.getcwd()` để lấy thông tin của folder hiện tại.

In [45]:
os.getcwd()

'/Users/caocao'

In [46]:
pwd

'/Users/caocao'

**4. File and directory listing**

> Để liệt kê các file, các thư mục con trong một thư mục, sử dụng hàm `listdir()`.   
>
> Để phân biệt các thành phần con của thư mục là thư mục con hay là file, sử dụng `os.path.isdir()` và `os.path.isfile()` tương ứng.  

In [48]:
folder = r'/Users/caocao'
try:
    contents = os.listdir(folder)
    for item in contents[:10]:
        print(item)
except OSError as e:
    print(f'Error: {e}')

PY TKINTER Bai 12 (1).ipynb
Music
Vu Duc Tung.ipynb
.condarc
PY TKINTER.ipynb
sort_algorithms_practice.ipynb
mymodule.ipynb
minhtuan.ipynb
.DS_Store
write21.txt


**5. Changing the current working directory**

> Sử dụng hàm `chdir()` để thay đổi thư mục làm việc hiện tại.

In [None]:
new_folder = r'/Users/python'
try:
    os.chdir(new_folder)
    print('đổi thành công')
except OSError as e:
    print('Error: ', e)

**6. Directory remove**

> Dùng hàm `os.rmdir()` để xoá các thư mục trống. Nếu thư mục có chứa file hoặc các thư mục con, dùng hàm `shutil.rmtree()` để xoá thư mục đó.

In [51]:
folder = r'/Users/caocao/python2'
try:
    os.rmdir(folder)
    print('Xoá thư mục thành công')
except OSError as e:
    print(e)

Xoá thư mục thành công


### III. Exercise

**1. Kiểm tra mã vạch**

* Trên hàng hoá thường có một dãy chữ số gồm 13 chữ số, dãy số này được gọi là mã vạch. Dãy số này được tạo bởi quy tắc sau: Một vã vạch hàng hóa là một chuỗi có đúng 13 chữ số, chữ số cuối cùng gọi là chữ số kiểm tra `C`. Gọi `A` là tổng các chữ số ở vị trí lẻ (trừ chữ số kiểm tra `C`). Gọi `B` là tổng các chữ số ở vị trí chẵn. Gọi `D = A + 3B`. Nếu phần dư của `D` chia cho 10 khác không thì `F=10-phần dư`, ngược lại `F = 0`. Một mã vạch được coi là mã vạch đúng nếu `F=C`. Định nghĩa một hàm kiểm tra một dãy số 13 chữ số có phải là mã vạch hay không. Ví dụ: `4902778120972` là 1 mã vạch đúng, `4902778120973` là không phải mã vạch.  
* Một file `barcode.txt` chứa một danh sách các dãy số, mỗi dãy số nằm trên một dòng. Định nghĩa một hàm để đọc đọc file vừa cho, kiểm tra mỗi dãy số trong file có phải là mã vạch hay không, kết quả được lưu vào một từ điển có cấu trúc `{'dãy số': 'yes/no'}` (`yes` - nếu dãy đó là mã vạch, `no` - nếu dãy đó không phải là mã vạch). Lưu kết quả kiểm tra vào file `barcode_validation.txt`, mỗi hàng là một dãy số và kết quả kiểm tra. Ví dụ `4902778120972 - yes` hoặc `4902778120973 - no`.

In [None]:
# code

**2. Danh sách khách hàng**

Tại một cửa hàng bán đồ thể thao nhỏ, các thông tin khách hàng đến mua hàng được lưu lại để tiện cho việc kinh doanh. Thông tin khách hàng gồm có tên, số điện thoại, email và địa chỉ. Viết một phần mềm nhỏ để giúp cửa hàng trên quản lý thông tin khách hàng. Phần mềm phải có một số chức năng như sau:
* 1. Hiển thị thông tin khách hàng, thông tin này được đọc từ file `customers.txt`.
* 2. Tìm kiếm khách hàng.
* 3. Thêm thông tin khách hàng mới.
* 4. Cập nhật thông tin khách hàng.
* 5. Xoá thông tin khách hàng.
* 6. Lưu những thay đổi vào file `customers.txt`.

In [None]:
# code