# Chapter 10. Operations with Files
<p style = "text-align: right"><i><b>Tiến Nguyễn</p>

**Trong phần này ta sẽ tìm hiểu về các thao tác `nhập`, `xuất`, `xử lí` dữ liệu trên file và ví dụ cụ thể.**

**Khi làm việc với đối tượng file ( file object), quá trình trải qua các giai đoạn sau**:
- Mở file (`open file`)
- Xử lí dữ liệu( `processing`)
- Đóng file (`close file`)

Trong đó bước xử lý dữ liệu file tùy thuộc vào bài toán cần xử lý sẽ có các thao tác thích hợp.

## 1. Mở file và đóng file

### Cách 1: `open(filename, mode)`

- Ta sử dụng phương thức `open()` được xây dựng sẵn để `mở file` cần xử lí.
- Phương thức `open()` trả về giá trị là một đối tượng file.
- Cú pháp (syntax): `open(filename, mode)`

- Trong đó: 
    + `filename` là **đường dẫn** của file được lưu trong máy.
    + `mode` là **chế độ làm việc** sau khi mở file ( mở để đọc dữ liệu từ file hay là để ghi dữ liệu lên file).
- Có nhiều cho ta lựa chọn:
    + Chế độ mở file và chỉ đọc dữ liệu từ tập tin: `open(filename, 'r')`
    + Chế độ mở file và chỉ ghi dữ liệu lên file, trước đó nó xóa tất cả dữ liệu trên file: `open(filename, 'w')`
    + Chế độ mở file và chỉ ghi tiếp tục dữ liệu lên file, không làm mất dữ liệu trước đó: `open(filename, 'a')`
    + Chế độ mở cho cả đọc và viết: `open(filename, 'r+')`
- *Nếu không chỉ rõ chế độ, chương trình sẽ mặc định mode là `'r'`.*

- Normally, files are opened in text mode, that means, you read and write strings from and to the file, which are encoded in a specific encoding. 
- If encoding is not specified, the default is platform dependent (see open()).
- 'b' appended to the mode opens the file in binary mode: now the data is read and written in the form of bytes objects.
- This mode should be used for all files that don’t contain text.

**Ví dụ đọc một file:**

![image.png](attachment:image.png)

In [1]:
# Mở file
filename = """input.txt"""
f = open(filename, 'r')

In [2]:
# Xem chế độ mở file
print(f.mode)

r


In [3]:
# Xem tên tập tin 
print(f.name)

input.txt


In [4]:
# Kiểm tra xem file đã đóng chưa
f.closed

False

In [5]:
# Đóng file
f.close()
f.closed

True

### Cách 2: an toàn hơn

In [6]:
filename = "input.txt"
with open(filename,'r') as rf:
    pass

rf.closed

True

## 2. Các phương thức trong quá trình nhập xuất

### Đọc dữ liệu từ file `(read from file)`

**`read()`**

In [7]:
filename = "input.txt"
with open(filename,'r', encoding = 'utf8') as rf:
    contents = rf.read()
    print(contents)

Danh sách động vật cần bảo tồn:
1. Chim cánh cụt
2. Sếu đầu đỏ
3. Gấu trắng Bắc Cực
4. Cá Voi
5. Tiến Nguyễn


**`readline()`**

In [8]:
filename = "input.txt"
with open(filename,'r', encoding = 'utf8') as rf:
    contents = rf.readline()
    print(contents,end="")
    contents = rf.readline()
    print(contents,end="")

Danh sách động vật cần bảo tồn:
1. Chim cánh cụt


In [9]:
filename = "input.txt"
with open(filename,'r', encoding = 'utf8') as rf:
    for line in rf:
        print(line,end="")

Danh sách động vật cần bảo tồn:
1. Chim cánh cụt
2. Sếu đầu đỏ
3. Gấu trắng Bắc Cực
4. Cá Voi
5. Tiến Nguyễn

**`read(size)`**

In [10]:
filename = "input.txt"
with open(filename,'r', encoding = 'utf8') as rf:
    content = rf.read(10)
    print(content,end="")

Danh sách 

In [11]:
filename = "input.txt"
with open(filename,'r', encoding = 'utf8') as rf:
    content = rf.readline()
    print(content,end="")
    content = rf.read(10)
    print(content,end="")

Danh sách động vật cần bảo tồn:
1. Chim cá

In [12]:
filename = "input.txt"
with open(filename,'r', encoding = 'utf8') as rf:
    size_of_read = 10
    while len(contents) > 0:
        contents = rf.read(size_of_read)
        print(contents,end="")

Danh sách động vật cần bảo tồn:
1. Chim cánh cụt
2. Sếu đầu đỏ
3. Gấu trắng Bắc Cực
4. Cá Voi
5. Tiến Nguyễn

**`tell()`**: xem vị trí con trỏ trong file đang ở đâu

In [13]:
filename = "input.txt"
with open(filename,'r', encoding = 'utf8') as rf:
    print(rf.tell())
    
    rf.read(10)
    print(rf.tell())
    
    rf.readline()
    print(rf.tell())

0
11
44


### Viết dữ liệu lên file `(write to file)`

- Mở trong chế độ `write to file` cho thao tác ghi lên file, nếu file không có sẵn (không tồn tại) thì tự động tạo một file có tên y chang vậy mà rỗng.

In [14]:
filename = "input2.txt"
with open(filename,'w') as wf:
    pass

**`write()`**

In [15]:
# Viết lên file
filename = "input2.txt"
with open(filename,'w') as wf:
    wf.write("Gods of Egypt")
    wf.write("\nHorus: the main character")

**`seek()`**

In [16]:
# Viết dữ liệu lên file nhưng chọn vị trí viết
filename = "input2.txt"
with open(filename,'w') as wf:
    wf.write("Mua xuan dep vi co em o ben anh")
    wf.seek(4)
    wf.write("dong")

### Sao chép dữ liệu từ file này lên file khác

In [17]:
# Copy nội dung của file sang file khác
filename = "input.txt"
filename_copy="copy.txt"
with open(filename,'r', encoding = 'utf8') as rf:
    with open(filename_copy,'w', encoding = 'utf8') as wf:
        for line in rf:
            wf.write(line)

## 3. Copy 1 ảnh

In [18]:
filename = "dog.png"
filename_copy = "copy_dog.png"
with open(filename,'rb') as rf:
    with open(filename_copy,'wb') as wf:
        contents = rf.read()
        wf.write(contents)

In [19]:
filename = "dog.png"
filename_copy = "copy_dog2.png"
with open(filename,'rb') as rf:
    with open(filename_copy,'wb') as wf:
        for line in rf:
            wf.write(rf.readline())

## 4. Xóa tập tin

Thay vì bạn vào trực tiếp nơi lưu trữ các tập tin bạn cần xóa để xóa folder hay tập tin đó, bạn cũng có thể **lập trình để xóa folder hay tập tin đó**.

### Xóa folder

Cú pháp:
```python
import os
os.rmdir("path of folder")
```

`rmdir()` viết tắt của cụm từ **remove directory**(xóa đường dẫn).

Giả sử chúng ta có một tập tin có đường dẫn là `D:\google-drive\Java\example` như hình bên dưới. 

![remove folder](images\chapter10\remove-folder.png)

Để xóa folder example ta thực thi lệnh sau:

In [None]:
import os
os.rmdir("D:\google-drive\Java\example")

Kiểm tra lại ta thấy folder ta muốn xóa đã được xóa hoàn toàn.

![test remove folder successfully](images\chapter10\remove-folder1.png)

### Xóa tập tin

Tương tự như cách xóa folder, xóa file ta cũng cần đường dẫn cụ thể của file. Ở đây, chúng ta tạo một file có tên là example.py có đường dẫn lưu trong máy là: `F:\Documents\example.py` như hình bên dưới

![Remove File](images\chapter10\remove-file.png)

Thực thi đoạn lệnh sau để xóa tập tin này như sau:

In [None]:
import os
if os.path.exists("F:\Documents\example.py"):
  os.remove("F:\Documents\example.py")
else:
  print("The file does not exist")

Kiểm tra lại ta thấy tác vụ đã thực hiện thành công.

![Test remove file](images\chapter10\test-remove-file.png)

Document tham khảo từ:
- [Python Tutorial: File Objects - Reading and Writing to Files](https://www.youtube.com/watch?v=Uh2ebFW8OYM)
- [Python Delete File](https://www.w3schools.com/python/python_file_remove.asp)