# Xử lý File trong Python

## 1. File trong python

Trong Python, "file" là một đối tượng bạn có thể sử dụng để thực hiện các hoạt động đọc và ghi dữ liệu vào tệp trên hệ thống tệp của máy tính. Đối tượng file cho phép bạn tương tác với tệp, bao gồm mở, đọc, ghi, đóng và thực hiện các hoạt động khác liên quan đến dữ liệu trong tệp. Điều này cho phép bạn làm việc với dữ liệu từ các nguồn bên ngoài.

Có hai loại file chính trong Python:

- Tệp Văn Bản (text file): Được sử dụng để lưu trữ và xử lý dữ liệu dưới dạng văn bản, có thể đọc và chỉnh sửa bằng các trình soạn thảo văn bản thông thường.

- Tệp Nhị Phân (binary file): Lưu trữ dữ liệu dưới dạng nhị phân, không thể đọc hoặc chỉnh sửa bằng các trình soạn thảo văn bản thông thường, thường được sử dụng để lưu trữ các loại dữ liệu không phải là văn bản như hình ảnh, âm thanh, hoặc dữ liệu nhị phân khác.

Các file binary chỉ có thể được xử lí bởi một ứng dụng hoặc thư viện biết và có thể hiểu được cấu trúc của file này. Ví dụ như các định dạng JPEG, PNG, GIF, và BMP là các tệp chứa dữ liệu hình ảnh được mã hóa theo các chuẩn đặc biệt, và chỉ các chương trình và các thư viện hỗ trợ như Pillow (PIL) hoặc OpenCV biết đọc và hiểu cấu trúc của chúng mới có thể xử lý được.

Vì vậy, trong tài liệu này chúng ta sẽ giới thiệu mức độ cơ bản là xử lý text file.

## 2. Làm việc với file:
File được chuẩn bị sẵn ở đây là 1 tệp văn bản tên filetest.txt với nội dung:

 ```
Hi everyone,

Welcome to MetaMind team!

This document is about how to handle your files in Python.

Glad to see you all!
 ```

Tệp txt cần được lưu trong cùng thư mục với file jpynb, mọi người có thể lưu bản sao file txt và jpynb về drive của riêng bạn và chạy trực tiếp trên colab. Hãy thử làm theo các bước sau:

Bước 1: Lưu bản sao tệp jpynb này và tệp filetest.txt về drive của riêng bạn.<br>
Bước 2: Đặt tệp jpynb và tệp filetest.txt chung 1 thư mục.<br>
Bước 3: Vào file jpynb, kết nối colab với drive, sử dụng thư viện os để xác định đường dẫn tương đối. Ví dụ tệp jpynb và tệp filetest.txt được lưu trong thư mục:

    My Drive
    └── Colab Notebooks
        ├── Xử_lý_File_trong_Python.jpynb
        └── filetest.txt

Đường dẫn tới thư mục sẽ được đặt như sau:
 ```
folder_path = '/content/drive/My Drive/Colab Notebooks/'
 ```

In [None]:
 #kết nối colab với drive
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
import os

# Đường dẫn tới thư mục trong Google Drive (Thay đổi theo đường dẫn của bạn)
folder_path = '/content/drive/My Drive/Colab Notebooks/'

# Thay đổi thư mục làm việc hiện tại của Python đến thư mục trong Google Drive của bạn
os.chdir(folder_path)

### 2.1. Mở File trong Python

Trước khi thực hiện bất kỳ hoạt động nào trên tệp, bạn phải mở nó bằng cách sử dụng hàm open() tích hợp của Python. Bạn cần chỉ định mode (chế độ), đại diện cho mục đích của việc mở tệp.

 ```
f = open(filename, mode)
 ```

 Các chế độ:
- '**r**': Mở một tệp hiện có để đọc.
- '**w**': Mở một tệp hiện có để viết. Tạo tệp nếu nó không tồn tại.
- '**a**': Mở một tệp hiện có để nối thêm. Không ghi đè dữ liệu hiện có.
- '**r+**': Đọc và viết dữ liệu vào tệp. Ghi đè dữ liệu trước đó.
- '**w+**': Ghi và đọc dữ liệu. Ghi đè dữ liệu hiện có.
- '**a+**': Nối thêm và đọc dữ liệu từ tệp. Không ghi đè dữ liệu hiện có.

### 2.2 Đọc File trong Python

Có nhiều cách để đọc từ một tệp trong Python:

1. Sử dụng vòng lặp for để in mỗi dòng:

In [None]:
# Mở tệp có tên "filetest.txt" ở chế độ đọc
with open('filetest.txt', 'r') as file:
    # In ra từng dòng một trong tệp
    for line in file:
        print(line)



Hi everyone,



Welcome to MetaMind team!



This document is about how to handle your files in Python.



Glad to see you all!


2. Sử dụng read() để trích xuất tất cả các ký tự trong tệp:

In [None]:
# Mở tệp "filetest.txt" ở chế độ đọc
file = open("filetest.txt", "r")
# In ra nội dung của tệp
print (file.read())


Hi everyone,

Welcome to MetaMind team!

This document is about how to handle your files in Python.

Glad to see you all!


3.  Đọc một tệp bằng câu lệnh with trong Python

In [None]:
# Mở tệp "filetest.txt" ở chế độ đọc
with open("filetest.txt") as file:
    # Đọc nội dung của tệp
    data = file.read()

print(data)

Hi everyone,

Welcome to MetaMind team!

This document is about how to handle your files in Python.

Glad to see you all!


4. Một cách khác để đọc một tệp là gọi một số ký tự nhất định như trong đoạn mã dưới đây, trình thông dịch sẽ đọc 10 ký tự đầu tiên của dữ liệu đã lưu và trả về nó dưới dạng chuỗi.

In [None]:
# Mở tệp "filetest.txt" ở chế độ đọc
with open("filetest.txt", "r") as file:
    # Đọc và in ra 10 ký tự đầu tiên (bao gồm cả khoảng trắng)
    print(file.read(10))


Hi everyon


5. Chúng ta cũng có thể phân chia các dòng khi đọc tệp trong Python. Hàm split() sẽ phân chia biến khi gặp dấu cách. Bạn cũng có thể phân chia bằng bất kỳ ký tự nào mà bạn mong muốn.

In [None]:
# Mở tệp "filetest.txt" ở chế độ đọc
with open("filetest.txt", "r") as file:
    # Đọc từng dòng và phân chia thành từng từ
    data = file.readlines()
    for line in data:
        word = line.split()
        print(word)


['Hi', 'everyone,']
[]
['Welcome', 'to', 'MetaMind', 'team!']
[]
['This', 'document', 'is', 'about', 'how', 'to', 'handle', 'your', 'files', 'in', 'Python.']
[]
['Glad', 'to', 'see', 'you', 'all!']


### 2.3. Ghi File trong Python
**Tạo File bằng Hàm write()**: Tương tự như việc đọc một file trong Python, có nhiều cách để ghi vào file trong Python. Chúng ta có thể ghi nội dung của một file bằng cách sử dụng hàm write() trong Python.

**Làm việc trong chế độ ghi (w)**

- Sử dụng chế độ ghi (w) và hàm write() để viết vào một file. Lệnh close() chấm dứt tất cả các tài nguyên được sử dụng và giải phóng hệ thống khỏi chương trình.

In [None]:
# Tạo một file
file = open('filetest2.txt','w')
file.write("Đây là lệnh ghi\n")
file.write("Nó cho phép chúng ta ghi vào một file cụ thể")
file.close()


In [None]:
#Kiểm tra file vừa tạo
# Mở file để đọc
with open('filetest2.txt', 'r') as file:
    # Đọc và in ra nội dung của file
    print(file.read())


Đây là lệnh ghi
Nó cho phép chúng ta ghi vào một file cụ thể


- Sử dụng lệnh viết cùng với hàm with().

In [None]:
with open("filetest2.txt", "w") as f:
    f.write("Xin chào !!")


In [None]:
# Mở file để đọc
with open('filetest2.txt', 'r') as file:
    # Đọc và in ra nội dung của file
    print(file.read())

Xin chào !!


### 2.4. Nối File bằng chế độ Append

Có một vấn đề khi sử dụng chế độ w, đó là khi ghi đè thì nội dung file ban đầu sẽ bị mất đi, như bạn thấy tệp filetest2.txt chúng ta tạo ban đầu với nội dung
 ```
Đây là lệnh ghi
Nó cho phép chúng ta ghi vào một file cụ thể
 ```
đã bị thay thế bằng
 ```
 Xin chào !!
```
**Đó là lý do tại sao chúng ta cần chế độ Append (a) để nối thêm chứ không ghi đè lên dữ liệu hiện có!!**

Mở file filetest2.txt để kiểm tra tình trạng file hiện tại

In [None]:
# Mở file để đọc
with open('filetest2.txt', 'r') as file:
    # Đọc và in ra nội dung của file
    print(file.read())

Xin chào !!


Dùng chế độ append để nối thêm nội dung vào tệp

In [None]:
# chế độ nối thêm
file = open('filetest2.txt', 'a')
file.write("\nChế độ 'a' sẽ thêm nội dung này mà không làm mất dữ liệu ban đầu")
file.close()


Mở lại file filetest2.txt để kiểm tra:

In [None]:
# Mở file để đọc
with open('filetest2.txt', 'r') as file:
    # Đọc và in ra nội dung của file
    print(file.read())

Xin chào !!
Chế độ 'a' sẽ thêm nội dung này mà không làm mất dữ liệu ban đầu


### 2.5 Đóng File trong Python
Khi bạn đã hoàn thành các thao tác với file trong Python, việc quan trọng tiếp theo là đóng file. Việc đóng file giúp giải phóng tài nguyên hệ thống và đảm bảo rằng mọi thay đổi đã được lưu và không có ghi nhầm xảy ra.

In [None]:
# Mở file
file = open('filetest2.txt', 'r')

# Đọc nội dung của file
content = file.read()

# In nội dung của file
print(content)

# Đóng file sau khi hoàn thành các thao tác
file.close()


Xin chào !!
Chế độ 'a' sẽ thêm nội dung này mà không làm mất dữ liệu ban đầu
