# File Handling

Làm việc với File và Thư mục trong Python

## Xử lý file text

Đọc toàn bộ nội dung file

In [None]:
file = open('demo.txt')
content = file.read()
print(content)
file.close()

Tự động close file sau khi thao tác xong

In [None]:
with open('demo.txt') as file:
    content = file.read()
    print(content)

File exception

- FileNotFoundError: không tìm thấy file
- FileExistError: tạo file hoặc folder đã tồn tại

In [None]:
try:
    with open('demooo.txt') as file:
        content = file.read()
        print(content)
except FileNotFoundError as e:
    print('No such file or directory')

Đọc một số byte nhất định

In [None]:
with open('demo.txt') as file:
    first_5_bytes = file.read(5)
    print(first_5_bytes)
    print()

    rest_data = file.read()
    print(rest_data)
    print()

    # di chuyển về đầu file
    file.seek(0)
    content = file.read()
    print(content)

Đọc từng dòng trong file

In [None]:
with open('demo.txt') as file:
    line = 1
    for content in file.readlines():
        print(f'Line {line}: {content}', end='')
        line += 1

Đọc một số dòng nhất định

In [None]:
print('Sử dụng readlines()')
with open('demo.txt') as file:
    line = 1
    for content in file.readlines()[0:2]:
        print(f'Line {line}: {content.strip()}')
        line += 1

print() 

print('Sử dụng vòng lặp')
with open('demo.txt') as file:
    line = 1
    for i in range(2):
        content = file.readline()
        print(f'Line {line}: {content.strip()}')
        line += 1

Ghi nội dung vào file (xóa file cũ)

In [None]:
content = 'Tui muốn ghi nội dung này vào file\n'

with open('demo.txt', 'w') as file:
    file.write(content)

Thêm nội dung vào file

In [None]:
content = 'Tui muốn thêm nội dung này vào cuối file\n'

with open('demo.txt', 'a') as file:
    file.write(content)

Chèn nội dung vào file

In [None]:
content = 'Tui muốn chèn nội dung này vào dòng thứ 2\n'

with open('demo.txt', 'r+') as file:
    lines = file.readlines()
    lines.insert(1, content)
    file.seek(0)
    file.writelines(lines)

Xóa file

In [None]:
import os

file = 'demo.txt'

if os.path.exists(file):
    os.remove(file)
else:
    print('File Not Found')

## Bài tập

Viết chương trình đơn giản cho phép người dùng nhập văn bản bất kỳ, và tùy chọn ghi đè hoặc thêm vào file, sau đó hiển thị nội dung trong file text.

## Xử lý file Docx

Sử dụng module `python-docx`, cài đặt:

`pip3 install python-docx`

Đọc file

In [None]:
from docx import Document

doc = Document('demo.docx')
for p in doc.paragraphs:
    print(p.text)

table = doc.tables[0]

for row in table.rows:
    c1, c2, c3 = row.cells
    print(f"| {c1.text:20} | {c2.text:20} | {c3.text:20} |")

Tạo file

In [None]:
from docx import Document
from docx.shared import Cm

doc = Document()
doc.add_picture('avatar.jpg', width=Cm(4))
doc.add_paragraph("Ba Nguyễn")
doc.add_paragraph("Mô tả bản thân...")
doc.add_paragraph("Thông tin liên hệ...")


doc.add_heading('Thông tin bản thân...', level=2)
para = doc.add_paragraph("Tui là ")
para.add_run("Ba").bold = True
para.add_run(". Tui đến từ ")
para.add_run("Nam Định").italic = True

experiences = (
    ('Developer', 'Developer....'),
    ('Teacher', 'Teacher....'),
)

doc.add_heading("Kinh nghiệm làm việc...", level=2)
table = doc.add_table(rows=1, cols=2)
position, detail = table.rows[0].cells

position.text = 'Vị trí'
detail.text = 'Chi tiết'

for p, d in experiences:
    position, detail = table.add_row().cells
    position.text = p
    detail.text = d

doc.save('cv.docx')

## Bài tập

Viết chương trình đơn giản:
- Có một mẫu (template) văn bản bất kỳ, yêu cầu một số thông tin
- Hỏi người dùng một số thông tin, sau đó tạo file docx với template và thông tin đã nhập

## Xử lý file Excel

Sử dụng module `pandas`, `openpyxl`, `xlrd`. Cài đặt:

`pip install pandas xlrd openpyxl`

Đọc file

In [None]:
import pandas as pd
from pandas import ExcelFile

xlsx = ExcelFile('demo.xlsx')
print(xlsx.sheet_names)

for sheet in xlsx.sheet_names:
    print("Sheet:", sheet)
    df = pd.read_excel(xlsx, sheet_name=sheet)
    print(df)

Chỉ lấy ra một số cột nhất định

In [None]:
import pandas as pd
from pandas import ExcelFile

xlsx = ExcelFile('demo.xlsx')

products = pd.read_excel(xlsx, sheet_name='products')
columns = ['Name', 'Price']

data = products[columns]
print(data)

Lọc dữ liệu theo điều kiện

In [None]:
import pandas as pd
from pandas import ExcelFile

xlsx = ExcelFile('demo.xlsx')

products = pd.read_excel(xlsx, sheet_name='products')
customers = pd.read_excel(xlsx, sheet_name='customers')

print('Sản phẩm có giá trên 1000$')
data = products[products.Price.ge(1000)]
print(data)

print()

print("Sản phẩm iPhone")
data = products[products.Name.eq('iPhone')]
print(data)

print()

print("Khách hàng có địa chỉ ở Hà Nội")
data = customers[customers.Address.eq("Hà Nội")]
print(data)

Ghi dữ liệu ra file Excel (ghi đè file cũ)

In [None]:
import pandas as pd

file = 'demox.xlsx'
writer = pd.ExcelWriter(file, engine='openpyxl')

df = pd.DataFrame([
        [1, 1, '2021/01/01'],
        [2, 1, '2021/01/02'],
        [3, 2, '2021/01/03']
    ], 
    columns=['Order ID', 'Customer ID', 'Order Date'])

df.to_excel(writer,  sheet_name='orders', index=False)
writer.save()
writer.close()

Thêm một sheet mới vào file Excel hiện có

In [None]:
import pandas as pd
from openpyxl import load_workbook

file = 'demox.xlsx'

writer = pd.ExcelWriter(file, engine='openpyxl', mode='a', if_sheet_exists='new')

df = pd.DataFrame([
    [1, 1, '2021/01/01'],
    [2, 1, '2021/01/02'],
    [3, 2, '2021/01/03']
],
    columns=['Order ID', 'Customer ID', 'Order Date'])

df.to_excel(writer, sheet_name='orderss', index=False)
writer.save()
writer.close()

Load dữ liệu từ CSDL export ra database sử dụng `sqlalchemy` và `pymysql`. Cài đặt:

`pip3 install sqlalchemy pymysql`

In [None]:
import pandas as pd 
from sqlalchemy import create_engine

engine = create_engine(
    'mysql+pymysql://UyMDXcxEoz:lFJmWnNbEC@remotemysql.com/UyMDXcxEoz')

con = engine.connect()

df = pd.read_sql('SELECT * FROM products', con)
# print(df)
df.to_excel('products.xlsx', sheet_name='products', index=False)

Load dữ liệu từ Excel vào database

In [None]:
import pandas as pd
from sqlalchemy import create_engine

engine = create_engine(
    'mysql+pymysql://UyMDXcxEoz:lFJmWnNbEC@remotemysql.com/UyMDXcxEoz')

con = engine.connect()

df = pd.read_excel('demo.xlsx', sheet_name='movies')
df.to_sql('movies', con, if_exists='append', index=False)