# Session 1: Python handle files basics
## OS Library - จัดการ Folder

In [None]:
# uv init
# uv venv
import os

# สร้างโฟลเดอร์
os.makedirs('TestFolder', exist_ok=True)

# สร้างไฟล์
with open('TestFolder/sample.txt','w',encoding='utf-8') as f:
    f.write('Hello Automation!')

### โหมดการเปิดไฟล์หลัก

-   **'r'** (read): โหมดนี้ใช้สำหรับ **อ่าน** ไฟล์เท่านั้น. คุณไม่สามารถเขียนหรือแก้ไขไฟล์ได้. หากไฟล์ไม่มีอยู่จะเกิดข้อผิดพลาด `FileNotFoundError`. นี่คือโหมดเริ่มต้นหากคุณไม่ได้ระบุโหมดใด ๆ.
-   **'w'** (write): โหมดนี้ใช้สำหรับ **เขียน** ไฟล์.
    -   หากไฟล์มีอยู่แล้ว ข้อมูลเดิมทั้งหมดจะถูก **ลบทิ้ง** แล้วเขียนข้อมูลใหม่ลงไป.
    -   หากไฟล์ไม่มีอยู่ ระบบจะ **สร้างไฟล์ใหม่** ให้โดยอัตโนมัติ.
-   **'a'** (append): โหมดนี้ใช้สำหรับ **เขียนข้อมูลเพิ่มเติม** ลงในไฟล์. ข้อมูลใหม่จะถูกเขียนต่อท้ายข้อมูลเดิมที่มีอยู่แล้วในไฟล์. หากไฟล์ไม่มีอยู่ ระบบจะสร้างไฟล์ใหม่ให้.

---

### การจัดการข้อมูลแบบไบนารี (Binary)

นอกเหนือจากโหมดหลักข้างต้น, คุณสามารถเพิ่มตัวอักษร 'b' เพื่อระบุว่าไฟล์นั้นเป็น **ไฟล์ไบนารี** (เช่น รูปภาพ, ไฟล์ PDF, ไฟล์วิดีโอ หรือไฟล์เสียง). การทำงานกับไฟล์ไบนารีจะแตกต่างจากการทำงานกับไฟล์ข้อความ (text file) ตรงที่ข้อมูลจะถูกอ่านและเขียนเป็นไบต์ (bytes) โดยตรง แทนที่จะเป็นสตริง (string).

-   **'rb'** (read binary): อ่านไฟล์ในโหมดไบนารี. เช่น การอ่านไฟล์รูปภาพ.
-   **'wb'** (write binary): เขียนไฟล์ในโหมดไบนารี.
    -   **'wb'** ที่เห็นในโค้ด `open('merged.pdf','wb')` หมายถึงการเปิดไฟล์ชื่อ `merged.pdf` เพื่อ **เขียนในโหมดไบนารี**. เนื่องจากไฟล์ PDF เป็นไฟล์ไบนารี, จึงจำเป็นต้องใช้โหมดนี้เพื่อเขียนข้อมูลไบต์ลงไป.
-   **'ab'** (append binary): เขียนข้อมูลเพิ่มเติมลงในไฟล์ในโหมดไบนารี.

---

### โหมดอื่น ๆ ที่สำคัญ

-   **'x'** (exclusive creation): ใช้สำหรับ **สร้างไฟล์ใหม่เท่านั้น**. หากไฟล์นั้นมีอยู่แล้ว จะเกิดข้อผิดพลาด `FileExistsError`.
-   **'t'** (text): โหมดเริ่มต้นสำหรับการจัดการไฟล์ข้อความ (text file). คุณสามารถระบุ `rt` หรือ `wt` ก็ได้ แต่โดยทั่วไปมักจะไม่ระบุเพราะเป็นค่าเริ่มต้นอยู่แล้ว.
-   **'+'** (update): เพิ่มโหมดนี้เพื่ออนุญาตให้ **อ่านและเขียน** ได้ในเวลาเดียวกัน.
    -   **'r+'**: อ่านและเขียน. โดยเริ่มจากการอ่าน และคุณสามารถเขียนทับข้อมูลเดิมในตำแหน่งปัจจุบันได้.
    -   **'w+'**: เขียนและอ่าน. จะลบข้อมูลเก่าทิ้งทั้งหมดก่อน แล้วจึงสามารถเขียนและอ่านไฟล์ได้.
    -   **'a+'**: เขียนเพิ่มเติมและอ่าน. จะเขียนต่อท้ายไฟล์และยังสามารถอ่านไฟล์ได้.

In [58]:
# ลบไฟล์
os.remove('TestFolder/sample.txt')
# ลบโฟลเดอร์
os.rmdir('TestFolder')

## Openpyxl - จัดการไฟล์ Excel

In [None]:
# uv add openpyxl
from openpyxl import Workbook, load_workbook

# สร้าง Excel
wb = Workbook()
ws = wb.active
ws['A1'] = 'Name'
ws['B1'] = 'Age'
ws.append(['Ake',7])
ws.append(['John',37])
wb.save('sample.xlsx')

In [None]:
# อ่าน Excel
wb2 = load_workbook('sample.xlsx')
ws2 = wb2.active
for row in ws2.iter_rows(values_only=True):
    print(row)

In [None]:
# ลบไฟล์
import os

os.remove('sample.xlsx')

## Python-docx - จัดการไฟล์ Word

In [None]:
# uv add python-docx  
from docx import Document

# สร้าง Word template
doc = Document()
doc.add_paragraph('Name: {name}')
doc.add_paragraph('Age: {age}')
doc.save('template.docx')

In [None]:
# อ่านและแทนค่า
doc2 = Document('template.docx')
for p in doc2.paragraphs:
    if '{name}' in p.text:
        p.text = p.text.replace('{name}','Ake')
    if '{age}' in p.text:
        p.text = p.text.replace('{age}','7')
doc2.save('filled.docx')

In [None]:
# ลบไฟล์
import os

try:
    os.remove('template.docx')
    os.remove('filled.docx')
except:
    print('files aready remove')

## PyPDF2 - จัดการไฟล์ PDF

In [None]:
# uv add docx2pdf
from docx2pdf import convert

# สร้าง/convert ไฟล์ pdf
convert('filled.docx', 'filled2.pdf')

In [None]:
# uv add pypdf2
from PyPDF2 import PdfReader, PdfWriter

# อ่าน PDF
reader = PdfReader('filled.pdf')
for page in reader.pages:
    print(page.extract_text())

In [None]:
# รวม PDF
writer = PdfWriter()
for filename in ['filled.pdf','filled2.pdf']:
    r = PdfReader(filename)
    for page in r.pages:
        writer.add_page(page)
with open('merged.pdf','wb') as f:
    writer.write(f)

In [None]:
# ลบไฟล์
import os

try:
    os.remove('filled.pdf')
    os.remove('filled2.pdf')
    os.remove('merged.pdf')
except:
    print('files aready removed')

## Json - จัดการข้อมูลชนิด JSON

#### Convert Python dictionary to a JSON formatted string

In [None]:
import json

# A Python dictionary
student_data = {
    "name": "Ake",
    "age": 25,
    "is_enrolled": True,
    "courses": ["Math", "History", "Physics"],
    "grades": {
        "Math": 95,
        "History": 88
    },
    "gpa": 3.75
}


# 'dumps' stands for "dump string"
json_string = json.dumps(student_data)

print("Original Python Dictionary:")
print(student_data)
print(f"Type: {type(student_data)}\n")

print("JSON String:")
print(json_string)
print(f"Type: {type(json_string)}")

In [None]:
print(student_data['name'])
print(json_string['name'])

In [None]:
try:
    print(student_data['name'])
    print(json_string['name'])
except TypeError as e:
    print(f"An error occurred: {e}")


In [None]:
for key, value in student_data.items():
    print(f"{key}: {value}")

#### Convert JSON string to a Python dictionary

In [None]:
# Let's use the JSON string we created earlier
json_string = '{"name": "Ake", "age": 25, "is_enrolled": true, "courses": ["Math", "History", "Physics"], "grades": {"Math": 95, "History": 88}, "gpa": 3.75}'

# 'loads' stands for "load string"
python_dict = json.loads(json_string)

print("Original JSON String:")
print(json_string)
print(f"Type: {type(json_string)}\n")

print("Converted Python Dictionary:")
print(python_dict)
print(f"Type: {type(python_dict)}\n")

# You can now access the data like a normal dictionary
print(f"Student Name: {python_dict['name']}")
print(f"First Course: {python_dict['courses'][0]}")