# 06 â€“ File Handling & Data I/O Dasar

## Tujuan Pembelajaran
Setelah mempelajari materi ini, Anda akan mampu:
1. Memahami konsep File Handling di Python
2. Membaca dan menulis file teks (TXT)
3. Membaca dan menulis file CSV
4. Membaca dan menulis file JSON
5. Memahami peran File Handling dalam Data Science & Data Engineering

## Apa itu File Handling?

File Handling adalah proses membaca data dari file dan menulis data ke file.

Dalam dunia Data:
- Data jarang ditulis langsung di kode
- Data biasanya disimpan dalam file (TXT, CSV, JSON, dll)
- File Handling adalah fondasi sebelum masuk ke Pandas dan Database

## 1. File TXT (Text File)

File TXT adalah file teks biasa.
Python menyediakan fungsi `open()` untuk mengelola file.

### Mode File
- `r` : read (membaca)
- `w` : write (menulis, menimpa)
- `a` : append (menambah)

In [1]:
# Menulis file TXT
file = open("contoh.txt", "w")
file.write("Halo, ini file teks pertama saya.\n")
file.write("Belajar File Handling dengan Python.")
file.close()

In [3]:
# Membaca file TXT
file = open("contoh.txt", "r")
isi_file = file.read()
file.close()

print(isi_file)

Halo, ini file teks pertama saya.
Belajar File Handling dengan Python.


### Best Practice: with statement

Menggunakan `with` lebih aman karena file akan tertutup otomatis.

In [4]:
with open("contoh.txt", "r") as file:
    print(file.read())

Halo, ini file teks pertama saya.
Belajar File Handling dengan Python.


## 2. File CSV (Comma Separated Values)

CSV adalah format paling umum dalam Data Analytics dan Data Science.
Setiap baris merepresentasikan satu record data.

### Membaca File CSV (csv module)

In [7]:
import csv

with open("data_mahasiswa.csv", "w", newline="") as file:
    writer = csv.writer(file)
    writer.writerow(["nama", "umur", "nilai"])
    writer.writerow(["Kamil", 21, 85])
    writer.writerow(["Mahreen", 22, 90])

In [8]:
# Membaca file CSV
with open("data_mahasiswa.csv", "r") as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)

['nama', 'umur', 'nilai']
['Kamil', '21', '85']
['Mahreen', '22', '90']


Catatan:
- Data CSV dibaca sebagai list
- Konversi tipe data sering diperlukan

## 3. File JSON (JavaScript Object Notation)

JSON adalah format data yang sangat umum digunakan pada:
- API
- Web Service
- Data Pipeline

### Struktur JSON
- Object -> dictionary
- Array -> list

In [10]:
import json

data_mahasiswa = {
    "nama": "Kamil",
    "umur": 30,
    "nilai": [80, 85, 90],
    "is_student": True
}

# Menulis file JSON
with open("mahasiswa.json", "w") as file:
    json.dump(data_mahasiswa, file, indent=4)

In [11]:
# Membaca file JSON
with open("mahasiswa.json", "r") as file:
    data = json.load(file)

print(data)
print(type(data))

{'nama': 'Kamil', 'umur': 30, 'nilai': [80, 85, 90], 'is_student': True}
<class 'dict'>


## Studi Kasus Mini

Menyimpan data beberapa mahasiswa ke file JSON dan membacanya kembali.

## Jawaban

In [12]:
data_mahasiswa = [
    {"nama": "Kamil", "umur": 21, "nilai": 85},
    {"nama": "Nurul", "umur": 22, "nilai": 90},
    {"nama": "Fildza", "umur": 23, "nilai": 78}
]

with open("data_mahasiswa.json", "w") as file:
    json.dump(data_mahasiswa, file, indent=4)

In [13]:
with open("data_mahasiswa.json", "r") as file:
    data = json.load(file)

for mhs in data:
    print(mhs["nama"], "-", mhs["nilai"])

Kamil - 85
Nurul - 90
Fildza - 78


## Latihan

1. Buat file TXT berisi biodata
2. Buat file CSV berisi minimal 3 data mahasiswa
3. Simpan data mahasiswa ke file JSON lalu baca kembali

# Jawaban & Solusi Latihan

## Latihan 1
Buat file TXT berisi biodata.

### Penjelasan
Kita akan:
1. Membuat file teks (`biodata.txt`)
2. Menuliskan biodata sederhana ke dalam file
3. Membaca kembali isi file untuk memastikan data tersimpan dengan benar

In [14]:
# Menulis biodata ke file TXT
with open("biodata.txt", "w") as file:
    file.write("Nama          : Kamil\n")
    file.write("Umur          : 30\n")
    file.write("Profesi       : IT Infrastructure Engineer\n")
    file.write("Minat         : Data Science\n")

In [15]:
# Membaca kembali file biodata
with open("biodata.txt", "r") as file:
    print(file.read())

Nama          : Kamil
Umur          : 30
Profesi       : IT Infrastructure Engineer
Minat         : Data Science



## Latihan 2
Buat file CSV berisi minimal 3 data mahasiswa.

### Penjelasan
File CSV biasanya digunakan untuk menyimpan data tabular.
Setiap baris merepresentasikan satu data mahasiswa.

In [16]:
import csv

# Menulis data mahasiswa ke file CSV
with open("mahasiswa.csv", "w", newline="") as file:
    writer = csv.writer(file)
    writer.writerow(["nama", "umur", "nilai"])
    writer.writerow(["Kamil", 30, 85])
    writer.writerow(["Nurul", 30, 90])
    writer.writerow(["Fildza", 25, 78])

In [17]:
# Membaca file CSV
with open("mahasiswa.csv", "r") as file:
    reader = csv.reader(file)
    for row in reader:
        print(row)

['nama', 'umur', 'nilai']
['Kamil', '30', '85']
['Nurul', '30', '90']
['Fildza', '25', '78']


## Latihan 3
Simpan data mahasiswa ke file JSON lalu baca kembali.

### Penjelasan
JSON sangat umum digunakan dalam:
- API
- Data Pipeline
- Pertukaran data antar sistem

Pada latihan ini:
1. Data mahasiswa disimpan dalam bentuk list of dictionary
2. Data disimpan ke file JSON
3. Data dibaca kembali dari file JSON

In [18]:
import json

# Data mahasiswa
data_mahasiswa = [
    {"nama": "Kamil", "umur": 30, "nilai": 85},
    {"nama": "Nurul", "umur": 30, "nilai": 90},
    {"nama": "Fildza", "umur": 25, "nilai": 78}
]

# Menyimpan ke file JSON
with open("mahasiswa.json", "w") as file:
    json.dump(data_mahasiswa, file, indent=4)

In [19]:
# Membaca kembali file JSON
with open("mahasiswa.json", "r") as file:
    data = json.load(file)

for mhs in data:
    print(f"Nama: {mhs['nama']}, Umur: {mhs['umur']}, Nilai: {mhs['nilai']}")

Nama: Kamil, Umur: 30, Nilai: 85
Nama: Nurul, Umur: 30, Nilai: 90
Nama: Fildza, Umur: 25, Nilai: 78


## Kesimpulan

- File TXT cocok untuk data sederhana dan dokumentasi
- File CSV cocok untuk data tabular
- File JSON cocok untuk data terstruktur dan pertukaran data

Penguasaan File Handling adalah fondasi penting sebelum masuk ke:
- Pandas
- Data Cleaning
- Database
- Data Pipeline