<a href="https://colab.research.google.com/github/kzdanowski/KGN_Programownie1/blob/main/Lab/Zaj%C4%99cia_13_(15_01_26)_grupy_2_i_3_ipynb.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# CSV i JSON

Format CSV (Comma Separated Values)
CSV służy do przechowywania danych tabelarycznych (podobnie jak arkusze Excel). Każda linia to rekord, a kolumny oddzielone są przecinkiem (lub średnikiem).

Do jego obsługi używamy modułu csv.

Odczyt pliku CSV
Najprostszym sposobem na odczytanie danych w formie słowników jest DictReader.


    import csv

    with open('dane.csv', mode='r', encoding='utf-8') as plik:
        czytnik = csv.DictReader(plik)
        for wiersz in czytnik:
            print(f"Imię: {wiersz['imie']}, Wiek: {wiersz['wiek']}")
Zapis do pliku CSV
Podczas zapisu warto użyć DictWriter, aby mieć kontrolę nad nagłówkami.



    import csv

    dane = [
        {'imie': 'Jan', 'wiek': 30},
        {'imie': 'Anna', 'wiek': 25}
    ]

    with open('nowe_dane.csv', mode='w', newline='', encoding='utf-8') as plik:
        pola = ['imie', 'wiek']
        pisarz = csv.DictWriter(plik, fieldnames=pola)

        pisarz.writeheader()  # Zapisuje nagłówki (imie, wiek)
        pisarz.writerows(dane) # Zapisuje wszystkie wiersze

2. Format JSON (JavaScript Object Notation)
JSON to format oparty na hierarchii (klucze i wartości). Idealnie mapuje się na pythonowe słowniki (dict) i listy (list).

Do jego obsługi używamy modułu json.

Odczyt pliku JSON
Używamy metody json.load() do wczytania pliku bezpośrednio do zmiennej.


    import json

    with open('konfiguracja.json', 'r', encoding='utf-8') as plik:
        dane = json.load(plik)
        print(dane['uzytkownik']['login'])


Zapis do pliku JSON
Używamy metody json.dump(). Parametr indent sprawia, że plik jest czytelny dla człowieka.


    import json

    osoba = {
        "imie": "Marek",
        "umiejetnosci": ["Python", "SQL", "Docker"],
        "aktywny": True
    }

    with open('osoba.json', 'w', encoding='utf-8') as plik:
        json.dump(osoba, plik, indent=4, ensure_ascii=False)

In [1]:
import csv

dane = [
    {'imie': 'Jan', 'wiek': 30},
    {'imie': 'Anna', 'wiek': 25}
]

with open('nowe_dane.csv', mode='w', newline='', encoding='utf-8') as plik:
    pola = ['imie', 'wiek']
    pisarz = csv.DictWriter(plik, fieldnames=pola)

    pisarz.writeheader()  # Zapisuje nagłówki (imie, wiek)
    pisarz.writerows(dane) # Zapisuje wszystkie wiersze

In [2]:
with open('nowe_dane.csv', mode='r', encoding='utf-8') as plik:
    czytnik = csv.DictReader(plik)
    data = {field: [] for field in czytnik.fieldnames}
    for row in czytnik:
        for field in czytnik.fieldnames:
            data[field].append(row[field])
    print(data)





{'imie': ['Jan', 'Anna'], 'wiek': ['30', '25']}


In [3]:
import json

osoba = {
    "imie": "Marek",
    "umiejetnosci": ["Python", "SQL", "Docker"],
    "aktywny": True
}

with open('osoba.json', 'w', encoding='utf-8') as plik:
    json.dump(osoba, plik, indent=4, ensure_ascii=False)

In [4]:
with open('osoba.json', 'r', encoding='utf-8') as plik:
    dane = json.load(plik)
    print(dane)

{'imie': 'Marek', 'umiejetnosci': ['Python', 'SQL', 'Docker'], 'aktywny': True}


## Dane do zadań

In [5]:
# studenci

import csv
import random

students = [
    {"id": i, "name": f"Student_{i}", "age": random.randint(19, 26),
     "grade": round(random.uniform(2.0, 5.0), 1),
     "passed": random.choice([True, False])}
    for i in range(1, 31)
]

with open("students.csv", "w", newline="", encoding="utf-8") as f:
    writer = csv.DictWriter(
        f, fieldnames=["id", "name", "age", "grade", "passed"]
    )
    writer.writeheader()
    writer.writerows(students)


In [6]:
# ankieta

import csv
import random

rows = []
for i in range(1, 41):
    age = random.choice([None, random.randint(18, 65)])
    income = random.choice([None, random.randint(3000, 12000)])
    rows.append({
        "id": i,
        "age": age,
        "income": income
    })

with open("survey.csv", "w", newline="", encoding="utf-8") as f:
    writer = csv.DictWriter(f, fieldnames=["id", "age", "income"])
    writer.writeheader()
    for row in rows:
        writer.writerow({
            k: ("" if v is None else v) for k, v in row.items()
        })


In [7]:
# książka JSON

import json

book = {
    "title": "Introduction to Data Science",
    "author": "Jane Doe",
    "year": 2022,
    "chapters": [
        {"number": 1, "title": "Data and Information"},
        {"number": 2, "title": "CSV and JSON"},
        {"number": 3, "title": "Basic Data Analysis"},
        {"number": 4, "title": "Visualization"}
    ]
}

with open("book.json", "w", encoding="utf-8") as f:
    json.dump(book, f, indent=2, ensure_ascii=False)


In [8]:
# użtkownicy JSON

import json
import random

users = []
for i in range(1, 21):
    users.append({
        "id": i,
        "name": f"User_{i}",
        "email": f"user{i}@example.com",
        "active": random.choice([True, False])
    })

with open("users.json", "w", encoding="utf-8") as f:
    json.dump(users, f, indent=2, ensure_ascii=False)


Zadanie 1 (podstawowe wczytywanie i inspekcja).
Jest plik students.csv zawierający kolumny: id, name, age, grade, passed.
Polecenia:
– wczytaj plik do środowiska (jako słownik),
– sprawdź liczbę wierszy i kolumn,
– wyświetl pierwsze 5 rekordów,
– sprawdź typy danych w poszczególnych kolumnach.

Zadanie 2 (selekcja i proste operacje).
Korzystając z tego samego pliku:
– wybierz tylko studentów, którzy zdali (passed == true),
– oblicz średnią ocen (grade) dla studentów, którzy zdali,
– zapisz wynikowy zbiór danych do nowego pliku CSV.

Zadanie 3 (braki danych i formatowanie).
Jest plik survey.csv, w którym część wartości w kolumnach age i income jest pusta.
Polecenia:
– zidentyfikuj brakujące wartości,
– policz, ile ich jest w każdej kolumnie,
– uzupełnij brakujące age medianą,
– zapisz poprawiony zbiór danych do CSV, dbając o poprawny separator i kodowanie.

Zadania dotyczące JSON.

Zadanie 4 (struktura JSON i dostęp do pól).
Jest plik book.json opisujący jedną książkę, np. z polami: title, author, year, chapters (lista rozdziałów).
Polecenia:
– wczytaj plik JSON,
– wypisz tytuł i autora,
– policz liczbę rozdziałów,
– wypisz tytuły wszystkich rozdziałów.

Zadanie 5 (JSON z listą obiektów).
Jest plik users.json zawierający listę użytkowników, z których każdy ma pola: id, name, email, active.
Polecenia:
– wczytaj dane,
– wybierz tylko aktywnych użytkowników,
– utwórz listę adresów e-mail aktywnych użytkowników,
– zapisz ją do pliku tekstowego lub CSV.

In [18]:
with open('students.csv') as plik:
    czytnik = csv.DictReader(plik)
    piec = list(czytnik)[:5]
    for elem in piec:
      print(elem)


    # data = {key: [] for key in czytnik.fieldnames}
    # for row in czytnik:
    #     for field in czytnik.fieldnames:
    #         data[field].append(row[field])
    # print(data)

    # for elem in data.keys():
    #   print(data[elem][:5])


{'id': '1', 'name': 'Student_1', 'age': '25', 'grade': '2.1', 'passed': 'False'}
{'id': '2', 'name': 'Student_2', 'age': '22', 'grade': '3.5', 'passed': 'True'}
{'id': '3', 'name': 'Student_3', 'age': '20', 'grade': '4.6', 'passed': 'False'}
{'id': '4', 'name': 'Student_4', 'age': '21', 'grade': '4.0', 'passed': 'True'}
{'id': '5', 'name': 'Student_5', 'age': '24', 'grade': '2.2', 'passed': 'True'}


In [20]:
with open('students.csv') as plik:
    czytnik = csv.DictReader(plik)
    data = list(czytnik)
    grades = []

    new_data = []
    for elem in data:
      if elem['passed'] == 'True':
        new_data.append(elem)

    for elem in new_data:
          grades.append(float(elem['grade']))


    lenght = len(new_data)
    suma = sum(grades)


    for elem in new_data:
      elem['mean'] = suma / lenght


with open('passed_students.csv','w') as plik:
    pola = ['id', 'name', 'age', 'grade', 'passed', 'mean']
    writter = csv.DictWriter(plik, fieldnames=pola)
    writter.writeheader()
    writter.writerows(new_data)