# Python Biblioteka Standardowa - serializacja CSV - zadania

## Serialization CSV DictReader

1. Użyj danych z sekcji "Input" (patrz poniżej)
1. Pobierz plik https://python.astrotech.io/_static/iris.csv i zapisz go jako ``iris.csv`` w katalogu ze skryptami
1. Korzystając z ``csv.DictReader`` wczytaj zawartość pliku
1. Podaj jawnie ``encoding``, ``delimiter`` oraz ``quotechar``
1. Podmień nazwy kolumn na ``FIELDNAMES``
1. Pomiń pierwszą linię (nagłówek)
1. Wypisz wiersze z danymi
1. Porównaj wyniki z sekcją "Output" (patrz poniżej)

Output:
```python
{'Sepal Length': '5.4', 'Sepal Width': '3.9', 'Petal Length': '1.3', 'Petal Width': '0.4', 'Species': 'setosa'}
{'Sepal Length': '5.9', 'Sepal Width': '3.0', 'Petal Length': '5.1', 'Petal Width': '1.8', 'Species': 'virginica'}
{'Sepal Length': '6.0', 'Sepal Width': '3.4', 'Petal Length': '4.5', 'Petal Width': '1.6', 'Species': 'versicolor'}
...
```

In [None]:
FIELDNAMES = [
    'Sepal Length',
    'Sepal Width',
    'Petal Length',
    'Petal Width',
    'Species',
]

## Serialization CSV DictWriter

1. Użyj danych z sekcji "Input" (patrz poniżej)
1. Za pomocą ``csv.DictWriter()`` zapisz ``DATA`` do pliku
1. Spróbuj otworzyć plik w arkuszu kalkulacyjnym tj. Microsoft Excel / Libre Office / Numbers itp
1. Spróbuj otworzyć plik w IDE i prostym edytorze tekstu tj. Notepad, vim lub gedit
1. Porównaj wyniki z sekcją "Output" (patrz poniżej)
1. Wymagania niefunkcjonalne:

    * Wszystkie pola muszą być otoczone znakiem cudzysłowu ``"``
    * Użyj ``,`` do oddzielenia kolumn
    * Użyj kodowania ``utf-8``
    * Użyj zakończenia linii Unix ``\n``

Output:
```text
"firstname","lastname"
"Jan","Twardowski"
"José","Jiménez"
"Mark","Watney"
"Ivan","Ivanovic"
"Melissa","Lewis"
```

In [None]:
DATA = [
    {'firstname': 'Jan',  'lastname': 'Twardowski'},
    {'firstname': 'José', 'lastname': 'Jiménez'},
    {'firstname': 'Mark', 'lastname': 'Watney'},
    {'firstname': 'Ivan', 'lastname': 'Ivanovic'},
    {'firstname': 'Melissa', 'lastname': 'Lewis'},
]

## Serialization CSV List of Tuples

1. Użyj danych z sekcji "Input" (patrz poniżej)
1. Za pomocą ``csv.DictWriter()`` zapisz ``DATA`` do pliku
1. Porównaj wyniki z sekcją "Output" (patrz poniżej)
1. Wymagania niefunkcjonalne:

    * Nie używaj cudzysłowów w wynikowym pliku CSV
    * Użyj ``,`` do oddzielenia kolumn
    * Użyj kodowania ``utf-8``
    * Użyj zakończenia linii Unix ``\n``

Output:
```text
Sepal length,Sepal width,Petal length,Petal width,Species
5.8,2.7,5.1,1.9,virginica
5.1,3.5,1.4,0.2,setosa
5.7,2.8,4.1,1.3,versicolor
6.3,2.9,5.6,1.8,virginica
6.4,3.2,4.5,1.5,versicolor
4.7,3.2,1.3,0.2,setosa
7.0,3.2,4.7,1.4,versicolor
7.6,3.0,6.6,2.1,virginica
4.9,3.0,1.4,0.2,setosa
4.9,2.5,4.5,1.7,virginica
7.1,3.0,5.9,2.1,virginica
4.6,3.4,1.4,0.3,setosa
5.4,3.9,1.7,0.4,setosa
5.7,2.8,4.5,1.3,versicolor
5.0,3.6,1.4,0.3,setosa
5.5,2.3,4.0,1.3,versicolor
6.5,3.0,5.8,2.2,virginica
6.5,2.8,4.6,1.5,versicolor
6.3,3.3,6.0,2.5,virginica
6.9,3.1,4.9,1.5,versicolor
4.6,3.1,1.5,0.2,setosa
```

In [None]:
DATA = [
    ('Sepal length', 'Sepal width', 'Petal length', 'Petal width', 'Species'),
    (5.8, 2.7, 5.1, 1.9, 'virginica'),
    (5.1, 3.5, 1.4, 0.2, 'setosa'),
    (5.7, 2.8, 4.1, 1.3, 'versicolor'),
    (6.3, 2.9, 5.6, 1.8, 'virginica'),
    (6.4, 3.2, 4.5, 1.5, 'versicolor'),
    (4.7, 3.2, 1.3, 0.2, 'setosa'),
    (7.0, 3.2, 4.7, 1.4, 'versicolor'),
    (7.6, 3.0, 6.6, 2.1, 'virginica'),
    (4.9, 3.0, 1.4, 0.2, 'setosa'),
    (4.9, 2.5, 4.5, 1.7, 'virginica'),
    (7.1, 3.0, 5.9, 2.1, 'virginica'),
    (4.6, 3.4, 1.4, 0.3, 'setosa'),
    (5.4, 3.9, 1.7, 0.4, 'setosa'),
    (5.7, 2.8, 4.5, 1.3, 'versicolor'),
    (5.0, 3.6, 1.4, 0.3, 'setosa'),
    (5.5, 2.3, 4.0, 1.3, 'versicolor'),
    (6.5, 3.0, 5.8, 2.2, 'virginica'),
    (6.5, 2.8, 4.6, 1.5, 'versicolor'),
    (6.3, 3.3, 6.0, 2.5, 'virginica'),
    (6.9, 3.1, 4.9, 1.5, 'versicolor'),
    (4.6, 3.1, 1.5, 0.2, 'setosa'),
]

## Serialization CSV Schemaless

1. Użyj danych z sekcji "Input" (patrz poniżej)
1. Za pomocą ``csv.DictWriter()`` zapisz do pliku CSV dane o zmiennej strukturze
1. ``fieldnames`` musi być generowane automatycznie na podstawie ``DATA``
1. ``fieldnames`` ma być zawsze w takiej samej kolejności
1. Porównaj wyniki z sekcją "Output" (patrz poniżej)
1. Wymagania niefunkcjonalne:

    * Wszystkie pola muszą być otoczone znakiem cudzysłowu ``"``
    * Użyj ``,`` do oddzielenia kolumn
    * Użyj kodowania ``utf-8``
    * Użyj zakończenia linii Unix ``\n``

Output:
```csv
"Petal length", "Petal width", "Sepal length", "Sepal width", "Species"
"", "", "5.1", "3.5", "setosa"
"4.1", "1.3", "", "", "versicolor"
"", "1.8", "6.3", "", "virginica"
"", "0.2", "5.0", "", "setosa"
"4.1", "", "", "2.8", "versicolor"
"", "1.8", "", "2.9", "virginica"
```

In [None]:
DATA = [
    {'Sepal length': 5.1, 'Sepal width': 3.5, 'Species': 'setosa'},
    {'Petal length': 4.1, 'Petal width': 1.3, 'Species': 'versicolor'},
    {'Sepal length': 6.3, 'Petal width': 1.8, 'Species': 'virginica'},
    {'Sepal length': 5.0, 'Petal width': 0.2, 'Species': 'setosa'},
    {'Sepal width': 2.8, 'Petal length': 4.1, 'Species': 'versicolor'},
    {'Sepal width': 2.9, 'Petal width': 1.8, 'Species': 'virginica'},
]

## Serialization CSV Objects

1. Użyj danych z sekcji "Input" (patrz poniżej)
1. Za pomocą ``csv.DictWriter()`` zapisz dane do pliku CSV
1. Wymagania niefunkcjonalne:

    * Wszystkie pola muszą być otoczone znakiem cudzysłowu ``"``
    * Użyj ``,`` do oddzielenia kolumn
    * Użyj kodowania ``utf-8``
    * Użyj zakończenia linii Unix ``\n``

In [None]:
class Iris:
    def __init__(self, sepal_length, sepal_width,
                 petal_length, petal_width, species):

        self.sepal_length = sepal_length
        self.sepal_width = sepal_width
        self.petal_length = petal_length
        self.petal_width = petal_width
        self.species = species


DATA = [
    Iris(5.1, 3.5, 1.4, 0.2, 'setosa'),
    Iris(5.8, 2.7, 5.1, 1.9, 'virginica'),
    Iris(5.1, 3.5, 1.4, 0.2, 'setosa'),
    Iris(5.7, 2.8, 4.1, 1.3, 'versicolor'),
    Iris(6.3, 2.9, 5.6, 1.8, 'virginica'),
    Iris(6.4, 3.2, 4.5, 1.5, 'versicolor'),
]

## Serialization CSV Relations

1. Użyj danych z sekcji "Input" (patrz poniżej)
1. Za pomocą ``csv.DictWriter()`` zapisz kontakty z książki adresowej w pliku
1. Jak zapisać w CSV dane relacyjne (kontakt ma wiele adresów)?
1. Odtwórz strukturę obiektów na podstawie danych odczytanych z pliku
1. Wymagania niefunkcjonalne:

    * Wszystkie pola muszą być otoczone znakiem cudzysłowu ``"``
    * Użyj ``;`` do oddzielenia kolumn
    * Użyj kodowania ``utf-8``
    * Użyj zakończenia linii Unix ``\n``

In [2]:
class Contact:
    def __init__(self, firstname, lastname, addresses=()):
        self.firstname = firstname
        self.lastname = lastname
        self.addresses = addresses


class Address:
    def __init__(self, location, city):
        self.location = location
        self.city = city


DATA = [
    Contact(firstname='Jan', lastname='Twardowski', addresses=(
        Address(location='Johnson Space Center', city='Houston, TX'),
        Address(location='Kennedy Space Center', city='Merritt Island, FL'),
        Address(location='Jet Propulsion Laboratory', city='Pasadena, CA'),
    )),
    Contact(firstname='Mark', lastname='Watney'),
    Contact(firstname='Melissa', lastname='Lewis', addresses=()),
]

<img src="img/csv-relations-dump-dbdump.png" width="800">
<img src="img/csv-relations-dump-ffill1.png" width="800">
<img src="img/csv-relations-dump-ffill2.png" width="800">
<img src="img/csv-relations-dump-uniqid.png" width="800">
<img src="img/csv-relations-dump-colattr.png" width="800">
<img src="img/csv-relations-dump-colobj.png" width="800">
<img src="img/csv-relations-dump-colcls.png" width="800">
<img src="img/csv-relations-dump-hybrid.png" width="800">