# Csv

nella cartella data sono presenti svariati file, in questa lezione vedremo come leggere un file csv

## Lettura di file

### utilizzo di readlines()

**N.B. utilizzare solo con file piccoli.**

readlines() ritorna l'intero files e lo carica tutto in memoria ram.
è subito evidente che applicando readlines() ad un file >1GB può causare seri problemi di performance e di esaurimento delle risorse

In [14]:

# apro un file in modalità lettura
fp = open("data/airtravel.csv")

# leggo tutte le linee (ritorna una lista, ogni elemento corrisponde ad una riga del file)
linee = fp.readlines()
# chiamare sempre il close quando si terminano le operazioni sul file
fp.close()

header = linee[0]
for item in linee[1:]:
    print(item.strip())


"JAN",  340,  360,  417
"FEB",  318,  342,  391
"MAR",  362,  406,  419
"APR",  348,  396,  461
"MAY",  363,  420,  472
"JUN",  435,  472,  535
"JUL",  491,  548,  622
"AUG",  505,  559,  606
"SEP",  404,  463,  508
"OCT",  359,  407,  461
"NOV",  310,  362,  390
"DEC",  337,  405,  432



### iterare l'oggetto generato dalla chiamata open()

In [16]:
fp = open("data/airtravel.csv")
for item in fp:
    print(item.strip())

<class '_io.TextIOWrapper'>
"Month", "1958", "1959", "1960"
"JAN",  340,  360,  417
"FEB",  318,  342,  391
"MAR",  362,  406,  419
"APR",  348,  396,  461
"MAY",  363,  420,  472
"JUN",  435,  472,  535
"JUL",  491,  548,  622
"AUG",  505,  559,  606
"SEP",  404,  463,  508
"OCT",  359,  407,  461
"NOV",  310,  362,  390
"DEC",  337,  405,  432



come mai è possibile iterare l'oggetto?
semplice, ricordate i magic methods delle classi?

`def __iter__(...)` ci permette di definire cosa ritornare quando si chiama attraverso un iteratore l'oggetto corrente `for`

In [33]:
class Test:
    def __init__(self, max=10):
        self.items = range(max)
        
    # definiamo l'iteratore
    def __iter__(self):
        yield from self.items
        
for item in Test(3):
    print(item)
    
try:
    t = Test()
    next(t)
except:
    print("l'elemento non è un iteratore, devi implementare il metodo __next__")
    
    
class TestWithNext(Test):
    
    def __init__(self, *args, **kwargs):
        self.current = 0
        super().__init__(**kwargs)
        
    def __next__(self):
        if self.current < len(self.items):
            obj =self.items[self.current]
            self.current += 1
            return obj
        raise StopIteration
        
n = TestWithNext(1)
print(next(n))
print(next(n))
print(next(n))


0
1
2
l'elemento non è un iteratore, devi implementare il metodo __next__
0
1
2
