## Le ``Series``
La struttura dati **Series** è un array unidimensionale.

In [2]:
import pandas as pd

Da edesso la varibile `s` assumerà il valore di una *Series*

In [3]:
s = pd.Series([float(n) for n in range(0, 4)])
print(s)

0    0.0
1    1.0
2    2.0
3    3.0
dtype: float64


*Series* ha un concetto di base di **Indice**, che di base parte da 0, e di **valore**, attribuito all'indice

In [4]:
print('Indici:', s.index)
print('Valori degli incici:', s.values)

Indici: RangeIndex(start=0, stop=4, step=1)
Valori degli incici: [0. 1. 2. 3.]


Oltre a far tornare solo le chiavi o solo i valori è possibile ritornare essi insime con la funzione `.items()`

In [5]:
for index, val in s.items():
  print([index, val])

[0, 0.0]
[1, 1.0]
[2, 2.0]
[3, 3.0]


Come i *dizionari* è possibile accedere al valore dell'indice tramite una **chiave** con il metodo `s[Index]`

In [6]:
print(s[2])

2.0


E' possibile cambiare il valore dell'indice della *Series*

In [7]:
s2 = pd.Series([n for n in range(0, 4)], index=list('abcd'))
print(s2)

print('Valore dell\'indice c:', s2['c'])

a    0
b    1
c    2
d    3
dtype: int64
Valore dell'indice c: 2


Quindi una *Series* può assumere il valore di un dizionaro unidimensionale trasformandolo in una tabella

In [8]:
data = {'Abruzzo': 'Aquila', 'Basilicata': 'Potenza', 'Calabria': 'Catanzaro', 'Campania': 'Napoli', 'Emilia-Romagna': 'Bologna', 'Friuli-venezia-Giulia': 'Trieste', 'Lazio': 'Roma', 'Liguaria': 'Genova', 'Lombardia': 'Milano', 'Marche': 'Ancona', 'Molise': 'Campobasso', 'Piemonte': 'Torino', 'Puglia': 'Bari', 'Sardegna': 'Cagliari', 'Sicilia': 'Palermo', 'Toscana': 'Firenze', 'Trentino-Alto Adige': 'Trento', 'Umbria': 'Perugia', 'valle d\'Aosta': 'Aosta', 'Veneto': 'Venezia'}

capoluoghi_di_regione = pd.Series(data, name='Capoluoghi di regione')
print(capoluoghi_di_regione)

Abruzzo                      Aquila
Basilicata                  Potenza
Calabria                  Catanzaro
Campania                     Napoli
Emilia-Romagna              Bologna
Friuli-venezia-Giulia       Trieste
Lazio                          Roma
Liguaria                     Genova
Lombardia                    Milano
Marche                       Ancona
Molise                   Campobasso
Piemonte                     Torino
Puglia                         Bari
Sardegna                   Cagliari
Sicilia                     Palermo
Toscana                     Firenze
Trentino-Alto Adige          Trento
Umbria                      Perugia
valle d'Aosta                 Aosta
Veneto                      Venezia
Name: Capoluoghi di regione, dtype: object


Anche se le chiavi non hanno un valore intero è possibile usare lo *slicing* all'interno della *Series*, ed ovviamente ritornare il valore dell'indice dalla posizione di esso

In [15]:
print(capoluoghi_di_regione['Campania':'Molise'])

print(capoluoghi_di_regione[0])
#Oppure - Il risultato è lo stesso
print(capoluoghi_di_regione['Abruzzo'])

Campania                     Napoli
Emilia-Romagna              Bologna
Friuli-venezia-Giulia       Trieste
Lazio                          Roma
Liguaria                     Genova
Lombardia                    Milano
Marche                       Ancona
Molise                   Campobasso
Name: Capoluoghi di regione, dtype: object
Aquila
Aquila


E' possibile applicare le *list comprehension* ad i valori delle chiavi di una *Series*

In [10]:
population = pd.Series({'Germany': 81.3, 'Belgium': 11.3, 'France': 64.3, 'United Kingdom': 64.9, 'Netherlands': 16.9})

In [11]:
print(population[population > 20])

Germany           81.3
France            64.3
United Kingdom    64.9
dtype: float64


Oltre che alle *list comprehension* si possono eseguire anhce operazioni di ricerca tramite il valore della chiave.

Sintassi: `s[s == value]`

In [12]:
# Si voglio far tornare con una unica variabile i paesi con una popolazione sopra i 50mln di abitanti
res = pd.Series(dtype='float64')

for country, popl in population.items():
  if popl >= 50:
    res = res.append(population[population == popl])

print(res)

Germany           81.3
France            64.3
United Kingdom    64.9
dtype: float64


E' possibile ricevere informazioni base sulla *Sereis* con la fuznione `s.describe()`

| Chiave | Significato |
| ---: | --- |
| ``count`` | Numero di elementi totali |
| ``mean`` | Media dei valori |
| ``std`` | Deviazione standard delle osservazioni |
| ``min`` | Valore più basso |
| ``25%`` | Valore minimo |
| ``50%`` | Valore medio |
| ``75%`` | Valore massimo |
| ``max`` | Valore più alto |

In [13]:
print(population.describe())

count     5.000000
mean     47.740000
std      31.519645
min      11.300000
25%      16.900000
50%      64.300000
75%      64.900000
max      81.300000
dtype: float64


Se in caso ci si scorda un valore da inserire nella *Series* non c'è problema, con la funzione `.appned(Series_or_Dataframe)` è possbile aggiungerlo, quindi è anche possibile concatenare più *Series*.

### [Docs](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.append.html)

In [14]:
series_to_appned = pd.Series({'Spain': 46.9, 'Congo': 86.7})
population = population.append(series_to_appned)

population

Germany           81.3
Belgium           11.3
France            64.3
United Kingdom    64.9
Netherlands       16.9
Spain             46.9
Congo             86.7
dtype: float64