# Pandas Series

Un obiect de tip 'Series' este o structură de date în Pandas care memorează un array de informații împreună cu un index. Acest index face diferența dintre un array din NumPy și un Series din Pandas. Știm deja că un array de NumPy are un index numeric. De exemplu, dacă avem un array care conține anumite valori (anumiți ani), atunci avem un index numeri care este asociat cu anumte valori din acel array

| Index | Data |
| --- | --- |
| 0   | 1776 |
| 1   | 1876 |
| 2   | 1821 |


Din tabelul de mai sus, pentru valoarea '1776' corespunde index-ul 0 și tot așa. Acest mod de indexare nu este unul rău, dar ar fi mult mai util să avem acea valoare asociată cu un string (label). Un Series din Pandas ne permite să înlocuil acel index valori cu un index pe bază de string label. Astfel, tabelul nostru va arăta așa:

| Index | Data |
| --- | --- |
| USA   | 1776 |
| CANADA   | 1876 |
| MEXICO   | 1821 |


În acest fel putem să preluăm date din acest Series utilizând acel index care reprezintă anumite nume de țări. Este mult mai simplu să spunem că dorim să preluăm informația despre țara 'USA' decât să memorăm că țara respectivă se găsește pe index-ul 0. Ce anume trebuie clarificat totuși, este faptul că aceste date sunt organizate și numeric. Putem să ne imaginăm că un Series din Pandas reține un array de Numpy (cu tot cu indexarea numerică), iar pe lână aceasta mai adaugă un alt index.

| Index Numeric| Index Labeled | Data |
| --- | --- | --- |
| 0   | USA | 1776 |
| 1   | CANADA | 1876 |
| 2   | MEXIC| 1821 |


Prin urmare, în cadrul unui Series putem să extragem informații fie utilizând index-ul numeric, fie utilizând index-ul de string

O să învățăm numeroase modalități prin care putem crea un Series, o să învățăm despre anumite proprietăți și operații fundamentale și la final o să învățăm cum anume putem combina un Series cu un anumit Index pentru a crea un obiect denumit DataFrame. Pentru a trece prin ceva exemple o să importăm atât NumPy cât și Pandas. Convenția la NumPy este să se importe precum 'np', iar la Pandas, 'pd'

In [1]:
import numpy as np
import pandas as pd

După cum specificam, o să lucrăm cu Series în această parte din tutorial. Pentru mai multe informații despre acest tip de date (pe lângă cele care o să fie specificate în acest curs) putem să navigăm în browser la documentația oficială de la Pandas despre acest tip de obiect (https://pandas.pydata.org/docs/reference/api/pandas.Series.html)

### pandas.Series


#### class pandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)

Documentația de la Pandas ne spune următoarele lucruri despre un obiect de tip Series. Acesta are mai mulți parametrii, dar cei la care trebuie să ne uităm sunt următorii: data=None și index=None. Acel parametru de index o să adauge acel supliment pentru un array de tip NumPy

Pentru început o să ne creem 2 variaile, și anume una care o să ne înlocuiască partea de index, iar alta care o să ne înlocuiască partea de date din cadrul tabelului de mai sus

In [4]:
myindex = ['USA', 'Canada', 'Mexic']

In [5]:
mydata = [1776, 1876, 1821]

În contuinuare o să creem un obiect Series cu aceste date. Pentru început o să îi atribuim doar valori pentru argumentul 'data'

In [7]:
my_series = pd.Series(data=mydata)

In [8]:
my_series

0    1776
1    1876
2    1821
dtype: int64

Ce anune face Pandas, transformă acea listă din Python într-un array de NumPy pe care o afișează sub forma unui Series. În mod automat ne afișează și acel index numeric care se trece automat într-un Series. În continuare o să trecem date și pentru argumentul de index

In [9]:
my_series = pd.Series(data=mydata, index=myindex)

In [10]:
my_series

USA       1776
Canada    1876
Mexic     1821
dtype: int64

Dacă am făcut acest lucru, acuma putem observa că index-ul reprezintă acel string label ce era trecut în lista 'myindx', iar asta înseamnă că putem să preluăm informații din acel Serie pe baza string-ului ce este folosit ca și un index

In [11]:
my_series['Canada']

1876

După cum se observă, se retunrează valoarea care este în dreptul acelui string label ce este utilizat ca și index. După cum se specifica la început, în acest obiect Series se păstrează și index-ul numeric ce era afișat inițial, prin urmare putem să extrage date utilizând și acel index

In [12]:
my_series[1]

1876

Acesta reprezintă un mod de a crea un Series în Pandas, putem să îi oferim fie numai ceea ce reprezintă data din acel Series (iar atunci Pandas o să creze automat un index numeric și o să îl afișeze) sau putem să oferim atât datele cât și un index. Putem să creem un asfelt de obiect și din dicționarii. Pentru început să creem un dicționar

In [13]:
ages = {
    'Sam' : 5, 
    'Frank': 10,
    'Spike': 7
}

Dacă utilizăm un dicționar pentru a crea un Series în Pandas, putem să îi oferim ca și argument acest dicționar, iar Pandas este destul de intligent încât să transforme key-urile din dicționar în index, iar ceea ce este la values știe să pună ca și cum ar fi datele ce trebuie stocate în acest Series

In [14]:
pd.Series(ages)

Sam       5
Frank    10
Spike     7
dtype: int64

Această informație este utilă deoarece foarte multe librării returnează informația sub formă de dicționarii, iar prin acest procedeu este extrem de ușor să transformăm acele date într-un Series sau într-un obiect DataFrame

## Recapitulare

În cadrul acestui tutorial am învățat următoarele lucruri:

    1. Ce anume este un Series

        Un array uni-dimensional ce are în componenta lui un index (poate fi numeric sau de tipul string label)

    2. Cum creem un Series dintr-o listă de date

        my_data = [1776, 1876, 1821]

        pd.Series(data=my_data)

    3. Cum creem un Series dintr-o listă de date împreună cu o listă de index

        my_data = [1776, 1876, 1821]

        my_index = ['USA', 'Canada', 'Mexic']

        pd.Series(data=my_data, index=my_index)

    4. Cum putem creea un Series dintr-un dicționar

        pd.Series(ages)

            # transformă automat key-urile din dicționar în index și trece values ca și date în cadrul acelui Series