| **Inicio** | **atrás 16** | **Siguiente 18** |
|----------- |-------------- |---------------|
| [🏠](../../README.md) | [⏪](./16.Filtrado_de_Datos.ipynb)| [⏩](./18.Relaciones_Estadisticas.ipynb)|

# **17. Series de Pandas**

## **Introducción a las Series**

Las Series de Pandas son estructuras de datos unidimensionales que pueden contener cualquier tipo de datos, incluyendo números, cadenas de texto y objetos. Las Series son parte de la librería de Pandas en Python, y se utilizan comúnmente para trabajar con datos tabulares y en análisis de datos.

Un ejemplo de una Serie de Pandas podría ser una lista de temperaturas diarias registradas en una estación meteorológica. Supongamos que tenemos la siguiente lista de temperaturas:

In [2]:
temperaturas = [25, 27, 26, 23, 24, 28, 29]
import pandas as pd

serie_temperaturas = pd.Series(temperaturas)
serie_temperaturas

0    25
1    27
2    26
3    23
4    24
5    28
6    29
dtype: int64

## **Creación y manipulación de Series**

In [8]:
import pandas as pd


A continuación, podemos crear una Serie utilizando la función ```pd.Series()```. Podemos pasar una lista o un diccionario como argumento:

In [9]:
# Crear una Serie a partir de una lista
lista = [10, 20, 30, 40, 50]
serie_lista = pd.Series(lista)
print(serie_lista)

# Crear una Serie a partir de un diccionario
diccionario = {'a': 10, 'b': 20, 'c': 30, 'd': 40, 'e': 50}
serie_diccionario = pd.Series(diccionario)
print(serie_diccionario)


0    10
1    20
2    30
3    40
4    50
dtype: int64
a    10
b    20
c    30
d    40
e    50
dtype: int64


Podemos acceder a los elementos de una Serie utilizando la notación de corchetes ```[]``` y el índice correspondiente:

In [10]:
print(serie_lista[0])  # Imprime 10
print(serie_diccionario['c'])  # Imprime 30


10
30


También podemos realizar operaciones aritméticas con las Series:

In [11]:
serie_suma = serie_lista + serie_diccionario
print(serie_suma)


0   NaN
1   NaN
2   NaN
3   NaN
4   NaN
a   NaN
b   NaN
c   NaN
d   NaN
e   NaN
dtype: float64


Podemos utilizar diferentes funciones de agregación para calcular estadísticas de una Serie:

In [12]:
print(serie_lista.mean())  # Imprime el promedio de la Serie
print(serie_diccionario.max())  # Imprime el valor máximo de la Serie


30.0
50


Además, podemos aplicar funciones a los elementos de una Serie utilizando la función ```apply()```:

In [13]:
serie_cuadrado = serie_lista.apply(lambda x: x**2)
print(serie_cuadrado)


0     100
1     400
2     900
3    1600
4    2500
dtype: int64


## **Atributos de las Series y acceso a sus valores**

Las Series de Pandas tienen varios atributos útiles que nos permiten obtener información sobre la estructura y los datos de la Serie. Algunos de los atributos más comunes son los siguientes:

* values: devuelve los valores de la Serie en forma de un arreglo NumPy.
* index: devuelve los índices de la Serie en forma de un objeto Index de Pandas.
* dtype: devuelve el tipo de datos de la Serie.
* name: devuelve el nombre de la Serie.

In [14]:
import pandas as pd

# Crear una Serie
datos = [10, 20, 30, 40, 50]
serie = pd.Series(datos, name='mis_datos')

# Obtener los valores de la Serie
print(serie.values)  # Imprime [10 20 30 40 50]

# Obtener los índices de la Serie
print(serie.index)  # Imprime RangeIndex(start=0, stop=5, step=1)

# Obtener el tipo de datos de la Serie
print(serie.dtype)  # Imprime int64

# Obtener el nombre de la Serie
print(serie.name)  # Imprime mis_datos


[10 20 30 40 50]
RangeIndex(start=0, stop=5, step=1)
int64
mis_datos


Para acceder a los valores de una Serie, podemos utilizar la notación de corchetes ```[]``` y el índice correspondiente. También podemos utilizar el método ```loc[]``` para acceder a los valores utilizando los nombres de los índices y el método ```iloc[]``` para acceder a los valores utilizando los índices numéricos. Veamos algunos ejemplos:

In [15]:
import pandas as pd

# Crear una Serie
datos = [10, 20, 30, 40, 50]
indices = ['a', 'b', 'c', 'd', 'e']
serie = pd.Series(datos, index=indices)

# Acceder al valor correspondiente al índice 'c'
print(serie['c'])  # Imprime 30

# Acceder al valor correspondiente al índice numérico 2
print(serie.iloc[2])  # Imprime 30

# Acceder a los valores correspondientes a los índices 'b' y 'd'
print(serie.loc[['b', 'd']])  # Imprime b    20, d    40, dtype: int64


30
30
b    20
d    40
dtype: int64


## **Métodos básicos comunes**

Las Series de Pandas tienen muchos métodos que pueden ser útiles para el análisis de datos. A continuación, se muestran algunos de los métodos más comunes:

* ```head(n)```: devuelve los primeros n elementos de la Serie.
* ```tail(n)```: devuelve los últimos n elementos de la Serie.
* ```describe()```: devuelve estadísticas descriptivas de la Serie, como la media, la desviación estándar, el valor mínimo, el valor máximo, etc.
* ```value_counts()```: cuenta la frecuencia de cada valor único en la Serie.
* ```sort_values()```: ordena la Serie por valor.
* ```sort_index()```: ordena la Serie por índice.
* ```dropna()```: elimina los valores nulos de la Serie.
* ```fillna(valor)```: rellena los valores nulos de la Serie con un valor específico.
* ```astype(tipo)```: convierte los valores de la Serie a un tipo de datos específico.
* ```apply(funcion)```: aplica una función a cada elemento de la Serie.
* ```map(diccionario)```: reemplaza los valores de la Serie utilizando un diccionario.
* ```unique()```: devuelve los valores únicos de la Serie.

Veamos algunos ejemplos de estos métodos:

In [18]:
import pandas as pd

# Crear una Serie
datos = [10, 20, 30, 40, 50, 30, 20, 10, None]
serie = pd.Series(datos)

# Obtener los primeros 3 elementos de la Serie
print(serie.head(3))  # Imprime 0    10.0, 1    20.0, 2    30.0, dtype: float64

# Obtener las estadísticas descriptivas de la Serie
print(serie.describe())  # Imprime count     8.000000, mean     27.500000, std      15.055453, ...

# Contar la frecuencia de cada valor único en la Serie
print(serie.value_counts())  # Imprime 30.0    2, 20.0    2, 50.0    1, ...

# Ordenar la Serie por valor
print(serie.sort_values())  # Imprime 7    10.0, 0    20.0, 6    20.0, 2    30.0, ...

# Eliminar los valores nulos de la Serie
print(serie.dropna())  # Imprime 0    10.0, 1    20.0, 2    30.0, 3    40.0, 4    50.0, ...

# Rellenar los valores nulos de la Serie con el valor 0
print(serie.fillna(0))  # Imprime 0    10.0, 1    20.0, 2    30.0, 3    40.0, 4    50.0, ...

# Aplicar la función lambda x: x**2 a cada elemento de la Serie
print(serie.apply(lambda x: x**2))  # Imprime 0     100.0, 1     400.0, 2     900.0, ...

# Reemplazar los valores de la Serie utilizando un diccionario
diccionario = {10: 'A', 20: 'B', 30: 'C', 40: 'D', 50: 'E'}
print(serie.map(diccionario))  # Imprime 0    A, 1    B, 2    C, 3    D, 4    E, 5    C, 6    B, 7    A, 8    NaN, dtype: object


0    10.0
1    20.0
2    30.0
dtype: float64
count     8.00000
mean     26.25000
std      14.07886
min      10.00000
25%      17.50000
50%      25.00000
75%      32.50000
max      50.00000
dtype: float64
10.0    2
20.0    2
30.0    2
40.0    1
50.0    1
dtype: int64
0    10.0
7    10.0
1    20.0
6    20.0
2    30.0
5    30.0
3    40.0
4    50.0
8     NaN
dtype: float64
0    10.0
1    20.0
2    30.0
3    40.0
4    50.0
5    30.0
6    20.0
7    10.0
dtype: float64
0    10.0
1    20.0
2    30.0
3    40.0
4    50.0
5    30.0
6    20.0
7    10.0
8     0.0
dtype: float64
0     100.0
1     400.0
2     900.0
3    1600.0
4    2500.0
5     900.0
6     400.0
7     100.0
8       NaN
dtype: float64
0      A
1      B
2      C
3      D
4      E
5      C
6      B
7      A
8    NaN
dtype: object


## **Operaciones vectoriales aritméticas**

In [19]:
import pandas as pd

# Crear dos Series
serie1 = pd.Series([10, 20, 30, 40])
serie2 = pd.Series([5, 10, 15, 20])

# Sumar las dos Series
print(serie1 + serie2)  # Imprime 0    15, 1    30, 2    45, 3    60, dtype: int64

# Restar las dos Series
print(serie1 - serie2)  # Imprime 0     5, 1    10, 2    15, 3    20, dtype: int64

# Multiplicar las dos Series
print(serie1 * serie2)  # Imprime 0     50, 1    200, 2    450, 3    800, dtype: int64

# Dividir las dos Series
print(serie1 / serie2)  # Imprime 0    2.000000, 1    2.000000, 2    2.000000, 3    2.000000, dtype: float64


0    15
1    30
2    45
3    60
dtype: int64
0     5
1    10
2    15
3    20
dtype: int64
0     50
1    200
2    450
3    800
dtype: int64
0    2.0
1    2.0
2    2.0
3    2.0
dtype: float64


## **Funciones de estadística y de agregación básicas**

In [20]:
import pandas as pd

# Crear una Serie con valores enteros
serie = pd.Series([10, 20, 30, 40, 50])

# Obtener la media de la Serie
media = serie.mean()
print(media)  # Imprime 30.0

# Obtener la mediana de la Serie
mediana = serie.median()
print(mediana)  # Imprime 30.0

# Obtener la desviación estándar de la Serie
desv_est = serie.std()
print(desv_est)  # Imprime 15.811388300841896

# Obtener el valor mínimo de la Serie
minimo = serie.min()
print(minimo)  # Imprime 10

# Obtener el valor máximo de la Serie
maximo = serie.max()
print(maximo)  # Imprime 50

# Obtener la suma acumulada de la Serie
suma_acum = serie.cumsum()
print(suma_acum)  # Imprime 0    10, 1    30, 2    60, 3    100, 4    150, dtype: int64


30.0
30.0
15.811388300841896
10
50
0     10
1     30
2     60
3    100
4    150
dtype: int64


| **Inicio** | **atrás 16** | **Siguiente 18** |
|----------- |-------------- |---------------|
| [🏠](../../README.md) | [⏪](./16.Filtrado_de_Datos.ipynb)| [⏩](./18.Relaciones_Estadisticas.ipynb)|