# Introducción a Pandas

****************************************************************
### <span style="color:darksalmon">SERIES:</span> 
****************************************************************

## El objeto de la serie Pandas

### ¿Qué es una Serie en Pandas?
Una Serie en Pandas es una estructura de datos unidimensional, como una lista o un array, que contiene una secuencia de valores. Cada valor en una Serie tiene asociado un índice, que es como una etiqueta para identificar ese valor. Esto hace que una Serie sea más poderosa que una lista común, ya que permite acceder a los datos tanto por su posición como por su índice.

### Características de una Serie:
- Unidimensional: A diferencia de un DataFrame (que es bidimensional), una Serie tiene una sola dimensión.
- Índice: Cada valor en una Serie tiene un índice, que puede ser numérico o personalizado.
- Tipos de datos: Una Serie puede contener cualquier tipo de datos: enteros, cadenas de texto, booleanos, etc.

Ejemplos básicos de Series en Pandas
1. <span style="color:aqua"> Crear una Serie a partir de una lista</span> <br>
La forma más simple de crear una Serie es a partir de una lista de Python:

In [6]:
import pandas as pd
data = pd.Series([0.25, 0.5, 0.75, 1.0])
data

0    0.25
1    0.50
2    0.75
3    1.00
dtype: float64

* Los números a la izquierda (0, 1, 2, 3) son el índice por defecto que Pandas asigna a los valores.
* Los valores a la derecha (0.25, 0.50, 0.75, 1.00) son los datos en la Serie.
* El tipo de dato (float64) aparece al final, indicando que todos los valores son decimales.

2. <span style="color:aqua"> Crear una Serie con un índice personalizado </span><br>
Puedes personalizar los índices de una Serie si no quieres usar el índice numérico por defecto:

In [7]:
# Crear una Serie con índices personalizados
data = [10, 20, 30, 40]
index = ['a', 'b', 'c', 'd'] #renombro el índice 
serie = pd.Series(data, index=index)
serie # Mostrar la Serie con el índice personalizado

a    10
b    20
c    30
d    40
dtype: int64

Ahora los índices son a, b, c, d en lugar de los números por defecto. Esto puede ser útil cuando los índices tienen un significado específico, como nombres de personas, fechas, categorías, etc.

3. <span style="color:aqua">Crear una Serie a partir de un diccionario </span> <br>
Otra forma de crear una Serie es a partir de un diccionario de Python. En este caso, las claves del diccionario se convierten en el índice de la Serie, y los valores del diccionario se convierten en los valores de la Serie.

In [8]:
# Crear una Serie desde un diccionario
data = {'manzanas': 10, 'bananas': 20, 'naranjas': 15}
serie = pd.Series(data)
serie # # Mostrar la Serie

manzanas    10
bananas     20
naranjas    15
dtype: int64

Explicación: Las claves del diccionario (manzanas, bananas, naranjas) se convierten en los índices de la Serie.<br>
Los valores del diccionario (10, 20, 15) son los datos de la Serie.

3. 1 Serie como diccionario especializado

De esta manera, puedes pensar en una ``Serie`` de Pandas un poco como una especialización de un diccionario de Python.
Un diccionario es una estructura que asigna claves arbitrarias a un conjunto de valores arbitrarios, y una ``Serie`` es una estructura que asigna claves escritas a un conjunto de valores escritos.
Esta escritura es importante: así como el código compilado de tipo específico detrás de una matriz NumPy lo hace más eficiente que una lista de Python para ciertas operaciones, la información de tipo de una ``Series`` de Pandas lo hace mucho más eficiente que los diccionarios de Python para ciertas operaciones. operaciones.

La analogía de ``Series`` como diccionario se puede hacer aún más clara construyendo un objeto ``Series`` directamente desde un diccionario de Python:

In [9]:
population_dict = {'California': 38332521,
                   'Texas': 26448193,
                   'New York': 19651127,
                   'Florida': 19552860,
                   'Illinois': 12882135}

In [10]:
population = pd.Series(population_dict)
population

California    38332521
Texas         26448193
New York      19651127
Florida       19552860
Illinois      12882135
dtype: int64

4. <span style="color:aqua">Acceder a elementos de una Serie</span> <br>
Al igual que con una matriz NumPy, el índice asociado puede acceder a los datos a través de la conocida notación de corchetes de Python.<br>
Puedes acceder a los elementos de una Serie de varias formas:
* Por índice (como en un diccionario).
* Por posición (como en una lista).

In [11]:
serie

manzanas    10
bananas     20
naranjas    15
dtype: int64

In [12]:
# Acceder a un elemento por su índice
print(serie['bananas'])  # Resultado: 20

20


In [13]:
population['California']

np.int64(38332521)

In [14]:
# Acceder a un elemento por su posición
print(serie[0])  # Resultado: 10

10


  print(serie[0])  # Resultado: 10


In [None]:
print(population.iloc[0]) #uso iloc para movernos dentro de la serie

38332521


Otro ejemplo:

In [None]:
data = pd.Series([0.25, 0.5, 0.75, 1.0],
                 index=['a', 'b', 'c', 'd']) #es otra forma de renombrar indices pero no se recomienda
data

a    0.25
b    0.50
c    0.75
d    1.00
dtype: float64

In [17]:
# Acceder a un elemento por su índice
print(data['b'])  

0.5


In [18]:
# Acceder a un elemento por su posición
print(data[1])  # Resultado: 10

0.5


  print(data[1])  # Resultado: 10


In [19]:
# Acceder a un elemento por su posición.
print(data.iloc[1]) 

0.5


In [20]:
# Acceder a un rango de valores
data[1:4]

b    0.50
c    0.75
d    1.00
dtype: float64

In [21]:
population

California    38332521
Texas         26448193
New York      19651127
Florida       19552860
Illinois      12882135
dtype: int64

In [None]:
population['California':'New York'] #para que nos muestre todos los valores entre los indices california y nueva york

California    38332521
Texas         26448193
New York      19651127
dtype: int64

5. <span style="color:aqua">Operaciones con Series</span> <br>
Una de las ventajas de Pandas es que puedes hacer operaciones aritméticas con Series de forma muy fácil. Por ejemplo, puedes sumar, restar, multiplicar o dividir todos los elementos de la Serie por un número:

In [23]:
serie

manzanas    10
bananas     20
naranjas    15
dtype: int64

In [24]:
# Sumar un valor a todos los elementos de la Serie
serie_suma = serie + 1 
serie_suma

manzanas    11
bananas     21
naranjas    16
dtype: int64

In [25]:
# Restar dos Series
serie_resta = serie_suma - serie
serie_resta

manzanas    1
bananas     1
naranjas    1
dtype: int64

In [26]:
# Multiplicar todos los elementos de la Serie por 2
serie_doble = serie * 2  
serie_doble

manzanas    20
bananas     40
naranjas    30
dtype: int64

6. <span style="color:aqua">Funciones útiles para Series</span> <br>
Pandas proporciona muchas funciones útiles para trabajar con Series, estos son algunos ejemplos:

In [27]:
serie

manzanas    10
bananas     20
naranjas    15
dtype: int64

In [28]:
# Sumar los valores de una Serie:
print(serie.sum()) 

45


In [29]:
# Obtener el valor máximo:
print(serie.max()) 

20


In [30]:
# Obtener la media (promedio):
print(serie.mean()) 

15.0


Resumen:

- Crear una Serie: Puedes crear una Serie a partir de listas o diccionarios, y asignar un índice personalizado.
- Acceso a datos: Puedes acceder a los datos de una Serie por su índice o su posición.
- Operaciones: Es fácil realizar operaciones matemáticas sobre Series.
- Funciones útiles: Pandas ofrece funciones como sum(), max(), mean() para analizar rápidamente los datos en una Serie.