# Introducción a Pandas para ciencia de datos - Series.

1. Para crear una serie, primero debemos preparar  nuestro entorno virtual, donde vamos a trabajar.

En Windows
 `py -m venv env`

En Linux y Mac
`python3 -m venv env`

2. Activar el entorno virtual

En Windows
`.\env\Script\activate\`
En Linux y Mac
`source env/bin/activate`
3. Instalar Pandas

### Crear una serie
**Primero, importamos la libreria Pandas y le asignamos el alias `pd`.**

In [25]:
import pandas as pd
import random

Ahora, vamos a definir nuestra primera Series, para eso utilizaremos Series de pandas
utilizaremos este ejemplo por ahora: 

`lista = [random.randint(1,100) for i in range(10)]`

In [26]:
lista = [random.randint(1, 100) for i in range(10)]


Utilizaremos la lista aleatoria para generar nuestra primera Series

In [27]:
serie = pd.Series(lista)
print(serie)

0     8
1    99
2    46
3    71
4    87
5    40
6    90
7    79
8    46
9    62
dtype: int64


### Cambiando el index
Con los datos generados, ahora crearemos un index para los valores actuales. 
["Manzanas", "Pan", "Leche", "Huevos", "Arroz", "Pollo", "Tomates", "Aceite de oliva", "Queso", "Café"]

In [37]:
lista = [random.randint(1, 100) for i in range(10)]
index =["Manzanas", "Pan", "Leche", "Huevos", "Arroz", "Pollo", "Tomates", "Aceite de oliva", "Queso", "Café"]
serie = pd.Series(lista, index=index)
print(serie)

Manzanas           89
Pan                54
Leche              62
Huevos             91
Arroz              15
Pollo              55
Tomates            18
Aceite de oliva    85
Queso              61
Café               74
dtype: int64


### Crear series a partir de Diccionarios

En este caso las key tomaran el valor del index de las series, utilizaremos este ejemplo para mostrarlo

notas = {"matematicas":60, "lengua":20, "historia":0 }

In [29]:
nota ={"matematicas":40,"lengua":30}


## Metodos Básicos


### Acceder a los primeros 5 elementos
Con el metodo `head()` podemos acceder a los primeros 5 elementos, tambien podemos especificarle la cantidad que queremos observar. 

In [30]:
print(serie.head())

Manzanas    94
Pan         67
Leche       63
Huevos      31
Arroz       80
dtype: int64


### Acceder a los ultimos elementos
Con el metodo `tail()` podemos ver los ultimos registros. (pasarle un indice si se requiere, de lo contrario solo seran 5 al igual que head)

In [31]:
print(serie.tail())

Pollo              30
Tomates            55
Aceite de oliva    58
Queso              96
Café               40
dtype: int64


### Obtener valores maximos, minimos, promedio, desviacion estandar y media

Para ello, utilizaremos los siguientes metodos: 
* max() <- valor máximo.
* min() <- valor mínimo. 
* mean() <- valor promedio.
* std()  <- obtener desviacion estandar
* median() obtener la media

In [32]:

#max
print("max",serie.max())
#min
print("min",serie.min())
#promedio
print("promedio",serie.mean())
#desviacion standar
print("desviacion estandar",serie.std())
#obtener la media
print("media",serie.median())

max 96
min 30
promedio 61.4
desviacion estandar 23.71216284244579
media 60.5


### Aplicar condiciones
Podemos filtrar valores utilizando condiciones

In [38]:
result = serie[4]>30
print(result)

False


  result = serie[4]>30


Podemos mejorar los resultados utilizando la siguiente estructura: 

`serie[serie condicion valor]`

In [39]:
serie[serie<30]

Arroz      15
Tomates    18
dtype: int64

### Operaciones Básicas con Series en Pandas

Las Series en pandas permiten realizar operaciones matemáticas y lógicas de manera sencilla. Algunas de las operaciones básicas son:



**Suma, Resta, Multiplicación y División**:
    Puedes realizar operaciones aritméticas directamente entre Series o con valores escalares.

    Ejemplo:
    ```python
    nueva_series + 10  # Suma 10 a cada elemento de la Series
    nueva_series * 2   # Multiplica cada elemento por 2
    ```

In [40]:
lista = [random.randint(1, 100) for i in range(10)]
lista2 = [random.randint(1, 100) for i in range(10)]

print('suma',lista+10)
print('resta',lista-10)


TypeError: can only concatenate list (not "int") to list


**Operaciones entre Series**:
    Si tienes dos Series con índices compatibles, puedes realizar operaciones entre ellas.

    Ejemplo:
    ```python
    nueva_series + materias  # Combina valores de ambas Series según sus índices
    ```

**NOTA: en caso de que al sumar las series sean de diferentes tamaños, es decir, que los indices no coincidan, el resultado de los valores incorrectos sera NaN**

**NOTA2: las sumas se hacen teniendo en cuenta el indice! no las posiciones en las que se muestran**

In [None]:
lista = [random.randint(1, 100) for i in range(10)]
lista2 = [random.randint(1, 100) for i in range(10)]

index =["Manzanas", "Pan", "Leche", "Huevos", "Arroz", "Pollo", "Tomates", "Aceite de oliva", "Queso", "Café"]
serie= pd.Series(lista,index=index)
serie2= pd.Series(lista2,index=index)
result= serie+serie2
print(result)

### Propiedades fundamentales de las series.

serie.size -> devuelve el numero de elementos de una serie

serie.index -> devuelve una lista con los nombres de las filas (tambien valido para dataframes)

serie.dtype ->  devuelve el tipo de datos de los elementos de la serie