# Curso de Manipulación y Análisis de Datos con Pandas y Python

## Temas
* Como crear series
* Como indexar series
* Como extraer valores de las series
* Como crear diccionarios
* Como extraer valores de los diccionarios
* Como convertir diccionarios en series
* Qué es una variable no definida y nula


## Introducción

In [1]:
# importar librerias
import pandas as pd
import numpy as np

### Serie

La serie es un conjunto de elementos de datos ordenados

In [2]:
# crear el primer elemento con el metodo Series
# con la serie puedo crear una lista
pd.Series([10,8,4,45,6])

0    10
1     8
2     4
3    45
4     6
dtype: int64

In [3]:
# asignar los valores de la serie a una variable
sr = pd.Series([10,8,4,45,6])
# visualizar los valores de la variable
sr

0    10
1     8
2     4
3    45
4     6
dtype: int64

In [5]:
# conocer las propiedades de una variable con el metodo: values
sr.values

array([10,  8,  4, 45,  6])

In [6]:
# obtener el índice que compone la serie con el método: index
sr.index

RangeIndex(start=0, stop=5, step=1)

In [7]:
# dimensionar la serie con el método: shape
# dimensionar significa saber la dimensión o tamaño de la seria, cuantas columnas por cuantos renglones
sr.shape

(5,)

In [8]:
# para llamar o extraer un elemento de la serie, se usan los []
# extraer el valor en el índice 3
sr[3]

45

In [9]:
# extraer varios elementos. Se usan dobles []
sr[[0,4,2]]

0    10
4     6
2     4
dtype: int64

### Indexación

In [10]:
# definir un nuevo índice con el método: index
# se obtiene una serie con un sistema de índices regido por letras. El anterio índice está determinado por números.
# nota, al realizar el cambio de indice es imporante que la cantidad de indices nuevos corresponda
# con la cantidad de indices anteriores
# para este ejemplo, son 5 índices, comenzando desde el 0 y terminando en el 4
sr = pd.Series([10,8,4,45,6], index = ['a','b','c','d','e'])
sr


a    10
b     8
c     4
d    45
e     6
dtype: int64

## Diccionario

Es la estructura de datos en Python que permite almacenar cadenas de cualquier tipo de dato.

In [11]:
# crear un diccionario con verbos irregulares en inglés
irregular_verbs = {
    "base form" : "arise",
    "past" : "arose",
    "participle": "arisen"
}
# visualizar el diccionario
irregular_verbs
# convertir a dataframe
#dt_iv = pd.DataFrame(irregular_verbs)

{'base form': 'arise', 'past': 'arose', 'participle': 'arisen'}

In [12]:
# extraer el valor de las keys
irregular_verbs.keys()

dict_keys(['base form', 'past', 'participle'])

In [13]:
# extraer el valor de una key determinada
irregular_verbs['past']

'arose'

Las API's tienen archivos de tipo JSON que son muy parecidos a los diccionarios.

In [14]:
# convertir el diccionario a una serie de pandas
pd.Series(irregular_verbs)

base form      arise
past           arose
participle    arisen
dtype: object

En el ejemplo anterior, se observa que el índice está definido por los valores contenidos en las llaves, base form, past, y participle.

In [15]:
# cambiar la indexación
pd.Series(irregular_verbs, index = ['base form', 'past', 'adverb'])

base form    arise
past         arose
adverb         NaN
dtype: object

* Se observa que al crear un nuevo índice, muestra un valor como NaN, el cual indica que desconoce ese valor. 
* Además, ya nose agregó el índice participle y por lo tanto, no lo agregó

### Trabajar con valores nulos NaN

In [23]:
# 1. asignar la serie a una variable
sr = pd.Series(irregular_verbs, index = ['base form', 'past', 'adverb'])

In [24]:
# 2. aplicar la funcion isnull
sr.isnull()
# La funcion isnull indica True cuando encuentra un valor NaN

base form    False
past         False
adverb        True
dtype: bool

In [26]:
# funcion notnull
sr.notnull()
# Esta función indica True cuando encuentra valores no NaN

base form     True
past          True
adverb       False
dtype: bool