## Desafío 1: Generación de funciones

Genere funciones para calcular la media y varianza de un vector. Debe cumplir con los
siguientes requistos:

Ambas funciones deben ingresar un argumento x .

Las funciones deben contener docstrings con la documentación asociada a la variable.

Deben retornar el resultado (tip: utilice return ).

La función de la varianza debe llamar a la función de la media.
Utilice las funciones para reportar la información sobre goles_favor , goles_contra ,
puntos .

In [27]:
import pandas as pd
import numpy as np
import math

def media(vector):
    """
    Función que realiza el calculo de la media

    Parameters:
    vector (<Series>): Vector al cual se le realizará el calculo de la media

    Returns:
    float: Retorna el valor de la media

   """ 
    media = np.mean(vector)

    return media


def varianza(vector):
    """
    Función que realiza el calculo de la varianza

    Parameters:
    vector (<Series>): Vector al cual se le realizará el calculo de la varianza

    Returns:
    float: Retorna el valor de la varianza

   """ 
    varianza = 0
    res_media = media(vector)
    
    for elemento_vector in vector:
        varianza += (elemento_vector - res_media) ** 2
    
    varianza = varianza / float(len(vector))
    
    return varianza

    

df = pd.read_csv('worldcup2014.csv')
df.head()

# Calculo de media de los goles_favor
media_goles_favor = media(df['goles_favor'])
print('La media de los goles a favor es {}'.format(media_goles_favor))
# Calculo de media de los goles_contra
media_goles_contra = media(df['goles_contra'])
print('La media de los goles en contra es {}'.format(media_goles_contra))
# Calculo de media de los puntos
media_puntos = media(df['puntos'])
print('La media de los puntos es {}'.format(media_puntos))


# Calculo de la varianza de los goles_favor
varianza_goles_favor = varianza(df['goles_favor'])
print('La varianza de los goles a favor es {}'.format(varianza_goles_favor))
# Calculo de la varianza de los goles_favor
varianza_goles_contra = varianza(df['goles_contra'])
print('La varianza de los goles en contra es {}'.format(varianza_goles_contra))
# Calculo de la varianza de los goles_favor
varianza_puntos = varianza(df['puntos'])
print('La varianza de los puntos es {}'.format(varianza_puntos))


La media de los goles a favor es 4.25
La media de los goles en contra es 4.25
La media de los puntos es 4.21875
La varianza de los goles a favor es 5.1875
La varianza de los goles en contra es 4.8125
La varianza de los puntos es 8.0458984375


## Desafío 2:

A continuación se presenta el siguiente código para obtener la media y varianza de una variable para
distintos continentes:

```
    continent = []
    store_mean = []
    store_std = []

    for d in [africa_df, europe_df, asia_df, northamerica_df, southamerica_df]:
        continent.append(d.iloc[0,1])
        store_mean.append(media(d['goles_favor']))
        store_std.append(varianza(d['goles_favor']))
    tmp = pd.DataFrame({'continente': continent,'media_goles': store_mean,'std_goles': store_std})
    tmp
```    

En base a la información disponible, genere una función con los argumentos group_by y var para ingresar una lista de submuestras y una variable a analizar, respectivamente.

* La función debe retornar un DataFrame .
* Implemente la función para extraer la información sobre la cantidad de goles a favor, en contra y la cantidad de puntos.
* Reporte en qué continente se encuentra la mayor cantidad de goles a favor, en contra y cantidad de puntos.

In [82]:
def calculo_media_varianza(group_by,var):
    """
    Función que realiza el calculo de la media, varianza y desviacion estandar de una lista de submuestras y
    una variable a analizar

    Parameters:
    vector (<lista>): Lista de submuestras
    var (str): variable a analizar

    Returns:
    <DataFrame>: Retorna el DataFrame con los valores de media, varianza y desviación en función de la variable
                 analizada

    """     
    continent = []
    store_mean = []
    store_var = []
    store_std = []

    for d in group_by:
        continent.append(d.iloc[0,1])
        store_mean.append(media(d[var]))
        store_var.append(varianza(d[var]))
        store_std.append(math.sqrt(varianza(d[var])))
    tmp = pd.DataFrame({'continente': continent,'media': store_mean,'varianza': store_var, 'desviacion_estandar': store_std})
    
    return tmp    


dfEurope = df[df['continent'] == 'europe']
dfAsia = df[df['continent'] == 'asia']
dfAfrica = df[df['continent'] == 'africa']
dfNorthAmerica = df[df['continent'] == 'northamerica']
dfSouthAmerica = df[df['continent'] == 'southamerica']

lista = [dfEurope,dfAsia,dfAfrica,dfNorthAmerica,dfSouthAmerica]
print('Calculo de goles a favor')
print(calculo_media_varianza(lista,'goles_favor'))


print('\n Calculo de goles en contra')
print(calculo_media_varianza(lista,'goles_contra'))

print('\n Calculo de puntos')
print(calculo_media_varianza(lista,'puntos'))

Calculo de goles a favor
     continente     media  varianza  desviacion_estandar
0        europe  4.769231  6.331361             2.516220
1          asia  2.250000  0.687500             0.829156
2        africa  3.600000  2.640000             1.624808
3  northamerica  3.250000  1.687500             1.299038
4  southamerica  5.666667  3.888889             1.972027

 Calculo de goles en contra
     continente     media  varianza  desviacion_estandar
0        europe  4.000000  3.538462             1.881080
1          asia  6.250000  3.187500             1.785357
2        africa  5.600000  3.840000             1.959592
3  northamerica  3.500000  8.250000             2.872281
4  southamerica  2.833333  0.472222             0.687184

 Calculo de puntos
     continente     media  varianza  desviacion_estandar
0        europe  4.692308  6.366864             2.523265
1          asia  0.750000  0.187500             0.433013
2        africa  2.400000  2.640000             1.624808
3  northameric

_Se puede deducir de lo anterior que:_

_Sudamérica es quien posee con mayor cantidad de goles a favor_

_Asia es el continente con mayor cantidad de goles en contra_

_Sudamérica es quien posee la mayor cantidad de puntos_


## Desafío 3: Simulaciones

Genere una función generate_pet que devuelva de forma aleatoria un string 'perro' o 'gato' . Ejecútela un par de veces.

_tip: Puede utilizar la función np.random.choice para retornar elementos al azar._

Aplique la función generate_pet 20 veces mediante un loop y guarde los resultados en una lista.

_tip: Puede generar una lista vacía con [ ] y asignarla a un objeto. Puede añadir elementos a la lista con .append_

In [83]:
np.random.seed(2)

def generate_pet():
    """
    Función que devuelve de forma aleatoria un string 'perro' o 'gato' 

    Parameters:
    Ninguno

    Returns:
    str: Retorna el string de 'perro' o 'gato'

    """      
    pet = ['perro','gato']
    resultado = np.random.choice(a = pet)
    return resultado

# Ejecutando un par de veces la funcion 
print('Ejecutando un par de veces la funcion ')
print(generate_pet())
print(generate_pet())

lista_pet = []
for i in range(0,20):
    resultado_pet = generate_pet()
    lista_pet.append(resultado_pet)
    
    
print('\n Resultados de la lista')
print(lista_pet)

Ejecutando un par de veces la funcion 
perro
gato

 Resultados de la lista
['gato', 'perro', 'perro', 'gato', 'perro', 'gato', 'perro', 'gato', 'perro', 'gato', 'gato', 'gato', 'gato', 'gato', 'gato', 'gato', 'perro', 'perro', 'perro', 'perro']


* ¿Cuál es la probabilidad de elegir un perro al azar? ¿Y un gato?

_La probabilidad se define el numero de resultados favorables entre el número de resultados posibles_

In [80]:
probabilidad_gato = lista_pet.count("gato") / len(lista_pet)
print('La probabilidad de aparecer gato es de {}'.format(probabilidad_gato))
print('\n')
probabilidad_perro = lista_pet.count("perro") / len(lista_pet)
print('La probabilidad de aparecer perro es de {}'.format(probabilidad_perro))

La probabilidad de aparecer gato es de 0.55


La probabilidad de aparecer perro es de 0.45


* Agrege np.random.seed(2) al inicio del chunk. ¿Qué hace éste método en la simulación?

_Cuando establece la semilla y se vuelve a ejecutar el código cada vez, se obtendrán los mismos números. Obteniendo números pseudo aleatorios_

## Desafío 4: Función simuladora

Genere un método llamado simulate_pets_prob que tome como argumento un número finito de simulaciones a generar.

El método debe simular dos situaciones young_pet y old_pet , y contar la ocurrencia de los siguientes casos:

* De los dos animales simulados, contar las ocasiones donde por lo menos uno de los animales sea un perro.
* De los dos animales simulados, contar las ocasiones donde por lo menos uno sea un perro viejo.
* De los dos animales simulados, contar las ocasiones donde los dos sean perros
* El método debe tener una semilla pseudoaleatoria de 1.


In [165]:
def simulate_pets_prob(numero):
    """
    El método debe simular dos situaciones young_pet y old_pet , y contar la ocurrencia
    debe contar con una semilla pseudoaleatoria de 1

    Parameters:
    numero (int): numero de simulaciones a realizar

    Returns:
    str: Retorna un str con la cantidad de ocaciones

    """  
    
    np.random.seed(1)
    
    pet = ['perro','gato']
    lista_young_pet = []
    lista_old_pet = []

    contar_ocasiones_uno_perro = 0
    contar_ocasiones_uno_perro_viejo = 0
    contar_ocasiones_ambos_perros = 0
    for i in range(0,numero):
        young_pet = np.random.choice(a = pet)
        old_pet = np.random.choice(a = pet)
        lista_young_pet.append(young_pet)
        lista_old_pet.append(old_pet)
        
        if (young_pet == 'perro' or old_pet == 'perro'):
            contar_ocasiones_uno_perro += 1
        if (old_pet == 'perro'):
            contar_ocasiones_uno_perro_viejo += 1
        if (young_pet == 'perro' and old_pet == 'perro'):
            contar_ocasiones_ambos_perros += 1
        
    print(lista_young_pet)
    print(lista_old_pet)
    
    print('Contar las ocasiones donde por lo menos uno de los dos animales es un perro: {}'.format(contar_ocasiones_uno_perro))
    print('Contar las ocasiones donde por lo menos uno de los dos animales es un perro viejo: {}'.format(contar_ocasiones_uno_perro_viejo))
    print('Contar las ocasiones donde los dos sean perros {}'.format(contar_ocasiones_ambos_perros))
    
    return contar_ocasiones_uno_perro, contar_ocasiones_uno_perro_viejo, contar_ocasiones_ambos_perros
    
numero_simulaciones = 10    
contar_ocasiones_uno_perro, contar_ocasiones_uno_perro_viejo, contar_ocasiones_ambos_perros = simulate_pets_prob(numero_simulaciones)  

['gato', 'perro', 'gato', 'gato', 'gato', 'perro', 'perro', 'gato', 'perro', 'perro']
['gato', 'perro', 'gato', 'gato', 'perro', 'gato', 'gato', 'perro', 'gato', 'perro']
Contar las ocasiones donde por lo menos uno de los dos animales es un perro: 7
Contar las ocasiones donde por lo menos uno de los dos animales es un perro viejo: 4
Contar las ocasiones donde los dos sean perros 2


* De los tres escenarios, ¿Cuál es el menos probable? ¿Cuál es el más probable?

In [169]:
probabilidad_uno_de_los_perros = contar_ocasiones_uno_perro / numero_simulaciones
print('La probabilidad de que por lo menos uno de los dos animales es un perro {}'.format(probabilidad_uno_de_los_perros))
print('\n')
probabilidad_uno_de_los_perros_viejo = contar_ocasiones_uno_perro_viejo / numero_simulaciones
print('La probabilidad de que por lo menos uno de los dos animales es un perro viejo {}'.format(probabilidad_uno_de_los_perros_viejo))
print('\n')
probabilidad_ambos_perros = contar_ocasiones_ambos_perros / numero_simulaciones
print('La probabilidad de que ambos animales sean perros {}'.format(probabilidad_ambos_perros))
print('\n')

La probabilidad de que por lo menos uno de los dos animales es un perro 0.7


La probabilidad de que por lo menos uno de los dos animales es un perro viejo 0.4


La probabilidad de que ambos animales sean perros 0.2




_Los escenarios anteriormente descritos se encuentran del más probable al menos probable_