# Modulo de métricas
### metricas.py

# Resumen

En otro fichero, llamado `metricas.py`, recogeremos funciones para el cálculo de métricas de un dataset como la varianza, AUC, y la entropía. Además de esto se añaden funciones para el cálculo de correlación e información mutua. Por último, también se añaden plots para el AUC.

## `ROCcalc`

### Descripción
Dado un fichero file, un separador para las columnas sep y si estan los encabezados de las columnas en la primera fila, devuelve un dataframe con la información del fichero

### Parámetros
    df: dataframe de dos columnas, siendo la segunda de ellas un vector logico
### Devuelve
Un dataframe con los TPR y los FPR.

## `ROC`

### Descripción
Dado un dataframe devuelve el area bajo la curva ROC que se genera.
### Parámetros
    df: Un dataframe de dos columnas siendo la segunda de ellas un vector logico.
### Devuelve
El area bajo la cuerva ROC.
### Ejemplos

In [3]:
from entregapack import metricas as met
import numpy as np
import pandas as pd

sample_arr = [True, False]
bool_arr = np.random.choice(sample_arr, size=100)
a = list(range(1,101))
df = pd.DataFrame({'Nombre' : a,
                    'Bool' : bool_arr}, columns=['Nombre', 'Bool'])
area = met.ROC(df)

## `ROC_plot`

### Descripción
Dado un dataframe muestra la curva ROC que se genera.
### Parámetros
    df: dataframe que contiene el TPR y el FPR

### Ejemplos

In [None]:
met.ROC_plot(df)

## `informacion_mutua`

### Descripción
Calcula la información mutua para dos vectores.

### Parámetros
        x: vector con valores discretos
        y: vector con valores discretos

### Devuelve
La informacion mutua entre x e y.

### Ejemplos

In [5]:
c1 = ['casa', 'coche', 'autobus']
c2 = ['extintor', 'avion', 'gasolinera']
met.informacion_mutua(c1, c2)

1.584962500721156


## `informacion_mutua_df`

### Descripción
Calcula la información mutua entre todas las columnas del dataframe y las devuelve en un dataframe.
### Parámetros
df: Un dataframe con valores discretos.
### Devuelve
Un data frame con la informacion mutua.
### Ejemplos

In [6]:
df2 = pd.DataFrame({'frase': ['estas', 'como', 'no se', 'estas'],
                'letras': ['a', 'b', 'c', 'd'],
                'logic': [True, False, True, True],
                'num': [3, 7, 96, 7]})
met.informacion_mutua_df(df2)

Unnamed: 0,frase,letras,logic,num
0,2.0,1.5,1.018797,1.0
1,1.5,2.0,0.811278,1.5
2,1.018797,0.811278,1.433834,0.311278
3,1.0,1.5,0.311278,2.0


## `varianza`

### Descripción
Calcula la varianza de un vector.
### Parámetros
x: Un vector con valores numericos.
### Devuelve
La varianza de x.
### Ejemplos

In [13]:
v = [1., 5.3, 8., 45., 23., 74.]
met.varianza(v)

292.04541666666665

## `varianza_df`

### Descripción
Calcula la varianza por columnas de un dataframe
### Parámetros
        df: Un dataframe con valores numericos
### Devuelve
La varianza por columnas del dataframe.
### Ejemplos

In [8]:
df1 = pd.DataFrame({'frase': [2,5,9,6],
                     'letras': [56,45,78,23],
                     'logic': [8,4,9,1],
                     'num': [3, 7, 96, 7]})
met.varianza_df(df1)

0    454.921875
1    279.171875
2    985.500000
3     66.921875
dtype: float64

## `correlacion_pearson`

### Descripcion
Calcula la correlacion de pearson para dos vectores.
### Parámetros
        x: vector con valores numericos.
        y: vector con valores numericos.
### Devuelve
La correlación entre los dos vectores.

### Ejemplos

In [14]:
v1 = [9.1, 86.3, 54.2, 37., 13., 8.]
met.correlacion_pearson(v, v1)

TypeError: can't multiply sequence by non-int of type 'list'

## `correlacion_pearson_df`

### Descripcion
Calcula la correlacion de pearson para un datafram
### Parámetros
        df: dataframe con valores numericos
### Devuelve
La correlación entre los vectores del dataframe.

### Ejemplos

In [10]:
met.correlacion_pearson_df(df1)

Unnamed: 0,frase,letras,logic,num
frase,1.010101,0.464207,0.088254,0.868201
letras,0.464207,1.925926,1.858924,1.126195
logic,0.088254,1.858924,1.975904,0.878284
num,0.868201,1.126195,0.878284,1.079512


## `normalize`

### Descripcion
Dado un vector lo normaliza
### Parámetros
        vec: vector a normalizar
### Devuelve
Un vector normalizado

### Ejemplos

In [None]:
met.normalize(v)

## `normalize_df`

### Descripcion
Dado un dataframe lo normaliza las columnas
### Parámetros
        df: dataframe numerico a normalizar
### Devuelve
Un vector normalizado

### Ejemplos

In [None]:
met.normalize_df(df1)

## `entropy`

### Descripcion
Dado un vector calcula su entropia
### Parámetros
        x: vector numerico
### Devuelve
La entropia del vector

### Ejemplos

In [None]:
met.entropy(v)

## `entropy_df`

### Descripcion
Dado un dataframe calcula su entropia por columnas
### Parámetros
        df: dataframe numerico
### Devuelve
La entropía de las columnas del dataframe

### Ejemplos

In [None]:
met.entropy_df(df2)