# Medidas de tendencia central.
Las medidas de tendencia central son cantidades que están asociadas a los valores ubicados en la parte central de una distribución de frecuencias.

El valor medio que va a sustituir al total de valores observados, debe ser representativo del conjunto de datos, reflejando la tendencia central de tales valores.

Entre las medidas de tendencia central más comunes tenemos:
- Media aritmética o media.
- Media aritmética ponderada.
- La mediana.
- La moda.


# Media aritmetica

La media se define como la suma de los valores de los datos dividida entre el tamaño *n* de la muestra.

**Ejemplo**: Se fundieron 5 focos después de haber durado, respetivamente, 867, 849, 840, 852 y 822 horas de uso continuo. Determinar el tiempo promedio de uso que tienen los focos.

In [1]:
#Importamos las librerias que usaremos: 
import pandas as pd
from statistics import mean, median, mode

In [2]:
#Traemos la tabla "focos.csv" a nuestro entorno de trabjo
data_fr = pd.read_csv('./focos.csv')
data_fr.head()

Unnamed: 0,Numero Foco,Tiempo duracion
0,1,867
1,2,849
2,3,840
3,4,852
4,5,822


In [3]:
#Capturamos la columna "Tiempo duracion" en una lista

tiempo = data_fr["Tiempo duracion"]

#print(mean(tiempo))

#for i in tiempo:
  #print(i) #Mostramos por pantalla la lista "tiempo"

846


In [4]:
#Calculamos la media aritmecia, para ello necesitamos el numero total de datos
num_datos = len (tiempo)

#Realizamos la suma de los datos contenidos en la lista:
suma = 0
for i in tiempo:
  suma = suma + i

media_aritmetica = suma/num_datos
print(f"La media aritmetica es: {media_aritmetica}")

La media aritmetica es: 846.0


# Media aritmética ponderada.

La utilizamos cuando a cada numero se le asocian ciertos factores o pesos, los cuales dependen de la importancia de cada uno de los números.

Ejemplo: Las puntuaciones finales de un estudiante en Matemáticas, Física, Química e Inglés son, respectivamente: **84,86,90 y 70**, estos valores se almacenan en la lista llamada "calificaciones".

Si la importancia que se asigna a estas asignaturas son: 3, 5, 3, y 2, respectivamente, determinar la media.
La importancia de las asignaturas se almacenan en la variable "pesos".

#### $X = \frac{ \sum_{i=1}^{N} W_{i}X_{i}} {\sum_{i=1}^{N} W_{i}}$

In [5]:
calificaciones = [84, 86, 90, 70]

pesos = [3, 5, 3, 2]

In [6]:
suma = 0
denominador = 0

for i in range(0,len(calificaciones)):
    suma = suma + pesos[i]*calificaciones[i]
    denominador = denominador + pesos[i]

In [7]:
media_ponderada = suma/denominador
print(f"La media ponderada es: {media_ponderada}")

La media ponderada es: 84.0


# Mediana.

La mediana es el **valor medio** de un conjunto de datos **ordenados**.

Para calcular la mediana necesitamos: 
- Ordenar el conjunto de datos.
- Determinar si la longitud del conjunto es par o impar.
  - **Impar**: La mediana es el valor medio del conjunto de datos.
  - **Par**: La mediana es la suma de los dos valores medios dividida por dos.

Ejemplo: Encontrar la mediana de los tiempos de duración de los focos.

In [8]:
# Statistis tiene una funcion llama median()

mediana = median(tiempo)
print(f"La mediana es: {mediana}")

La mediana es: 849


# Moda

La moda de un conjunto de datos se define como el valor que aparece con mayor frecuencia.

- Cuando dos valores ocurren con la misma frecuencias, y esta es la más alta, ambos valores son modas, **por lo que el conjunto de datos es bimodal.**
- Cuando son más de dos valores los que tienen la frecuencia más alta, todos son modas, **por lo que el conjunto de datos es multimodal.**
- Cuando ningún valor se repite se dice que **no hay moda.**

Ejemplo: Encontrar la moda en el siguiente conjunto de datos.

In [10]:
archivo = open("/home/jesus/clases/Estadistica4/medidas.csv", 'r')

data = []

for i in archivo:
    data.append(float(i))

moda = mode(data)
print(moda)

0.756


# Comparación entre la media y la mediana

- La media y la mediana de una distribución aproximadamente simétrica se encuentran muy cerca.

![](./images/aprox_simetrica.PNG)

- En una distribución que es exactamente simétrica, la media y la mediana coinciden.

![](./images/simetrica.PNG)

- En una distribució asimétrica la media queda desplazada hacia la cola más larga.
    - Cuando la cola apunta hacia la **izquierda**, decimos que el histograma es asimetrico a la **izquierda.**
    - Cuando la cola apunta hacia la **derecha**, decimos que el histograma es asimetrico a la **derecha.**

![](./images/asimetrica.PNG)
