# Medidas de Tendencia Central

Las medidas de tendencia central son estadísticas que describen el valor central típico en un conjunto de datos. Estas medidas nos ayudan a identificar el punto medio alrededor del cual se agrupan los datos. Las tres medidas de tendencia central más comunes son la media, la mediana y la moda.

## La Media

La media, también conocida como promedio, es una medida de tendencia central que se calcula sumando todos los valores en un conjunto de datos y dividiendo el total por el número de valores. La fórmula para la media $\bar{x}$ de un conjunto de datos $x_1, x_2, \ldots, x_n$ es:

$$ \bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i $$

A continuación, se muestra cómo calcular la media en Python utilizando un ciclo `for` y una lista de alturas simuladas de personas.


In [None]:
# Lista de alturas en centímetros
heights = [172, 168, 155, 180, 170, 175, 165, 169, 173, 162, 177, 178, 165, 158, 174, 171, 159, 167, 176, 161, 165, 172, 165]

# Inicializar la suma de las alturas
sum_heights = 0

# Calcular la suma de todas las alturas
for height in heights:
    sum_heights += height

# Calcular la media
mean_height = sum_heights / len(heights)

# Imprimir la media
print("La media de las alturas es:", mean_height)

## La Mediana

La mediana es una medida de tendencia central que representa el valor central de un conjunto de datos cuando estos están ordenados de menor a mayor. Es el número que se encuentra en el medio de la lista, de manera que la mitad de los valores son menores que él y la otra mitad son mayores.

Para calcular la mediana:
1. Ordena los datos de menor a mayor.
2. Si el número de datos es impar, la mediana es el valor que está exactamente en la mitad de la lista.
3. Si el número de datos es par, la mediana es el promedio de los dos valores que están en el centro de la lista.

La mediana es útil porque no se ve afectada por valores extremadamente altos o bajos, a diferencia de la media.

In [None]:
# Lista de alturas en centímetros
heights = [172, 168, 155, 180, 170, 175, 165, 169, 173, 162, 177, 178, 165, 158, 174, 171, 159, 167, 176, 161, 165, 172, 165]

# Ordenar la lista de alturas
sorted_heights = sorted(heights)

# Calcular la mediana
n = len(sorted_heights)
if n % 2 == 1:
    # Si el número de elementos es impar, la mediana es el valor central
    median_height = sorted_heights[n // 2]
else:
    # Si el número de elementos es par, la mediana es el promedio de los dos valores centrales
    median_height = (sorted_heights[n // 2 - 1] + sorted_heights[n // 2]) / 2

# Imprimir la mediana
print("La mediana de las alturas es:", median_height)

## La Moda

La moda es una medida de tendencia central que indica el valor que aparece con mayor frecuencia en un conjunto de datos. A diferencia de la media y la mediana, la moda puede ser usada tanto para datos numéricos como categóricos. En algunos conjuntos de datos, puede haber más de una moda (multimodal) si varios valores se repiten con la misma frecuencia.

Para calcular la moda:
1. Cuenta la frecuencia de cada valor en el conjunto de datos.
2. Identifica el valor que tiene la mayor frecuencia.

La moda es especialmente útil para datos categóricos, donde queremos saber cuál es la categoría más común.

In [None]:
# Lista de alturas en centímetros
heights = [172, 168, 155, 180, 170, 175, 165, 169, 173, 162, 177, 178, 165, 158, 174, 171, 159, 167, 176, 161, 165, 172, 165]

# Inicializar un diccionario para contar la frecuencia de cada altura
frequency = {}

# Contar la frecuencia de cada altura
for height in heights:
    if height in frequency:
        frequency[height] += 1
    else:
        frequency[height] = 1

# Identificar la moda
max_frequency = max(frequency.values())
modes = []
for key, value in frequency.items():
    if value == max_frequency:
        modes.append(key)

# Imprimir la moda
print("La(s) moda(s) de las alturas es(son):", modes)

## Uso de Bibliotecas para Medidas de Tendencia Central

En Python, existen bibliotecas que ya tienen implementadas funciones para calcular medidas de tendencia central como la media, la mediana y la moda. Estas bibliotecas simplifican el proceso de cálculo y son muy útiles para trabajar con conjuntos de datos grandes y complejos. Una de las bibliotecas más comunes es `statistics`.

La biblioteca `statistics` en Python proporciona funciones predefinidas para calcular la media, mediana y moda de manera eficiente. A continuación, se muestra un ejemplo de cómo utilizar estas funciones para calcular las medidas de tendencia central de un conjunto de datos de edades.

In [None]:
import statistics

# Lista de alturas en centímetros
heights = [172, 168, 155, 180, 170, 175, 165, 169, 173, 162, 177, 178, 165, 158, 174, 171, 159, 167, 176, 161, 165, 172, 165]

# Calcular la media
mean_height = statistics.mean(heights)

# Calcular la mediana
median_height = statistics.median(heights)

# Calcular la moda
mode_height = statistics.mode(heights)

print(f"Mean: {mean_height}")
print(f"Median: {median_height}")
print(f"Mode: {mode_height}")

## Distribución de Datos

La distribución de datos describe cómo se dispersan o agrupan los valores de un conjunto de datos. Nos muestra la frecuencia con la que ocurren diferentes valores y nos ayuda a entender el patrón general de los datos. Una de las formas más comunes de visualizar la distribución de datos es mediante un histograma.

Un histograma es un gráfico de barras que representa la frecuencia de diferentes rangos de valores en un conjunto de datos. Cada barra en el histograma muestra cuántos valores del conjunto de datos caen dentro de un rango específico. Esto nos permite ver de manera visual cómo están distribuidos los datos, identificar valores típicos, y detectar la presencia de valores extremos o atípicos.

Por ejemplo, si tenemos un conjunto de datos que representa las alturas de personas, un histograma nos mostrará cuántas personas tienen alturas dentro de ciertos intervalos (por ejemplo, cuántas personas miden entre 160-165 cm, 165-170 cm, etc.).

A continuación, se muestra cómo crear un histograma en Python utilizando la biblioteca `matplotlib`.

In [None]:
import matplotlib.pyplot as plt

# Lista de alturas en centímetros
heights = [160, 172, 168, 155, 180, 170, 175, 165, 169, 173, 162, 177, 178, 165, 158, 174, 171, 159, 167, 176, 161, 165, 172, 165]

# Crear el histograma
plt.hist(heights, bins=10, edgecolor='black')

# Añadir títulos y etiquetas
plt.title('Distribución de Alturas')
plt.xlabel('Altura (cm)')
plt.ylabel('Frecuencia')

# Mostrar el histograma
plt.show()