<a href="https://colab.research.google.com/github/WellcomePeujio/Analisis-de-Ingresos-Mensuales-en-una-Empresa/blob/main/An%C3%A1lisis_de_Ingresos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Análisis de Ingresos Mensuales en una Empresa


Una empresa desea analizar los ingresos mensuales de sus empleados para obtener una visión clara de la distribución salarial. A continuación, se presentan los ingresos mensuales (en miles de pesos) de diez trabajadores de la empresa:

| Trabajador | Ingreso Mensual (X) |
|------------|---------------------|
| 1          | 35                  |
| 2          | 42                  |
| 3          | 38                  |
| 4          | 45                  |
| 5          | 50                  |
| 6          | 40                  |
| 7          | 55                  |
| 8          | 48                  |
| 9          | 37                  |
| 10         | 46                  |

## Preguntas

1. **Calcula la media, mediana y moda** de los ingresos mensuales.
2. **Calcula la varianza, desviación estándar y coeficiente de variación** para analizar la dispersión de los ingresos.

# Cálculo Matemático
## Datos

Los ingresos mensuales de los trabajadores, en miles de pesos, son:

$$
X = [35, 42, 38, 45, 50, 40, 55, 48, 37, 46]
$$

## 1. Cálculo de la Media

La **media** se calcula como:

$$
\bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i
$$

Sustituyendo los valores:

$$
\bar{X} = \frac{35 + 42 + 38 + 45 + 50 + 40 + 55 + 48 + 37 + 46}{10} = \frac{436}{10} = 43.6 \text{ miles de pesos}
$$

## 2. Cálculo de la Mediana

Primero, ordenamos los datos:

$$
[35, 37, 38, 40, 42, 45, 46, 48, 50, 55]
$$

La mediana es el valor central. Como hay 10 valores (número par), la mediana se calcula como el promedio de los dos valores centrales:

$$
\text{Mediana} = \frac{42 + 45}{2} = \frac{87}{2} = 43.5 \text{ miles de pesos}
$$

## 3. Cálculo de la Varianza

La **varianza** se calcula como:

$$
\sigma^2 = \frac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^2
$$

Primero, calculamos la diferencia de cada valor respecto a la media, la elevamos al cuadrado y luego sumamos:

\[
\begin{aligned}
(35 - 43.6)^2 & = (-8.6)^2 = 73.96 \\
(42 - 43.6)^2 & = (-1.6)^2 = 2.56 \\
(38 - 43.6)^2 & = (-5.6)^2 = 31.36 \\
(45 - 43.6)^2 & = (1.4)^2 = 1.96 \\
(50 - 43.6)^2 & = (6.4)^2 = 40.96 \\
(40 - 43.6)^2 & = (-3.6)^2 = 12.96 \\
(55 - 43.6)^2 & = (11.4)^2 = 129.96 \\
(48 - 43.6)^2 & = (4.4)^2 = 19.36 \\
(37 - 43.6)^2 & = (-6.6)^2 = 43.56 \\
(46 - 43.6)^2 & = (2.4)^2 = 5.76 \\
\end{aligned}
\]

Sumamos estos valores:

$$
\sum (X_i - \bar{X})^2 = 73.96 + 2.56 + 31.36 + 1.96 + 40.96 + 12.96 + 129.96 + 19.36 + 43.56 + 5.76 = 362.4
$$

Finalmente, dividimos por el número total de datos (\( n = 10 \)):

$$
\sigma^2 = \frac{362.4}{10} = 36.24 \text{ miles de pesos}^2
$$

## 4. Cálculo de la Desviación Estándar

La **desviación estándar** es la raíz cuadrada de la varianza:

$$
\sigma = \sqrt{36.24} = 6.02 \text{ miles de pesos}
$$

## 5. Cálculo del Coeficiente de Variación

El **coeficiente de variación** se calcula como:

$$
CV = \frac{\sigma}{\bar{X}} \times 100
$$

Sustituyendo los valores:

$$
CV = \frac{6.02}{43.6} \times 100 \approx 13.80\%
$$

---

### Resultados:

- **Media:** 43.6 miles de pesos
- **Mediana:** 43.5 miles de pesos
- **Varianza:** 36.24 miles de pesos^2
- **Desviación Estándar:** 6.02 miles de pesos
- **Coeficiente de Variación:** 13.80%

In [None]:
import numpy as np
from scipy import stats
import matplotlib.pyplot as plt

# Datos
ingresos = np.array([35, 42, 38, 45, 50, 40, 55, 48, 37, 46])

# 1. Cálculo de Medidas Centrales

# a) Media
media = np.mean(ingresos)
print(f"Media: {media} miles de pesos")

# b) Mediana
mediana = np.median(ingresos)
print(f"Mediana: {mediana} miles de pesos")

# c) Moda
moda_resultado = stats.mode(ingresos, keepdims=True)
moda = moda_resultado.mode[0]
moda_frecuencia = moda_resultado.count[0]

if moda_frecuencia > 1:
    print(f"Moda: {moda} miles de pesos, con frecuencia {moda_frecuencia}")
else:
    print("No hay moda definida, todos los valores son únicos.")

# 2. Cálculo de Medidas de Dispersión

# a) Varianza
varianzea = np.var(ingresos, ddof=0)
print(f"Varianza: {varianza} (miles de pesos)^2")

# b) Desviación Estándar
desviacion_estandar = np.std(ingresos, ddof=0)
print(f"Desviación Estándar: {desviacion_estandar} miles de pesos")

# c) Coeficiente de Variación
cv = (desviacion_estandar / media) * 100
print(f"Coeficiente de Variación: {cv}%")

# Generar una figura al final

# Histograma de los ingresos
plt.figure(figsize=(10, 6))
plt.hist(ingresos, bins=5, color='skyblue', edgecolor='black', alpha=0.7)

# Línea de la media
plt.axvline(media, color='red', linestyle='dashed', linewidth=2, label=f'Media: {media}')

# Sombreado de la desviación estándar
plt.axvline(media - desviacion_estandar, color='orange', linestyle='dashed', linewidth=2, label=f'-1σ: {media - desviacion_estandar:.2f}')
plt.axvline(media + desviacion_estandar, color='orange', linestyle='dashed', linewidth=2, label=f'+1σ: {media + desviacion_estandar:.2f}')

# Sombreado de la varianza
plt.axvspan(media - desviacion_estandar, media + desviacion_estandar, color='orange', alpha=0.2, label='1σ intervalo')

# Línea de la mediana
plt.axvline(mediana, color='green', linestyle='dashed', linewidth=2, label=f'Mediana: {mediana}')

plt.title('Distribución de Ingresos Mensuales con Desviación Estándar')
plt.xlabel('Ingresos (miles de pesos)')
plt.ylabel('Frecuencia')
plt.legend()
plt.grid(True)
plt.show()