# Análisis de Datos Simulados en Python

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats

np.random.seed(42)
n = 100

data = pd.DataFrame({
    'Edad': np.random.normal(30, 5, n).round(1),
    'Horas_estudio': np.random.poisson(3, n),
    'Satisfaccion': np.random.choice(['Baja', 'Media', 'Alta'], size=n, p=[0.2, 0.5, 0.3]),
    'Genero': np.random.choice(['Masculino', 'Femenino'], size=n),
    'Calificacion': np.random.normal(80, 10, n).clip(0, 100).round(1)
})
data.head()

## Estadísticas Descriptivas

In [None]:
data.describe()

## Visualizaciones

In [None]:
plt.figure(figsize=(12, 8))

plt.subplot(2, 2, 1)
sns.histplot(data['Edad'], bins=10, kde=True)
plt.title('Distribución de Edad')

plt.subplot(2, 2, 2)
sns.boxplot(x='Genero', y='Calificacion', data=data)
plt.title('Calificación por Género')

plt.subplot(2, 2, 3)
sns.countplot(x='Satisfaccion', data=data, order=['Baja', 'Media', 'Alta'])
plt.title('Niveles de Satisfacción')

plt.subplot(2, 2, 4)
sns.scatterplot(x='Edad', y='Calificacion', data=data)
plt.title('Edad vs Calificación')

plt.tight_layout()
plt.show()

## Correlación entre Edad y Calificación

In [None]:
corr, p_value = stats.pearsonr(data['Edad'], data['Calificacion'])
print(f'Coeficiente de correlación: {corr:.2f}')
print(f'Valor p: {p_value:.4f}')