# Análisis Estadístico del Dataset de Casas

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy.stats import anderson

In [None]:
# Leer el dataset
df = pd.read_csv('ruta_del_archivo.csv')  # Asegúrate de reemplazar 'ruta_del_archivo.csv' con la ruta correcta del archivo
df.head()

## 1. Identificación de Datos Atípicos con Boxplots

In [None]:
numeric_columns = df.select_dtypes(include=['float64', 'int64']).columns

for column in numeric_columns:
    sns.boxplot(x=df[column])
    plt.title(column)
    plt.show()

## 2. Identificación de Sesgo con Histogramas

In [None]:
for column in numeric_columns:
    sns.histplot(df[column], kde=True)
    plt.title(column)
    plt.show()

## 3. Prueba de Anderson Darling para Distribución Normal

In [None]:
for column in numeric_columns:
    result = anderson(df[column])
    if result.statistic > result.critical_values[2]:
        print(f"{column} no sigue una distribución normal")
    else:
        print(f"{column} sigue una distribución normal")

## 4. Comparación de Media y Mediana

In [None]:
for column in numeric_columns:
    mean = df[column].mean()
    median = df[column].median()
    print(f"{column} - Media: {mean}, Mediana: {median}")

## 5. Medidas de Variabilidad: Desviación Estándar e IQR

In [None]:
for column in numeric_columns:
    std = df[column].std()
    iqr = df[column].quantile(0.75) - df[column].quantile(0.25)
    print(f"{column} - Desviación estándar: {std}, IQR: {iqr}")