# Análisis Exploratorio de Datos: Costos de la Calidad

Este análisis explora la estructura y comportamiento de los costos asociados a la gestión de la calidad, incluyendo prevención, evaluación y fallas internas y externas.

## 1. Carga de Datos desde Google Colab

In [None]:
from google.colab import files
uploaded = files.upload()
import pandas as pd
import io
df = pd.read_csv(io.BytesIO(uploaded['CostosCalidad.csv']))
df.head()

## 2. Análisis Exploratorio de Datos

In [None]:

df.info()
df.describe()
df.isnull().sum()
df.duplicated().sum()

import matplotlib.pyplot as plt
import seaborn as sns
sns.set(style='whitegrid')

# Gráfico de líneas de cada tipo de costo
df.plot(x='Mes', y=['Costo Prevención', 'Costo Evaluación', 'Costo Fallas Internas', 'Costo Fallas Externas'], marker='o', figsize=(12,6))
plt.title('Evolución de Costos de Calidad')
plt.xticks(rotation=45)
plt.ylabel('Costo ($)')
plt.grid(True)
plt.show()

# Boxplot para cada tipo de costo
df_melt = df.melt(id_vars='Mes', var_name='Tipo de Costo', value_name='Valor')
sns.boxplot(data=df_melt, x='Tipo de Costo', y='Valor')
plt.title('Distribución de Tipos de Costos de Calidad')
plt.xticks(rotation=45)
plt.show()

# Participación porcentual mensual de cada tipo de costo
df_percent = df.copy()
cost_columns = ['Costo Prevención', 'Costo Evaluación', 'Costo Fallas Internas', 'Costo Fallas Externas']
df_percent[cost_columns] = df_percent[cost_columns].div(df_percent[cost_columns].sum(axis=1), axis=0) * 100
df_percent.set_index('Mes')[cost_columns].plot(kind='bar', stacked=True, figsize=(12,6))
plt.title('Participación Porcentual de Costos de Calidad')
plt.ylabel('%')
plt.xticks(rotation=45)
plt.legend(loc='upper right')
plt.show()

# Correlaciones entre tipos de costos
sns.heatmap(df[cost_columns].corr(), annot=True, cmap='coolwarm')
plt.title('Correlaciones entre Tipos de Costos')
plt.show()
