# ü´Ä Heart Disease Prediction - Setup & Configuration

Celda de inicializaci√≥n para mejorar la visualizaci√≥n y configuraci√≥n de Jupyter notebooks.
Ejecuta esta celda al inicio de cada notebook para obtener mejor apariencia y utilidades.

In [None]:
# Configuraci√≥n de Jupyter
import warnings
warnings.filterwarnings('ignore')

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from IPython.display import display, HTML, Markdown

# Configurar estilo de pandas
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 100)
pd.set_option('display.float_format', '{:.4f}'.format)
pd.set_option('display.width', None)

# Configurar matplotlib y seaborn
%matplotlib inline
%config InlineBackend.figure_format = 'retina'

plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette("husl")

# Tama√±o de figuras
plt.rcParams['figure.figsize'] = (14, 6)
plt.rcParams['font.size'] = 10
plt.rcParams['lines.linewidth'] = 2

print("‚úÖ Configuraci√≥n completada")
print(f"NumPy version: {np.__version__}")
print(f"Pandas version: {pd.__version__}")
print(f"Matplotlib version: {plt.matplotlib.__version__}")
print(f"Seaborn version: {sns.__version__}")

## Funciones √ötiles para An√°lisis

Colecci√≥n de funciones auxiliares para exploraci√≥n y visualizaci√≥n de datos.

In [None]:
def info_dataset(df):
    """
    Proporciona informaci√≥n completa sobre un DataFrame.
    
    Args:
        df: pandas DataFrame
    """
    print(f"üìä Dataset Shape: {df.shape}")
    print(f"\nüìã Tipos de datos:")
    print(df.dtypes)
    print(f"\n‚ùå Valores faltantes:")
    missing = df.isnull().sum()
    missing_pct = (df.isnull().sum() / len(df) * 100).round(2)
    missing_df = pd.DataFrame({
        'Faltantes': missing,
        'Porcentaje': missing_pct
    })
    print(missing_df[missing_df['Faltantes'] > 0])
    print(f"\nüìà Estad√≠sticas:")
    print(df.describe())

def plot_correlation(df, figsize=(12, 10)):
    """
    Visualiza matriz de correlaci√≥n con heatmap.
    
    Args:
        df: pandas DataFrame
        figsize: tama√±o de figura (ancho, alto)
    """
    plt.figure(figsize=figsize)
    correlation_matrix = df.corr(numeric_only=True)
    mask = np.triu(np.ones_like(correlation_matrix, dtype=bool))
    sns.heatmap(correlation_matrix, mask=mask, annot=True, fmt='.2f', 
                cmap='coolwarm', center=0, square=True, 
                linewidths=1, cbar_kws={"shrink": 0.8})
    plt.title('Matriz de Correlaci√≥n', fontsize=14, fontweight='bold')
    plt.tight_layout()
    plt.show()

def plot_missing_values(df):
    """
    Visualiza distribuci√≥n de valores faltantes.
    
    Args:
        df: pandas DataFrame
    """
    missing = df.isnull().sum()
    missing = missing[missing > 0].sort_values(ascending=False)
    
    if len(missing) > 0:
        fig, ax = plt.subplots(figsize=(10, 6))
        missing.plot(kind='barh', ax=ax, color='coral')
        ax.set_xlabel('Cantidad de Valores Faltantes')
        ax.set_title('Valores Faltantes por Caracter√≠stica', fontweight='bold')
        plt.tight_layout()
        plt.show()
    else:
        print("‚úÖ No hay valores faltantes")

def compare_distributions(df, column, title=None):
    """
    Visualiza distribuci√≥n de una variable con histogram y KDE.
    
    Args:
        df: pandas DataFrame
        column: nombre de la columna
        title: t√≠tulo personalizado (opcional)
    """
    fig, axes = plt.subplots(1, 2, figsize=(14, 5))
    
    # Histogram
    axes[0].hist(df[column].dropna(), bins=30, color='skyblue', edgecolor='black', alpha=0.7)
    axes[0].set_xlabel(column)
    axes[0].set_ylabel('Frecuencia')
    axes[0].set_title(f'Histograma: {column}')
    
    # KDE
    df[column].dropna().plot(kind='density', ax=axes[1], color='darkblue', linewidth=2)
    axes[1].fill_between(axes[1].get_lines()[0].get_xdata(), 
                         axes[1].get_lines()[0].get_ydata(), alpha=0.3)
    axes[1].set_xlabel(column)
    axes[1].set_title(f'Densidad (KDE): {column}')
    
    if title:
        fig.suptitle(title, fontsize=14, fontweight='bold', y=1.02)
    
    plt.tight_layout()
    plt.show()

def print_section(title, level=1):
    """
    Imprime una secci√≥n con formato.
    
    Args:
        title: texto de la secci√≥n
        level: nivel de encabezado (1-6)
    """
    display(Markdown(f"{'#' * level} {title}"))

def print_info(text, style='info'):
    """
    Imprime texto con estilo HTML.
    
    Args:
        text: texto a mostrar
        style: 'success', 'warning', 'error', 'info'
    """
    colors = {
        'success': '#28a745',
        'warning': '#ffc107',
        'error': '#dc3545',
        'info': '#17a2b8'
    }
    color = colors.get(style, '#17a2b8')
    display(HTML(f'<div style="background-color: {color}20; border-left: 4px solid {color}; padding: 10px; margin-bottom: 10px;"><b>{text}</b></div>'))

print("‚úÖ Funciones √∫tiles cargadas y disponibles")