<a href="https://colab.research.google.com/github/Kecatoca/EjerciciosPython/blob/master/Analisis%20de%20Datos%203.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Importar las librerías
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots

# --- Función para cargar el archivo ---
def cargar_datos():
    try:
        # Intentar cargar el archivo desde una ruta predeterminada
        file_path = 'sales_data.csv'  # Nombre del archivo
        df = pd.read_csv(file_path)  # Leer archivo CSV
        print("Archivo cargado correctamente desde el entorno local.")
        return df
    except FileNotFoundError:
        print("Archivo no encontrado en el entorno local.")
        print("Por favor, carga un archivo manualmente o verifica la ruta.")

        # Proporcionar opción para cargar manualmente
        from google.colab import files
        uploaded = files.upload()
        file_path = list(uploaded.keys())[0]  # Usar el archivo cargado
        df = pd.read_csv(file_path)
        print(f"Archivo '{file_path}' cargado manualmente.")
        return df

# --- Cargar los datos ---
df = cargar_datos()

# Verificar las columnas del DataFrame
print("Columnas disponibles:", df.columns)

# Asegurarse de que la columna 'Date' esté en formato de fecha
if 'Date' in df.columns:
    df['Date'] = pd.to_datetime(df['Date'], errors='coerce')  # Convertir a formato de fecha
else:
    print("La columna 'Date' no existe en el archivo. Verifica los nombres de columna.")

# Verificar valores nulos en columnas clave existentes
columnas_clave = ['Country', 'Revenue', 'Date']
columnas_presentes = [col for col in columnas_clave if col in df.columns]
print(df[columnas_presentes].isnull().sum())

# Verificar las primeras filas para asegurarnos de que las columnas clave están bien
print(df[columnas_presentes].head())

# 1. Distribución de ventas por país
if 'Country' in df.columns:
    ventas_por_pais = df.groupby('Country')['Revenue'].sum().reset_index()
    fig1 = px.bar(
        ventas_por_pais,
        x='Country',
        y='Revenue',
        color='Country',
        title="Distribución de Ventas por País"
    )
else:
    fig1 = go.Figure()
    fig1.add_annotation(text="Columna 'Country' no disponible.", showarrow=False)

# 2. Tendencia de ventas a lo largo del tiempo
if 'Date' in df.columns:
    ventas_por_fecha = df.groupby('Date')['Revenue'].sum().reset_index()
    fig2 = px.line(
        ventas_por_fecha,
        x='Date',
        y='Revenue',
        title="Tendencia de Ventas a lo Largo del Tiempo"
    )
else:
    fig2 = go.Figure()
    fig2.add_annotation(text="Columna 'Date' no disponible.", showarrow=False)

# 3. Participación porcentual de ingresos por categoría de producto (gráfico circular)
if 'Product_Category' in df.columns:
    ingresos_por_categoria = df.groupby('Product_Category')['Revenue'].sum().reset_index()
    fig3 = px.pie(
        ingresos_por_categoria,
        names='Product_Category',
        values='Revenue',
        title="Participación de Ingresos por Categoría de Producto",
        labels={'Revenue': 'Ingresos', 'Product_Category': 'Categoría de Producto'}
    )
else:
    fig3 = go.Figure()
    fig3.add_annotation(text="Columna 'Product_Category' no disponible.", showarrow=False)

# 4. Comparación de ingresos por país a lo largo del tiempo (gráfico de líneas)
if 'Country' in df.columns and 'Date' in df.columns:
    # Filtrar para eliminar valores nulos en 'Country' y 'Revenue'
    df_country = df.dropna(subset=['Country', 'Revenue', 'Date'])

    # Agrupar los datos por País y Fecha
    ingresos_por_pais_fecha = df_country.groupby(['Country', 'Date'])['Revenue'].sum().reset_index()

    # Crear el gráfico de líneas
    fig4 = px.line(
        ingresos_por_pais_fecha,
        x='Date',
        y='Revenue',
        color='Country',
        title="Tendencia de Ingresos por País a lo Largo del Tiempo",
        labels={'Revenue': 'Ingresos', 'Country': 'País', 'Date': 'Fecha'}
    )
else:
    fig4 = go.Figure()
    fig4.add_annotation(text="Columnas necesarias no disponibles.", showarrow=False)

# Crear un dashboard con las 4 gráficas usando subplots
dashboard = make_subplots(
    rows=2, cols=2,
    subplot_titles=("Distribución de Ventas por País",
                    "Tendencia de Ventas",
                    "Participación de Ingresos por Categoría de Producto",
                    "Tendencia de Ingresos por País"),
    specs=[[{"type": "xy"}, {"type": "xy"}],  # Gráficos de barras y líneas
           [{"type": "pie"}, {"type": "xy"}]]  # Gráfico circular (pie) y gráfico de líneas
)

# Añadir las gráficas al dashboard
dashboard.add_traces(fig1.data, rows=1, cols=1)
dashboard.add_traces(fig2.data, rows=1, cols=2)
dashboard.add_traces(fig3.data, rows=2, cols=1)
dashboard.add_traces(fig4.data, rows=2, cols=2)

# Actualizar el diseño del dashboard
dashboard.update_layout(
    title="Dashboard de Ventas",
    height=800,
    width=1000,
    showlegend=True  # Habilitar leyenda para distinguir entre las diferentes regiones
)

# Mostrar el dashboard
dashboard.show()

Archivo no encontrado en el entorno local.
Por favor, carga un archivo manualmente o verifica la ruta.


Saving sales_data.csv to sales_data.csv
Archivo 'sales_data.csv' cargado manualmente.
Columnas disponibles: Index(['Date', 'Day', 'Month', 'Year', 'Customer_Age', 'Age_Group',
       'Customer_Gender', 'Country', 'State', 'Product_Category',
       'Sub_Category', 'Product', 'Order_Quantity', 'Unit_Cost', 'Unit_Price',
       'Profit', 'Cost', 'Revenue'],
      dtype='object')
Country    0
Revenue    0
Date       0
dtype: int64
     Country  Revenue       Date
0     Canada      950 2013-11-26
1     Canada      950 2015-11-26
2  Australia     2401 2014-03-23
3  Australia     2088 2016-03-23
4  Australia      418 2014-05-15
