In [None]:
#PARTE 3
#CARGAR DATOS
import pandas as pd
covid_anuales = pd.DataFrame()
for anio in range(2021,2023):
  for j in range(1,13):
    mes = f"{j:02d}"
    for i in range(1,32):
      dia = f"{i:02d}"
      download_url = f"https://raw.githubusercontent.com/CSSEGISandData/COVID-19/refs/heads/master/csse_covid_19_data/csse_covid_19_daily_reports/{mes}-{dia}-{anio}.csv"
      try:
        aux = pd.read_csv(download_url)
        covid_anuales = pd.concat([covid_anuales,aux],ignore_index=True)
        print(f'{dia}-{mes}-{anio} Descargado Correctamente')
      except Exception as e:
        print(f"El mes {mes} no tiene {dia} dias en el año {anio}")

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import glob


global_daily = covid_anuales.groupby("Last_Update")[["Confirmed", "Deaths", "Recovered", "Active"]].sum()

fig, axes = plt.subplots(4, 1, figsize=(16, 18), sharex=True)
fig.suptitle("Evolución temporal global COVID-19 (Escala Logarítmica)", fontsize=16)

axes[0].plot(global_daily.index, global_daily["Confirmed"], label="Confirmados", color='blue')
axes[0].set_ylabel("Casos Confirmados (Log)")
axes[0].set_yscale("log")
axes[0].legend()
axes[0].grid(True, which="both", linestyle="--", alpha=0.7)

axes[1].plot(global_daily.index, global_daily["Active"], label="Activos", color='orange')
axes[1].set_ylabel("Casos Activos (Log)")
axes[1].set_yscale("log")
axes[1].legend()
axes[1].grid(True, which="both", linestyle="--", alpha=0.7)

axes[2].plot(global_daily.index, global_daily["Deaths"], label="Fallecidos", color='red')
axes[2].set_ylabel("Fallecidos (Log)")
axes[2].set_yscale("log")
axes[2].legend()
axes[2].grid(True, which="both", linestyle="--", alpha=0.7)

axes[3].plot(global_daily.index, global_daily["Recovered"], label="Recuperados", color='green')
axes[3].set_ylabel("Recuperados (Log)")
axes[3].set_xlabel("Fecha")
axes[3].legend()
axes[3].grid(True, which="both", linestyle="--", alpha=0.7)

plt.tight_layout(rect=[0, 0.03, 1, 0.96])
plt.show()

In [None]:
#2. Comparativa Top 10 países con más casos confirmados (barras).
top10 = covid_anuales.groupby("Country_Region")["Confirmed"].sum().sort_values(ascending=False).head(10)

plt.figure(figsize=(10,6))
plt.bar(top10.index, top10.values)
plt.xticks(rotation=45, ha="right")

plt.title("Top 10 países con más casos confirmados (2021–2022)")
plt.xlabel("País")
plt.ylabel("Casos confirmados")
plt.tight_layout()
plt.show()

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

columnas_relevantes = ['Confirmed', 'Deaths', 'Active', 'Case_Fatality_Ratio']

correlationes = covid_anuales[columnas_relevantes].dropna()

matriz_corr = correlationes.corr()

plt.figure(figsize=(8, 6))
sns.heatmap(matriz_corr, annot=True, cmap='coolwarm')
plt.title('Heatmap de Correlaciones')
plt.show()

In [None]:
%pip install country_converter

In [None]:
# import seaborn as sns
# import matplotlib.pyplot as plt
# import pandas as pd
# import country_converter as coco
# import warnings
# import logging # <--- Necesario para controlar los logs

# # 1. CONFIGURACIÓN PARA SILENCIAR EL RUIDO
# # Silenciar warnings de Pandas/Python
# warnings.filterwarnings('ignore')

# # SILENCIAR WARNINGS DE COUNTRY_CONVERTER (Esta es la parte clave)
# # Le decimos al logger de 'country_converter' que solo nos avise si hay ERRORES graves,
# # ignorando las advertencias (WARNINGS) de "not found".
# logging.getLogger('country_converter').setLevel(logging.ERROR)

# # --- Tu código de procesamiento ---

# # Estandarizar nombres de países para consistencia
# country_name_standardization = {
#     "US": "United States",
#     "Korea, North": "North Korea",
#     "Korea, South": "South Korea",
#     "Taiwan*": "Taiwan"
# }

# # Asumiendo que 'covid_anuales' ya está cargado anteriormente.
# # Si no, asegúrate de tener el dataframe cargado antes de este punto.
# # Ejemplo: covid_anuales = pd.read_csv(...)

# covid_anuales['Country_Region'] = covid_anuales['Country_Region'].replace(country_name_standardization)

# # Asegurarse de que 'Case_Fatality_Ratio' es numérico y manejar valores no válidos
# covid_anuales['Case_Fatality_Ratio'] = pd.to_numeric(covid_anuales['Case_Fatality_Ratio'], errors='coerce')

# # Usar country_converter para obtener los continentes
# # Al haber silenciado el logger arriba, el parámetro not_found=None funcionará silenciosamente
# if 'Continent' not in covid_anuales.columns or (covid_anuales['Continent'] == 'Other').sum() > len(covid_anuales) * 0.05:
#     covid_anuales['Continent'] = coco.convert(names=covid_anuales['Country_Region'], to='continent', not_found=None)
#     covid_anuales['Continent'] = covid_anuales['Continent'].fillna('Other')
# else:
#     pass

# # Calcular la media de la tasa de letalidad por continente, excluyendo NaN
# lethal_rate_by_continent = covid_anuales.groupby('Continent')['Case_Fatality_Ratio'].mean().dropna().sort_values(ascending=False)

# # Crear el gráfico de barras horizontales
# plt.figure(figsize=(12, 8))
# lethal_rate_by_continent.plot(kind='barh', color='skyblue')
# plt.title('Tasa de Letalidad Promedio por Continente (2021-2022)')
# plt.xlabel('Tasa de Letalidad Promedio (%)')
# plt.ylabel('Continente')
# plt.grid(axis='x', linestyle='--', alpha=0.7)
# plt.tight_layout()
# plt.show()

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import country_converter as coco
import warnings
import logging

# 1. CONFIGURACIÓN DE SILENCIO (Igual que antes)
warnings.filterwarnings('ignore')
logging.getLogger('country_converter').setLevel(logging.ERROR)

# --- Procesamiento Optimizado ---

# Estandarizar nombres
country_name_standardization = {
    "US": "United States",
    "Korea, North": "North Korea",
    "Korea, South": "South Korea",
    "Taiwan*": "Taiwan"
}
# Asumiendo que covid_anuales ya está cargado
covid_anuales['Country_Region'] = covid_anuales['Country_Region'].replace(country_name_standardization)
covid_anuales['Case_Fatality_Ratio'] = pd.to_numeric(covid_anuales['Case_Fatality_Ratio'], errors='coerce')

# 2. EL TRUCO DE VELOCIDAD: Mapeo de Únicos
if 'Continent' not in covid_anuales.columns or (covid_anuales['Continent'] == 'Other').sum() > len(covid_anuales) * 0.05:
    # Paso A: Obtener solo los nombres únicos de países (son pocos, ~200)
    unique_countries = covid_anuales['Country_Region'].unique()

    # Paso B: Convertir solo esa lista pequeña (esto tarda milisegundos)
    # Usamos src='regex' por defecto, o dejamos que la librería adivine
    continents_list = coco.convert(names=unique_countries, to='continent', not_found=None)

    # Paso C: Crear un diccionario {País: Continente}
    country_to_continent_map = dict(zip(unique_countries, continents_list))

    # Paso D: Aplicar el diccionario a la columna entera (Pandas hace esto instantáneo)
    covid_anuales['Continent'] = covid_anuales['Country_Region'].map(country_to_continent_map)

    # Rellenar nulos
    covid_anuales['Continent'] = covid_anuales['Continent'].fillna('Other')

    print("Conversión terminada.")

# 3. GRAFICAR
lethal_rate_by_continent = covid_anuales.groupby('Continent')['Case_Fatality_Ratio'].mean().dropna().sort_values(ascending=False)

plt.figure(figsize=(12, 8))
lethal_rate_by_continent.plot(kind='barh', color='skyblue')
plt.title('Tasa de Letalidad Promedio por Continente (2021-2022)')
plt.xlabel('Tasa de Letalidad Promedio (%)')
plt.ylabel('Continente')
plt.grid(axis='x', linestyle='--', alpha=0.7)
plt.tight_layout()
plt.show()

In [None]:
#5. Mapa o gráfico geográfico que muestre la incidencia por continente o país (opcional).
import sys
!{sys.executable} -m pip install plotly

In [None]:
import plotly.express as px

covid_anuales['Last_Update'] = pd.to_datetime(covid_anuales['Last_Update'])

covid_anuales.dropna(subset=['Last_Update'], inplace=True)

latest_data = covid_anuales.sort_values('Last_Update').drop_duplicates(subset=['Country_Region'], keep='last')

confirmed_cases_by_country = latest_data.groupby('Country_Region')['Confirmed'].sum().reset_index()

fig = px.choropleth(
    confirmed_cases_by_country,
    locations='Country_Region',
    locationmode='country names',
    color='Confirmed',
    hover_name='Country_Region',
    color_continuous_scale=px.colors.sequential.Plasma,
    title='Casos de covid confirmados por pais'
    )

fig.show()

In [None]:
# --- Al final de tu código de la Parte 3 ---

# Guardamos el archivo listo para que el Dashboard lo pueda leer
print("Guardando archivo para el Dashboard...")
covid_anuales.to_csv('covid_final_dashboard.csv', index=False)
print("¡Archivo 'covid_final_dashboard.csv' guardado con éxito!")