In [None]:
import sys
sys.path.append('..') 
from src.data_loader import load_covid_data
from src.eda import perform_eda

data = load_covid_data()
results = perform_eda(data)


Gráfico de Casos Totales por Estado:

Este gráfico será un diagrama de barras que muestra:

En el eje X: Los estados de EE.UU.
En el eje Y: El número total de casos positivos de COVID-19.

Características del gráfico:

Título: "Casos totales de COVID-19 por estado"
Eje X etiquetado como "Estado"
Eje Y etiquetado como "Casos totales"
Las barras estarán ordenadas de mayor a menor número de casos.
Cada barra representa un estado.
La altura de cada barra indica el número total de casos en ese estado.

Lo que podrá ver en este gráfico:

Qué estados han sido más afectados por la pandemia en términos de casos totales.
La disparidad en el número de casos entre diferentes estados.
Posiblemente, patrones regionales (por ejemplo, si estados vecinos tienden a tener niveles similares de casos).

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import requests
from datetime import datetime

# Configuración de Matplotlib para mostrar gráficos en el notebook
%matplotlib inline

sns.set_theme(style="whitegrid")
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 12


# 1. Análisis de la tasa de positividad por estado
def positivity_rate_analysis(df):
    df['positivity_rate'] = df['positive'] / df['totalTestResults'] * 100
    latest_data = df.sort_values('date').groupby('state').last().reset_index()
    
    plt.figure(figsize=(15, 8))
    sns.barplot(x='state', y='positivity_rate', data=latest_data.sort_values('positivity_rate', ascending=False))
    plt.title('Tasa de Positividad por Estado (Último Día Registrado)')
    plt.xlabel('Estado')
    plt.ylabel('Tasa de Positividad (%)')
    plt.xticks(rotation=90)
    plt.show()

positivity_rate_analysis(df)


In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import requests
from datetime import datetime

# Configuración de Matplotlib para mostrar gráficos en el notebook
%matplotlib inline

sns.set_theme(style="whitegrid")
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 12

# 2. Evolución de hospitalizaciones a lo largo del tiempo
def hospitalization_trend(df):
    daily_hospitalizations = df.groupby('date')['hospitalizedCurrently'].sum().reset_index()
    
    plt.figure(figsize=(15, 8))
    plt.plot(daily_hospitalizations['date'], daily_hospitalizations['hospitalizedCurrently'])
    plt.title('Evolución de Hospitalizaciones en EE.UU.')
    plt.xlabel('Fecha')
    plt.ylabel('Número de Hospitalizaciones')
    plt.xticks(rotation=45)
    plt.show()

hospitalization_trend(df)

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import requests
from datetime import datetime

# Configuración de Matplotlib para mostrar gráficos en el notebook
%matplotlib inline

sns.set_theme(style="whitegrid")
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 12

# 3. Comparación de la tasa de mortalidad entre estados
def mortality_rate_comparison(df):
    latest_data = df.sort_values('date').groupby('state').last().reset_index()
    latest_data['mortality_rate'] = latest_data['death'] / latest_data['positive'] * 100
    
    plt.figure(figsize=(15, 8))
    sns.scatterplot(x='positive', y='mortality_rate', data=latest_data)
    plt.title('Tasa de Mortalidad vs Casos Totales por Estado')
    plt.xlabel('Casos Totales')
    plt.ylabel('Tasa de Mortalidad (%)')
    
    for i, row in latest_data.iterrows():
        plt.annotate(row['state'], (row['positive'], row['mortality_rate']))
    
    plt.show()

mortality_rate_comparison(df)

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import requests
from datetime import datetime

# Configuración de Matplotlib para mostrar gráficos en el notebook
%matplotlib inline

sns.set_theme(style="whitegrid")
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 12

# 4. Análisis de la capacidad de pruebas a lo largo del tiempo
def testing_capacity_analysis(df):
    daily_tests = df.groupby('date')['totalTestResultsIncrease'].sum().reset_index()
    
    plt.figure(figsize=(15, 8))
    plt.plot(daily_tests['date'], daily_tests['totalTestResultsIncrease'])
    plt.title('Capacidad Diaria de Pruebas en EE.UU.')
    plt.xlabel('Fecha')
    plt.ylabel('Número de Pruebas Realizadas')
    plt.xticks(rotation=45)
    plt.show()

testing_capacity_analysis(df)

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import requests
from datetime import datetime

# Configuración de Matplotlib para mostrar gráficos en el notebook
%matplotlib inline

sns.set_theme(style="whitegrid")
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 12

# 5. Relación entre pruebas realizadas y casos positivos
def test_vs_positive_correlation(df):
    df['positivity_rate'] = df['positive'] / df['totalTestResults'] * 100
    
    plt.figure(figsize=(12, 8))
    sns.scatterplot(x='totalTestResults', y='positive', hue='positivity_rate', data=df, palette='viridis')
    plt.title('Relación entre Pruebas Realizadas y Casos Positivos')
    plt.xlabel('Total de Pruebas Realizadas')
    plt.ylabel('Casos Positivos')
    plt.colorbar(label='Tasa de Positividad (%)')
    plt.show()

test_vs_positive_correlation(df)