In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import requests
from io import BytesIO
import zipfile

# 1. Baixar os dados de mobilidade do Google (global)
def baixar_mobilidade_google():
    url = 'https://www.gstatic.com/covid19/mobility/Global_Mobility_Report.csv'
    df = pd.read_csv(url)
    return df

# 2. Filtrar dados do Brasil e de cidades específicas
def filtrar_dados_brasil(df, cidades):
    df_br = df[df['country_region'] == 'Brazil']
    df_br = df_br[df_br['sub_region_1'].notna() & df_br['sub_region_2'].notna()]
    df_br_cidades = df_br[df_br['sub_region_2'].isin(cidades)]
    return df_br_cidades


# 3. Pré-processamento
def preprocessar_dados(df):
    df['date'] = pd.to_datetime(df['date'])
    colunas_mobilidade = [
        'retail_and_recreation_percent_change_from_baseline',
        'grocery_and_pharmacy_percent_change_from_baseline',
        'parks_percent_change_from_baseline',
        'transit_stations_percent_change_from_baseline',
        'workplaces_percent_change_from_baseline',
        'residential_percent_change_from_baseline'
    ]
    df = df[['date', 'sub_region_2'] + colunas_mobilidade]
    df = df.rename(columns={'sub_region_2': 'cidade'})
    return df

# 4. Visualização
def plotar_mobilidade(df, cidade, tipo='workplaces_percent_change_from_baseline'):
    df_cidade = df[df['cidade'] == cidade]
    plt.figure(figsize=(14, 5))
    sns.lineplot(data=df_cidade, x='date', y=tipo)
    plt.title(f'Mobilidade em {cidade} - {tipo}')
    plt.ylabel('% mudança vs baseline')
    plt.grid(True)
    plt.show()

# 5. Gráfico de Linhas Duplas para RQ1
def plotar_linhas_duplas(df_mob, df_casos, cidade):
    fig, ax1 = plt.subplots(figsize=(14, 5))

    ax1.set_xlabel('Data')
    ax1.set_ylabel('Novos Casos Confirmados', color='tab:red')
    ax1.plot(df_casos['date'], df_casos['new_confirmed'], color='tab:red', label='Novos Casos Confirmados')
    ax1.tick_params(axis='y', labelcolor='tab:red')

    ax2 = ax1.twinx()
    ax2.set_ylabel('Mudança na Mobilidade em Locais de Trabalho (%)', color='tab:blue')
    ax2.plot(df_mob['date'], df_mob['workplaces_percent_change_from_baseline'], color='tab:blue', label='Mobilidade em Locais de Trabalho')
    ax2.tick_params(axis='y', labelcolor='tab:blue')

    fig.tight_layout()
    plt.title(f'Impacto da COVID-19 na Mobilidade em Locais de Trabalho - {cidade}')
    plt.show()

# 6. Gráfico de Colunas Agrupadas para RQ2
def plotar_colunas_agrupadas(df):
    df_pico = df[(df['date'] >= '2020-03-01') & (df['date'] <= '2020-06-30')]
    
    colunas_mobilidade = [
        'parks_percent_change_from_baseline',
        'retail_and_recreation_percent_change_from_baseline',
        'transit_stations_percent_change_from_baseline',
        'residential_percent_change_from_baseline',
        'workplaces_percent_change_from_baseline'
    ]
    
    df_media_mobilidade = df_pico.groupby('cidade')[colunas_mobilidade].mean().reset_index()
    
    df_media_mobilidade.plot(x='cidade', kind='bar', figsize=(14, 7))
    
    plt.title('Variação Média da Mobilidade nas Cidades Durante o Pico da Pandemia')
    plt.ylabel('Média da Mudança na Mobilidade (%)')
    plt.xlabel('Cidade')
    plt.legend(title='Categoria de Mobilidade')
    plt.grid(True)
    plt.show()

# 7. Execução
if __name__ == '__main__':
    
    cidades = ['São Paulo', 'Rio de Janeiro', 'Belo Horizonte', 'Salvador', 'Porto Alegre']
    
    print("Baixando dados...")
    df_raw = baixar_mobilidade_google()
    
    print("Filtrando cidades...")
    df_cidades = filtrar_dados_brasil(df_raw, cidades)
    
    print("Pré-processando...")
    df_mob = preprocessar_dados(df_cidades)
    
    # visualização para RQ1
    for cidade in cidades:
        # Supondo que temos um DataFrame `df_casos` com os dados de casos confirmados por cidade e data
        # plotar_linhas_duplas(df_mob[df_mob['cidade'] == cidade], df_casos[df_casos['cidade'] == cidade], cidade)
        pass
    
    #visualização para RQ2
    plotar_colunas_agrupadas(df_mob)


Baixando dados...
