### Protótipo de ETL para o csv (continents.csv)

In [17]:
import pandas as pd

# Configurações globais de exibição
pd.set_option('display.max_columns', None)  # mostra todas as colunas
# pd.set_option('display.max_rows', None)     # mostra todas as linhas
pd.set_option('display.width', None)        # ajusta a largura total
# pd.set_option('display.max_colwidth', None) # mostra todo o conteúdo das células

# Leitura do arquivo
raw_dataframe = pd.read_csv('../data/continents.csv', index_col=0)
all_dataframe = raw_dataframe.copy()

all_dataframe.info()

<class 'pandas.core.frame.DataFrame'>
Index: 6 entries, 0 to 5
Data columns (total 21 columns):
 #   Column                  Non-Null Count  Dtype  
---  ------                  --------------  -----  
 0   updated                 6 non-null      int64  
 1   cases                   6 non-null      int64  
 2   todayCases              6 non-null      int64  
 3   deaths                  6 non-null      int64  
 4   todayDeaths             6 non-null      int64  
 5   recovered               6 non-null      int64  
 6   todayRecovered          6 non-null      int64  
 7   active                  6 non-null      int64  
 8   critical                6 non-null      int64  
 9   casesPerOneMillion      6 non-null      float64
 10  deathsPerOneMillion     6 non-null      float64
 11  tests                   6 non-null      int64  
 12  testsPerOneMillion      6 non-null      float64
 13  population              6 non-null      int64  
 14  continent               6 non-null      object 
 15

### Renomeando colunas para pt-BR

In [18]:
# Dicionário de tradução/padronização de colunas
colunas_traducao = {
    "updated": "atualizado_em",
    "cases": "casos_total",
    "todayCases": "casos_hoje",
    "deaths": "mortes_total",
    "todayDeaths": "mortes_hoje",
    "recovered": "recuperados_total",
    "todayRecovered": "recuperados_hoje",
    "active": "casos_ativos",
    "critical": "casos_críticos",
    "casesPerOneMillion": "casos_por_milhão",
    "deathsPerOneMillion": "mortes_por_milhão",
    "tests": "testes_total",
    "testsPerOneMillion": "testes_por_milhão",
    "population": "população",
    "continent": "continente",
    "activePerOneMillion": "ativos_por_milhão",
    "recoveredPerOneMillion": "recuperados_por_milhão",
    "criticalPerOneMillion": "críticos_por_milhão",
    "countries": "países_afetados",
    "continentInfo.lat": "latitudeContinente",
    "continentInfo.long": "longitudeContinente"
}

all_dataframe = all_dataframe.rename(columns=colunas_traducao)

all_dataframe


Unnamed: 0,atualizado_em,casos_total,casos_hoje,mortes_total,mortes_hoje,recuperados_total,recuperados_hoje,casos_ativos,casos_críticos,casos_por_milhão,mortes_por_milhão,testes_total,testes_por_milhão,população,continente,ativos_por_milhão,recuperados_por_milhão,críticos_por_milhão,países_afetados,latitudeContinente,longitudeContinente
0,1761609295843,131889132,0,1695941,0,127665129,350,2528062,6095,220498.43,2835.35,1325710449,2216384.82,598140916,North America,4226.53,213436.54,10.19,"['Anguilla', 'Antigua and Barbuda', 'Aruba', '...",31.676827,-146.470747
1,1761609295844,221500265,0,1553662,0,205673091,0,14273512,14733,47014.11,329.77,2404652039,510394.81,4711356783,Asia,3029.6,43654.75,3.13,"['Afghanistan', 'Armenia', 'Azerbaijan', 'Bahr...",23.702727,62.375064
2,1761609295845,253406198,0,2101824,0,248754104,474,2550270,4453,338985.07,2811.64,2848046702,3809872.49,747543837,Europe,3411.53,332761.9,5.96,"['Albania', 'Andorra', 'Austria', 'Belarus', '...",25.771324,-35.601226
3,1761609295846,70200879,0,1367332,0,66683585,0,2149962,8953,160387.87,3123.94,245395353,560654.49,437694443,South America,4912.02,152351.91,20.45,"['Argentina', 'Bolivia', 'Brazil', 'Chile', 'C...",-15.655156,-100.748423
4,1761609295847,14895771,0,33015,0,14752388,0,110368,31,342664.62,759.48,91668192,2108749.29,43470408,Australia-Oceania,2538.92,339366.22,0.71,"['Australia', 'Cook Islands', 'Fiji', 'French ...",-8.659916,91.146985
5,1761609295848,12860924,0,258892,0,12090808,0,511224,529,9142.43,184.04,111032578,78929.63,1406728744,Africa,363.41,8594.98,0.38,"['Algeria', 'Angola', 'Benin', 'Botswana', 'Bu...",1.738387,-16.309464


### Validando cada coluna
#### ✅ Checklist de Atualização de Colunas

- [ ] updated — atualizado_em  
- [ ] cases — casos_total  
- [ ] todayCases — casos_hoje  
- [ ] deaths — mortes_total  
- [ ] todayDeaths — mortes_hoje  
- [ ] recovered — recuperados_total  
- [ ] todayRecovered — recuperados_hoje  
- [ ] active — casos_ativos  
- [ ] critical — casos_críticos  
- [ ] casesPerOneMillion — casos_por_milhão  
- [ ] deathsPerOneMillion — mortes_por_milhão  
- [ ] tests — testes_total  
- [ ] testsPerOneMillion — testes_por_milhão  
- [ ] population — população  
- [ ] continent — continente  
- [ ] activePerOneMillion — ativos_por_milhão  
- [ ] recoveredPerOneMillion — recuperados_por_milhão  
- [ ] criticalPerOneMillion — críticos_por_milhão  
- [ ] countries — países_afetados  
- [ ] continentInfo.lat — latitudeContinente  
- [ ] continentInfo.long — longitudeContinente

In [19]:
all_dataframe['atualizado_em'] = pd.to_datetime(all_dataframe['atualizado_em'], unit='ms')
all_dataframe['atualizado_em'].fillna(0)
all_dataframe['atualizado_em']

0   2025-10-27 23:54:55.843
1   2025-10-27 23:54:55.844
2   2025-10-27 23:54:55.845
3   2025-10-27 23:54:55.846
4   2025-10-27 23:54:55.847
5   2025-10-27 23:54:55.848
Name: atualizado_em, dtype: datetime64[ns]