In [1]:
import pandas as pd

def processar_arquivo_excel(caminho_arquivo, sheet_name):
    """
    Processa o arquivo Excel, exclui as 4 primeiras linhas, renomeia a primeira coluna e
    corta o DataFrame até a linha com 'Países não especificados'. Além disso, adiciona uma 
    coluna com o nome do continente ao lado de cada país.
    
    Parâmetros:
    caminho_arquivo (str): Caminho para o arquivo Excel (.xls).
    sheet_name (str): Nome da planilha a ser processada.
    
    Retorna:
    pd.DataFrame: DataFrame processado com a coluna "Continente".
    """
    # Carregar o arquivo Excel
    df = pd.read_excel(caminho_arquivo, sheet_name=sheet_name)

    # Excluir as 4 primeiras linhas e ajustar os nomes das colunas
    colunas = ['País'] + df.iloc[4].tolist()[1:]
    df.columns = colunas
    df = df[7:]

    # Reiniciar o índice
    df = df.reset_index(drop=True)

    # Renomear a primeira coluna
    df.columns.values[0] = 'País'

    # Procurar o índice da linha que contém 'Países não especificados'
    indice = df[df['País'] == 'Países não especificados'].index[0] + 1

    # Filtrar o DataFrame até a linha anterior a 'Países não especificados'
    df = df[:indice]
    
    # Substitui '-' por 0
    df = df.replace('-', 0)

    # Adicionar uma coluna 'Ano' com o nome da planilha (ano)
    df['Ano'] = str(sheet_name)

    # Lista de Continentes
    continentes = ['África', 'América Central', 'América do Norte', 'América do Sul', 
                            'Outros países da América Central e Caribe', 'Ásia', 'Europa', 
                            'Oceania', 'Oriente Médio', 'Países não especificados', 
                            'América Central e Caribe','Outros', 'Países não especificados', 'Outros países da África', 
                    'Outros países da América Central e Caribe', 'Outros países da Ásia', 
                    'Outros países da Europa', 'Outros países da Oceania']

    # Criar uma nova coluna "Continente" e preencher com os valores corretos
    continente_atual = None
    df['Continente'] = None  # Cria a nova coluna vazia
    
    for i, row in df.iterrows():
        if row['País'] in continentes:
            continente_atual = row['País']
        df.at[i, 'Continente'] = continente_atual
        
    
    # retira de continentes o país não especificado
    continentes.remove('Países não especificados')
    
    # Excluir cada linha que contenha um dos continentes na coluna 'Continentes e países de residência permanente'
    df = df[~df['País'].isin(continentes)]
    
    # Excluir a coluna 'Total'
    df = df.drop(columns='Total')
    
    # converte para int se for string e pude ser convertido para int senao 0
    df['Janeiro'] = df['Janeiro'].apply(lambda x: int(x) if str(x).isdigit() else 0)
    df['Fevereiro'] = df['Fevereiro'].apply(lambda x: int(x) if str(x).isdigit() else 0)
    df['Março'] = df['Março'].apply(lambda x: int(x) if str(x).isdigit() else 0)
    df['Abril'] = df['Abril'].apply(lambda x: int(x) if str(x).isdigit() else 0)
    df['Maio'] = df['Maio'].apply(lambda x: int(x) if str(x).isdigit() else 0)
    df['Junho'] = df['Junho'].apply(lambda x: int(x) if str(x).isdigit() else 0)
    df['Julho'] = df['Julho'].apply(lambda x: int(x) if str(x).isdigit() else 0)
    df['Agosto'] = df['Agosto'].apply(lambda x: int(x) if str(x).isdigit() else 0)
    df['Setembro'] = df['Setembro'].apply(lambda x: int(x) if str(x).isdigit() else 0)
    df['Outubro'] = df['Outubro'].apply(lambda x: int(x) if str(x).isdigit() else 0)
    df['Novembro'] = df['Novembro'].apply(lambda x: int(x) if str(x).isdigit() else 0)
    df['Dezembro'] = df['Dezembro'].apply(lambda x: int(x) if str(x).isdigit() else 0)
    
    df['Ano'] = df['Ano'].astype(str)
    
    
        
        
    # Retornar o DataFrame processado
    return df


# Lista com os anos das planilhas que você deseja processar
anos = [str(num) for num in range(2006,2020)]  # Exemplo de anos (planilhas) que você quer processar
print(anos)
# Lista para armazenar os DataFrames processados
dfs = []

# Caminho para o arquivo Excel
caminho_arquivo = '2675.xls'

# Iterar sobre cada planilha (ano) e processar os dados
for sheet_name in anos:
    print(f"Processando planilha: {sheet_name}")
    df = processar_arquivo_excel(caminho_arquivo, sheet_name)
    dfs.append(df)  # Adicionar o DataFrame processado à lista

# Mesclar todos os DataFrames em um único DataFrame
df_paises = pd.concat(dfs, ignore_index=True)

df_paises['País'] = df_paises['País'].str.strip()
# converte 'Ano' para string
df_paises['Ano'] = df_paises['Ano'].astype(str)



# Exibir o DataFrame resultante
display(df_paises.head(1000))

df_paises.to_csv('src\data\Turistas vindos por meio aereo.csv', index=False)  # Salvar o DataFrame em um arquivo CSV

['2006', '2007', '2008', '2009', '2010', '2011', '2012', '2013', '2014', '2015', '2016', '2017', '2018', '2019']
Processando planilha: 2006


  df = df.replace('-', 0)
  df = df.replace('-', 0)
  df = df.replace('-', 0)


Processando planilha: 2007
Processando planilha: 2008
Processando planilha: 2009
Processando planilha: 2010
Processando planilha: 2011
Processando planilha: 2012
Processando planilha: 2013
Processando planilha: 2014
Processando planilha: 2015
Processando planilha: 2016


  df = df.replace('-', 0)
  df = df.replace('-', 0)
  df = df.replace('-', 0)
  df = df.replace('-', 0)


Processando planilha: 2017
Processando planilha: 2018
Processando planilha: 2019


Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente
0,África do Sul,363,203,103,85,38,442,474,323,488,151,227,115,2006,África
1,Angola,1639,1113,1208,1501,940,966,1037,3910,1528,3052,2299,2413,2006,África
2,Cabo Verde,221,286,212,103,301,326,274,187,153,115,106,123,2006,África
3,Nigéria,22,7,35,0,18,8,8,44,91,0,0,0,2006,África
4,Outros,191,239,369,113,232,83,89,96,63,150,82,76,2006,África
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
889,Suíça,1133,1213,1178,1185,554,577,1495,797,912,1106,1132,1803,2019,Europa
890,Turquia,115,110,156,93,114,103,62,63,63,90,75,153,2019,Europa
891,Ucrânia,238,260,273,155,98,143,86,79,89,133,223,261,2019,Europa
892,Austrália,1706,1598,1958,650,573,740,768,838,1180,945,718,1255,2019,Oceania


In [94]:
df_paises['País'].unique()

array(['África do Sul', 'Angola', 'Cabo Verde', 'Nigéria', 'Outros',
       'Costa Rica', 'Panamá', 'Porto Rico', 'Canadá', 'Estados Unidos',
       'México', 'Argentina', 'Bolívia', 'Chile', 'Colômbia', 'Equador',
       'Guiana Francesa', 'Paraguai', 'Peru', 'República da Guiana',
       'Suriname', 'Uruguai', 'Venezuela', 'China', 'Japão',
       'República da Coréia', 'Alemanha', 'Áustria', 'Bélgica',
       'Dinamarca', 'Espanha', 'Finlândia', 'França', 'Grécia', 'Holanda',
       'Hungria', 'Inglaterra', 'Irlanda', 'Itália', 'Noruega', 'Polônia',
       'Portugal', 'Suécia', 'Suíça', 'Austrália', 'Nova Zelândia',
       'Arábia Saudita', 'Iraque', 'Israel', 'Cuba', 'Índia',
       'República Tcheca', 'Rússia', 'Egito', 'Gana', 'Marrocos',
       'Moçambique', 'Quênia', 'Tunísia', 'El Salvador', 'Guatemala',
       'Haiti', 'Honduras', 'Nicarágua', 'República Dominicana',
       'Trinidad e Tobago', 'Guiana', 'Bangladesh', 'China, Hong Kong',
       'Cingapura', 'Filipinas', 'Indo

In [31]:
df.head()

Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente
1,África do Sul,394,442,854,240,109,195,103,98,157,188,93,256,2019,África
2,Angola,371,221,282,240,206,154,205,311,234,198,6,12,2019,África
3,Cabo Verde,6,14,12,5,2,3,1,2,3,5,3,17,2019,África
4,Egito,29,43,75,48,52,52,61,58,12,28,31,90,2019,África
5,Gana,1,3,2,3,2,5,22,3,8,1,8,7,2019,África


In [34]:
df.to_dict()
data = {
        'País': ['África do Sul', 'Angola', 'Cabo Verde', 'Nigéria', 'Outros'],
        'Janeiro': [363, 1639, 221, 22, 191],
        'Fevereiro': [203, 1113, 286, 7, 239],
        'Março': [103, 1208, 212, 35, 369],
        'Abril': [85, 1501, 103, 0, 113],
        'Maio': [38, 940, 301, 18, 232],
        'Junho': [442, 966, 326, 8, 83],
        'Julho': [474, 1037, 274, 8, 89],
        'Agosto': [323, 3910, 187, 44, 96],
        'Setembro': [488, 1528, 153, 91, 63],
        'Outubro': [151, 3052, 115, 0, 150],
        'Novembro': [227, 2299, 106, 0, 82],
        'Dezembro': [115, 2413, 123, 0, 76],
        'Ano': [2006, 2006, 2006, 2006, 2006],
        'Continente': ['África', 'África', 'África', 'África', 'África']
    }
data = {
    'País': df['País'].tolist(),
    'Janeiro': df['Janeiro'].tolist(),
    'Fevereiro': df['Fevereiro'].tolist(),
    'Março': df['Março'].tolist(),
    'Abril': df['Abril'].tolist(),
    'Maio': df['Maio'].tolist(),
    'Junho': df['Junho'].tolist(),
    'Julho': df['Julho'].tolist(),
    'Agosto': df['Agosto'].tolist(),
    'Setembro': df['Setembro'].tolist(),
    'Outubro': df['Outubro'].tolist(),
    'Novembro': df['Novembro'].tolist(),
    'Dezembro': df['Dezembro'].tolist(),
    'Ano': df['Ano'].tolist(),
    'Continente': df['Continente'].tolist()
}

{'País': {1: 'África do Sul',
  2: 'Angola',
  3: 'Cabo Verde',
  4: 'Egito',
  5: 'Gana',
  6: 'Marrocos',
  7: 'Moçambique',
  8: 'Nigéria',
  9: 'Quênia',
  10: 'Tunísia',
  11: 'Outros países da África',
  12: 'América Central e Caribe',
  13: 'Costa Rica',
  14: 'Cuba',
  15: 'El Salvador',
  16: 'Guatemala',
  17: 'Haiti',
  18: 'Honduras',
  19: 'Nicarágua',
  20: 'Panamá',
  21: 'República Dominicana',
  22: 'Trinidad e Tobago',
  23: 'Outros países da América Central e Caribe',
  25: 'Canadá',
  26: 'Estados Unidos',
  27: 'México',
  29: 'Argentina',
  30: 'Bolívia',
  31: 'Chile',
  32: 'Colômbia',
  33: 'Equador',
  34: 'Guiana',
  35: 'Guiana Francesa',
  36: 'Paraguai',
  37: 'Peru',
  38: 'Suriname',
  39: 'Uruguai',
  40: 'Venezuela',
  42: 'Arábia Saudita',
  43: 'Bangladesh',
  44: 'China',
  45: 'China, Hong Kong',
  46: 'Cingapura',
  47: 'Filipinas',
  48: 'Índia',
  49: 'Indonésia',
  50: 'Irã',
  51: 'Israel',
  52: 'Japão',
  53: 'Líbano',
  54: 'Malásia',
  55:

In [None]:
paises = df['País'].unique().tolist()
# converte para int se for string e pude ser convertido para int senao 0
df['Janeiro'] = df['Janeiro'].apply(lambda x: int(x) if str(x).isdigit() else 0)
df['Fevereiro'] = df['Fevereiro'].apply(lambda x: int(x) if str(x).isdigit() else 0)
df['Março'] = df['Março'].apply(lambda x: int(x) if str(x).isdigit() else 0)
df['Abril'] = df['Abril'].apply(lambda x: int(x) if str(x).isdigit() else 0)
df['Maio'] = df['Maio'].apply(lambda x: int(x) if str(x).isdigit() else 0)
df['Junho'] = df['Junho'].apply(lambda x: int(x) if str(x).isdigit() else 0)
df['Julho'] = df['Julho'].apply(lambda x: int(x) if str(x).isdigit() else 0)
df['Agosto'] = df['Agosto'].apply(lambda x: int(x) if str(x).isdigit() else 0)
df['Setembro'] = df['Setembro'].apply(lambda x: int(x) if str(x).isdigit() else 0)
df['Outubro'] = df['Outubro'].apply(lambda x: int(x) if str(x).isdigit() else 0)
df['Novembro'] = df['Novembro'].apply(lambda x: int(x) if str(x).isdigit() else 0)
df['Dezembro'] = df['Dezembro'].apply(lambda x: int(x) if str(x).isdigit() else 0)

In [88]:
import pandas as pd

# Obter países únicos e seus respectivos continentes
paises_continentes = df_paises[['País', 'Continente']].drop_duplicates()

# Criar uma lista de tuplas (país, continente)
tuplas_paises_continentes = list(zip(paises_continentes['País'], paises_continentes['Continente']))

# Exibir as tuplas para verificação
print(tuplas_paises_continentes)


# Criar uma lista de meses
meses = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio', 'Junho', 
         'Julho', 'Agosto', 'Setembro', 'Outubro', 'Novembro', 'Dezembro']
paises_continentes = df_paises[['País', 'Continente']].drop_duplicates()

# Loop para verificar e adicionar linhas de países ausentes
for ano in anos:
    for pais, continente in zip(paises_continentes['País'], paises_continentes['Continente']):
        # Verifica se o país está presente no ano atual
        if not ((df_paises['Ano'] == ano) & (df_paises['País'] == pais)).any():
            # Se o país não estiver presente no ano, cria uma linha com valores 0 para todos os meses
            new_row = {'País': pais, 'Ano': ano, 'Continente': continente}
            
            # Adicionar os valores de 0 para cada mês
            for mes in meses:
                new_row[mes] = 0
            
            # Adicionar a nova linha ao DataFrame
            df_paises = pd.concat([df_paises, pd.DataFrame([new_row])], ignore_index=True)

# Ordenar o DataFrame pelo ano, país e continente para manter a consistência
df_paises = df_paises.sort_values(by=['Ano', 'País', 'Continente']).reset_index(drop=True)

# Exibir o DataFrame final para verificação
display(df_paises)


[('África do Sul', 'África'), ('Angola', 'África'), ('Cabo Verde', 'África'), ('Nigéria', 'África'), ('Outros', 'África'), ('Costa Rica', 'América Central'), ('Panamá', 'América Central'), ('Porto Rico', 'América Central'), ('Outros', 'América Central'), ('Canadá', 'América do Norte'), ('Estados Unidos', 'América do Norte'), ('México', 'América do Norte'), ('Argentina', 'América do Sul'), ('Bolívia', 'América do Sul'), ('Chile', 'América do Sul'), ('Colômbia', 'América do Sul'), ('Equador', 'América do Sul'), ('Guiana Francesa', 'América do Sul'), ('Paraguai', 'América do Sul'), ('Peru', 'América do Sul'), ('República da Guiana', 'América do Sul'), ('Suriname', 'América do Sul'), ('Uruguai', 'América do Sul'), ('Venezuela', 'América do Sul'), ('China', 'Ásia'), ('Japão', 'Ásia'), ('República da Coréia', 'Ásia'), ('Outros', 'Ásia'), ('Alemanha', 'Europa'), ('Áustria', 'Europa'), ('Bélgica', 'Europa'), ('Dinamarca', 'Europa'), ('Espanha', 'Europa'), ('Finlândia', 'Europa'), ('França', 'E

Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente
0,Alemanha,6174,5842,5612,4191,3405,2836,2897,4001,3741,4129,4467,4225,2006,Europa
1,América Central e Caribe,0,0,0,0,0,0,0,0,0,0,0,0,2006,África
2,Angola,1639,1113,1208,1501,940,966,1037,3910,1528,3052,2299,2413,2006,África
3,Argentina,14642,13262,12788,7044,3602,4954,5316,4523,5335,6203,5047,5532,2006,América do Sul
4,Arábia Saudita,0,0,0,0,1,4,4,27,0,42,0,3,2006,Oriente Médio
5,Austrália,915,1779,353,310,236,354,380,334,706,342,267,404,2006,Oceania
6,Bangladesh,0,0,0,0,0,0,0,0,0,0,0,0,2006,Ásia
7,Bolívia,41,90,14,143,41,23,24,62,27,71,1,20,2006,América do Sul
8,Bulgária,0,0,0,0,0,0,0,0,0,0,0,0,2006,Europa
9,Bélgica,366,662,422,307,576,142,152,266,428,985,2129,1635,2006,Europa


[('África do Sul', 'África'), ('Angola', 'África'), ('Cabo Verde', 'África'), ('Nigéria', 'África'), ('Outros', 'África'), ('Costa Rica', 'América Central'), ('Panamá', 'América Central'), ('Porto Rico', 'América Central'), ('Outros', 'América Central'), ('Canadá', 'América do Norte'), ('Estados Unidos', 'América do Norte'), ('México', 'América do Norte'), ('Argentina', 'América do Sul'), ('Bolívia', 'América do Sul'), ('Chile', 'América do Sul'), ('Colômbia', 'América do Sul'), ('Equador', 'América do Sul'), ('Guiana Francesa', 'América do Sul'), ('Paraguai', 'América do Sul'), ('Peru', 'América do Sul'), ('República da Guiana', 'América do Sul'), ('Suriname', 'América do Sul'), ('Uruguai', 'América do Sul'), ('Venezuela', 'América do Sul'), ('China', 'Ásia'), ('Japão', 'Ásia'), ('República da Coréia', 'Ásia'), ('Outros', 'Ásia'), ('Alemanha', 'Europa'), ('Áustria', 'Europa'), ('Bélgica', 'Europa'), ('Dinamarca', 'Europa'), ('Espanha', 'Europa'), ('Finlândia', 'Europa'), ('França', 'E

In [77]:
#confere quantas repetições  de cada pais

lista_paises = []
for pais in paises:
    #print('Pais:', pais, 'Repetições:', df[df['País'] == pais].shape[0])
    lista_paises.append({'Pais': pais, 'Repetições': df[df['País'] == pais].shape[0]})

#cria um dataframe com a lista de paises e suas repetições
df_paises = pd.DataFrame(lista_paises)
df_paises.sort_values(by='Repetições', ascending=False, inplace=True)

# Criar uma lista de meses
meses = ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio', 'Junho', 
         'Julho', 'Agosto', 'Setembro', 'Outubro', 'Novembro', 'Dezembro']
paises = df['País'].unique().tolist()
for pais in paises:
    continentes = df[df['País'] == pais]['Continente'].unique()
    pais, continente = (pais, continentes[0])

# Loop para verificar e adicionar linhas de países ausentes
for ano in anos:
    for pais in paises:
        # Verifica se o país está presente no ano atual
        if not ((df['Ano'] == ano) & (df['País'] == pais)).any():
            # Se o país não estiver presente no ano, cria uma linha com valores 0 para todos os meses
            new_row = {'País': pais, 'Ano': ano}
            for mes in meses:
                new_row[mes] = 0
            # Adiciona a nova linha ao DataFrame
            df = pd.concat([df, pd.DataFrame([new_row])], ignore_index=True)
            # adicionar o continente também 
            df['Continente'] = continente

# Ordenar o DataFrame pelo ano e país para manter a consistência
df = df.sort_values(by=['Ano', 'País']).reset_index(drop=True)
    

In [78]:
for pais in paises:
    print('Pais:', pais, 'Repetições:', df[df['País'] == pais].shape[0])
    lista_paises.append({'Pais': pais, 'Repetições': df[df['País'] == pais].shape[0]})

Pais: África do Sul Repetições: 14
Pais: Angola Repetições: 14
Pais: Cabo Verde Repetições: 14
Pais: Nigéria Repetições: 14
Pais: Outros Repetições: 54
Pais: Costa Rica Repetições: 14
Pais: Panamá Repetições: 14
Pais: Porto Rico Repetições: 14
Pais: Canadá Repetições: 14
Pais: Estados Unidos Repetições: 14
Pais: México Repetições: 14
Pais: Argentina Repetições: 14
Pais: Bolívia Repetições: 14
Pais: Chile Repetições: 14
Pais: Colômbia Repetições: 14
Pais: Equador Repetições: 14
Pais: Guiana Francesa Repetições: 14
Pais: Paraguai Repetições: 14
Pais: Peru Repetições: 14
Pais: República da Guiana Repetições: 14
Pais: Suriname Repetições: 14
Pais: Uruguai Repetições: 14
Pais: Venezuela Repetições: 14
Pais: China Repetições: 14
Pais: Japão Repetições: 14
Pais: República da Coréia Repetições: 14
Pais: Alemanha Repetições: 14
Pais: Áustria Repetições: 14
Pais: Bélgica Repetições: 14
Pais: Dinamarca Repetições: 14
Pais: Espanha Repetições: 14
Pais: Finlândia Repetições: 14
Pais: França Repetiç

In [71]:
df = pd.read_csv('paises.csv')

    
df['Total'] = df['Janeiro'] + df['Fevereiro'] + df['Março'] + df['Abril'] + df['Maio'] + df['Junho'] + df['Julho'] + df['Agosto'] + df['Setembro'] + df['Outubro'] + df['Novembro'] + df['Dezembro']
# filtra
r = range(2006, 2020)
for i in r:
    # sort no total
    df2 = df[(df['País'].isin(paises)) & (df['Ano'] == i)]
    display(df2.sort_values(by='Total', ascending=False).reset_index(drop=True).head(10))


Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente,Total
0,Estados Unidos,19117,18295,16196,14113,13443,14819,15683,6325,5042,6928,11229,16690,2006,América do Norte,157880
1,Argentina,14642,13262,12788,7044,3602,4954,5316,4523,5335,6203,5047,5532,2006,América do Sul,88248
2,França,8402,7754,7973,8584,9413,6406,6619,5311,4745,4766,6364,5912,2006,Europa,82249
3,Portugal,7093,6307,4767,4133,3746,3833,3731,4128,3972,4255,4716,5719,2006,Europa,56400
4,Alemanha,6174,5842,5612,4191,3405,2836,2897,4001,3741,4129,4467,4225,2006,Europa,51520
5,Inglaterra,7104,8877,4299,3726,2541,2284,2451,2579,2982,3078,2664,3573,2006,Europa,46158
6,Itália,6331,5539,4174,2818,1753,1478,1586,3238,2387,2994,4383,4273,2006,Europa,40954
7,Espanha,3459,3210,3313,2910,1862,1738,1436,2173,2835,2654,2723,2928,2006,Europa,31241
8,Angola,1639,1113,1208,1501,940,966,1037,3910,1528,3052,2299,2413,2006,África,21606
9,Chile,2763,1439,948,749,394,910,976,638,2177,552,1329,3130,2006,América do Sul,16005


Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente,Total
0,Estados Unidos,16657,13434,13893,10493,11264,12753,12849,12171,10746,10822,11194,14747,2007,América do Norte,151023
1,Argentina,14319,8439,11822,6771,5442,5321,10656,7872,7034,6429,6299,9414,2007,América do Sul,99818
2,França,6144,7343,5582,6574,5478,4109,6091,5752,4320,6816,6699,6645,2007,Europa,71553
3,Chile,8267,6052,4183,4734,3960,4203,5048,4618,3698,3423,3374,4387,2007,América do Sul,55947
4,Portugal,6656,5357,4388,5508,3426,3322,3878,4360,3828,4674,4590,5664,2007,Europa,55651
5,Inglaterra,3740,5424,4344,2782,2237,2883,3224,2848,3504,3017,2919,4240,2007,Europa,41162
6,Itália,4348,4583,2627,2817,1652,1959,2725,4762,2305,2717,2665,2848,2007,Europa,36008
7,Alemanha,4024,4578,2643,2758,1907,1875,2890,2859,2636,2226,2184,2024,2007,Europa,32604
8,Espanha,2409,2390,2000,2199,1546,3756,2992,3725,2235,2619,2566,1528,2007,Europa,29965
9,Angola,3615,1439,1659,1636,1011,948,1566,1557,1392,1682,1615,1214,2007,África,19334


Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente,Total
0,Estados Unidos,13771,12653,14705,10728,10224,10626,10346,10620,9435,8792,9302,0,2008,América do Norte,121202
1,Argentina,13363,11944,16940,7386,40,7697,7797,7240,7994,5874,5508,0,2008,América do Sul,91783
2,França,6915,8367,6457,6486,4631,3474,6191,6281,3370,5002,5265,0,2008,Europa,62439
3,Chile,7903,8181,4996,3410,3387,3326,3694,3065,4502,3286,3267,0,2008,América do Sul,49017
4,Portugal,5812,5690,5428,3322,2414,2455,3922,4056,2966,2856,3209,0,2008,Europa,42130
5,Inglaterra,5455,5311,4812,2837,2523,2526,3984,3324,3278,2950,2447,0,2008,Europa,39447
6,Itália,5630,4696,3143,2896,1416,2095,3019,4341,1895,1842,2135,0,2008,Europa,33108
7,Alemanha,4441,5007,3960,2546,2324,2309,3057,2812,2387,1994,1536,0,2008,Europa,32373
8,Espanha,2811,2573,3486,1900,2286,2420,3103,3894,2668,1843,2030,0,2008,Europa,29014
9,Angola,2245,1411,1569,1254,1312,926,1668,1662,1321,1781,1373,0,2008,África,16522


Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente,Total
0,Argentina,20059,18469,21066,13440,10824,7473,10973,10876,11069,14008,14135,11450,2009,América do Sul,163842
1,Estados Unidos,16748,14153,18503,11590,10770,14481,13042,14452,10737,10639,13651,13900,2009,América do Norte,162666
2,França,6981,7097,8822,7065,5546,3321,4532,7781,3626,4320,7602,4878,2009,Europa,71571
3,Inglaterra,4699,4860,6202,4726,3429,3322,3307,4748,3785,4595,4821,4300,2009,Europa,52794
4,Chile,3632,6682,5628,3489,4226,3241,3709,3428,5101,4665,4505,3423,2009,América do Sul,51729
5,Alemanha,4650,3112,5351,4450,2518,2546,2339,2707,2668,3268,4142,2677,2009,Europa,40428
6,Portugal,5303,3202,4264,4646,2966,2201,2254,2814,2152,2570,3372,3493,2009,Europa,39237
7,Itália,6464,4501,4793,2554,2129,1676,1629,4358,2656,2179,3014,2406,2009,Europa,38359
8,Espanha,2528,1859,2143,2870,1990,1717,2130,3174,2250,2385,2923,2909,2009,Europa,28878
9,Angola,2423,2434,2306,1716,1545,1080,1092,1162,1280,1239,1151,1073,2009,África,18501


Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente,Total
0,Estados Unidos,11916,14224,15919,15786,10481,17417,12915,18206,9839,13870,16277,19246,2010,América do Norte,176096
1,Argentina,22258,17247,24378,15188,11924,6552,12902,11418,10624,15008,10620,16919,2010,América do Sul,175038
2,França,5013,7238,5877,4841,4076,3156,6082,5713,3022,5139,4296,7757,2010,Europa,62210
3,Chile,7015,8909,3994,3369,3917,3693,4684,3902,4974,6184,4260,5456,2010,América do Sul,60357
4,Inglaterra,4753,5284,6361,1713,2076,3053,4387,5436,7824,4293,7255,5039,2010,Europa,57474
5,Alemanha,3441,5533,4817,1328,1805,1778,2301,3649,7578,3998,5423,3631,2010,Europa,45282
6,Portugal,3142,3403,4799,2972,2314,1912,2188,2796,2060,3061,3090,4905,2010,Europa,36642
7,Itália,4292,3333,3992,1830,1561,1619,2337,4309,1960,2683,3020,5394,2010,Europa,36330
8,Espanha,2857,3743,4616,1578,2133,1892,2964,2340,2831,2699,3469,4281,2010,Europa,35403
9,Angola,2203,1653,1698,1092,1283,832,1258,1595,1028,1121,837,1300,2010,África,15900


Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente,Total
0,Argentina,23187,21246,20800,14882,10842,9761,13602,12149,13743,17823,18188,19777,2011,América do Sul,196000
1,Estados Unidos,9919,13117,21634,13234,12985,13263,12869,13353,11459,13172,14588,17648,2011,América do Norte,167241
2,França,4985,7596,6399,6570,4773,3606,6053,5842,3598,5703,6322,8646,2011,Europa,70093
3,Chile,7367,10719,5165,4758,4536,3741,4348,4262,5095,6617,5346,5400,2011,América do Sul,67354
4,Inglaterra,3434,5322,6169,5028,3377,3336,3331,3417,3837,4411,5483,5325,2011,Europa,52470
5,Itália,3987,3471,3413,2448,1839,2571,3388,5022,2326,3157,5075,7607,2011,Europa,44304
6,Alemanha,3203,3535,4609,3869,2223,1989,3297,2988,3026,4227,5494,5386,2011,Europa,43846
7,Portugal,3280,3020,3335,3955,2259,2139,2418,2615,2591,2754,3836,4976,2011,Europa,37178
8,Espanha,1962,2334,3409,3256,2344,2238,2727,2819,2221,2798,3284,3595,2011,Europa,32987
9,Uruguai,1110,1307,1289,2677,772,1029,972,1112,1541,1568,1509,828,2011,América do Sul,15714


Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente,Total
0,Argentina,36393,27163,31410,22982,13370,9467,21528,14026,16634,18842,20754,23275,2012,América do Sul,255844
1,Estados Unidos,10711,16457,15989,10892,11623,14133,11607,13538,11203,11679,13383,18782,2012,América do Norte,159997
2,França,5568,9109,7468,7151,4631,5340,7318,6882,4418,7102,7128,9641,2012,Europa,81756
3,Chile,7344,9018,7530,5962,6038,5450,5391,5094,6864,7516,5866,6353,2012,América do Sul,78426
4,Inglaterra,4735,7205,7112,4009,3567,4333,3838,3869,4599,5101,5677,5858,2012,Europa,59903
5,Alemanha,3543,4626,6153,3548,2935,3285,3947,3857,3763,5173,6342,6668,2012,Europa,53840
6,Itália,5101,4539,5111,3506,2265,2795,3243,5693,2719,3550,4758,6805,2012,Europa,50085
7,Portugal,3079,3266,4459,2972,2344,2452,2470,2917,2837,3035,3429,4473,2012,Europa,37733
8,Espanha,2522,2683,3297,1922,1735,2119,2460,2716,2319,2772,3056,2699,2012,Europa,30300
9,Colômbia,1183,1108,1803,1404,1152,1848,1461,1502,1824,1833,2226,2748,2012,América do Sul,20092


Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente,Total
0,Argentina,37007,28362,35813,19604,10019,11040,19942,13897,11507,18535,20776,22803,2013,América do Sul,249305
1,Estados Unidos,10347,16094,19055,13144,14617,13006,18417,13709,8077,13714,12278,18666,2013,América do Norte,171124
2,França,5512,8323,8835,7380,4759,4228,10320,7760,2719,6922,6145,7575,2013,Europa,80478
3,Chile,7738,11439,9136,5485,5657,4451,6955,4908,4724,7101,6159,6248,2013,América do Sul,80001
4,Inglaterra,4364,8377,8170,5139,5963,4798,4641,4931,3168,5725,5324,5847,2013,Europa,66447
5,Itália,4912,5149,5568,3924,2789,3793,7665,5425,2048,3823,4958,7007,2013,Europa,57061
6,Alemanha,4279,5465,7916,3806,3817,3379,4715,4051,2501,5216,4840,5880,2013,Europa,55865
7,Portugal,3440,3692,5089,3259,2779,2822,3228,3594,2604,3224,4380,5269,2013,Europa,43380
8,Espanha,2304,2545,3558,2528,2333,2637,4655,3425,1911,3071,3158,3010,2013,Europa,35135
9,Colômbia,1708,1486,2421,1552,1396,2007,2485,2077,1396,2712,1907,2416,2013,América do Sul,23563


Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente,Total
0,Argentina,35003,32607,18797,18289,12728,25517,29001,11538,14484,16011,18168,32734,2014,América do Sul,264877
1,Estados Unidos,14648,17575,12057,12058,15262,49151,23226,16042,12256,14691,15391,32435,2014,América do Norte,234792
2,França,6522,11802,6515,8532,6726,17411,11826,9643,5073,8101,8952,16939,2014,Europa,118042
3,Chile,10921,13838,4220,4723,5294,17617,6481,5116,7688,7874,7425,13343,2014,América do Sul,104540
4,Inglaterra,6154,8585,5609,5965,6628,22877,9683,5744,5841,6340,6757,10656,2014,Europa,100839
5,Alemanha,4590,7171,4643,5087,4669,9713,10497,5338,4617,5889,6303,10328,2014,Europa,78845
6,Itália,6452,7417,4288,5036,3748,4033,6052,7677,3441,4184,6028,14424,2014,Europa,72780
7,Portugal,5130,5280,2948,5279,3424,3074,3722,4396,3195,4091,4964,9639,2014,Europa,55142
8,Espanha,2969,3443,2110,3109,2752,3856,4428,4414,2959,3279,3921,5878,2014,Europa,43118
9,Colômbia,1513,1635,1277,2267,2183,12112,3606,2326,1926,2208,2507,5635,2014,América do Sul,39195


Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente,Total
0,Argentina,32957,30836,30136,21824,20049,14474,27194,19360,16575,33118,35016,40073,2015,América do Sul,321612
1,Estados Unidos,10035,16579,17903,14144,16478,16885,16885,13199,9068,16355,21578,25716,2015,América do Norte,194825
2,Chile,8911,12055,9398,5707,7652,4971,8236,5278,6122,9190,10179,9818,2015,América do Sul,97517
3,França,5306,11806,7689,9452,6685,5030,10486,8132,3286,9051,9032,11442,2015,Europa,97397
4,Inglaterra,4490,8502,7346,6032,4919,5306,6188,4682,4172,7288,8027,8521,2015,Europa,75473
5,Itália,4610,5113,5744,4133,3111,3089,4173,4975,1953,5142,6412,8768,2015,Europa,57223
6,Alemanha,2988,4715,6776,3626,3322,2758,3986,3884,2708,5912,5474,6598,2015,Europa,52747
7,Portugal,3718,4050,5753,3525,2929,3330,2904,3181,2138,3766,5516,6818,2015,Europa,47628
8,Uruguai,3552,2741,5175,2309,1813,2367,3348,3318,2131,4997,5428,4079,2015,América do Sul,41258
9,Espanha,2151,2748,3500,2389,2441,2501,3416,3065,1765,3183,4111,4071,2015,Europa,35341


Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente,Total
0,Argentina,41227,36030,31692,23558,22868,21157,32639,25573,28350,32682,0,40214,2016,América do Sul,335990
1,Estados Unidos,14901,20743,19598,13716,13837,21029,23419,46311,14239,9422,0,13925,2016,América do Norte,211140
2,Chile,13024,14916,8571,6919,7438,8346,11117,6718,9799,11784,0,10228,2016,América do Sul,108860
3,França,6791,11939,6709,8670,5361,3996,7518,8498,5191,6937,0,7207,2016,Europa,78817
4,Reino Unido,8477,9265,8452,5356,4491,4014,8822,12959,7323,4992,0,4627,2016,Europa,78778
5,Alemanha,4670,5169,7143,3884,3456,2586,5222,7800,5013,4855,0,4215,2016,Europa,54013
6,Itália,5245,4602,4156,2864,2059,2761,3535,4235,2979,2867,0,5832,2016,Europa,41135
7,Portugal,4573,4704,5668,3492,2503,2622,2505,2672,2872,3409,0,5364,2016,Europa,40384
8,Uruguai,4287,4010,5939,2468,2399,2660,2924,2891,4731,4012,0,2395,2016,América do Sul,38716
9,Espanha,2521,2548,3160,2130,1917,2121,3770,4109,3082,2455,0,2733,2016,Europa,30546


Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente,Total
0,Argentina,45727,46875,39652,35476,27420,22446,33121,30598,31335,35587,39484,48367,2017,América do Sul,436088
1,Estados Unidos,13937,14287,12085,10812,8357,6841,10095,9326,9550,10847,12034,14742,2017,América do Norte,132913
2,Chile,13224,13556,11467,10259,7930,6491,9578,8849,9062,10291,11418,13987,2017,América do Sul,126112
3,França,8221,8427,7128,6378,4930,4035,5954,5501,5633,6398,7098,8695,2017,Europa,78398
4,Reino Unido,7184,7365,6230,5574,4308,3527,5204,4807,4923,5591,6203,7599,2017,Europa,68515
5,Alemanha,5325,5459,4617,4131,3193,2614,3857,3563,3649,4144,4598,5632,2017,Europa,50782
6,Portugal,4348,4457,3770,3373,2607,2134,3149,2909,2979,3384,3754,4599,2017,Europa,41463
7,Uruguai,4211,4316,3651,3267,2525,2067,3050,2818,2885,3277,3636,4454,2017,América do Sul,40157
8,Itália,3882,3979,3366,3012,2328,1906,2812,2598,2660,3021,3352,4106,2017,Europa,37022
9,Colômbia,3530,3618,3061,2738,2117,1733,2557,2362,2419,2747,3048,3734,2017,América do Sul,33664


Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente,Total
0,Argentina,65789,49135,52422,35576,19619,14534,27619,23575,27936,27103,29587,44710,2018,América do Sul,417605
1,Chile,19444,19946,11223,9339,9217,7864,12358,10156,12412,13548,12717,15681,2018,América do Sul,153905
2,Estados Unidos,6565,11312,11991,8175,8683,7856,9873,11891,8638,8233,9589,14932,2018,América do Norte,117738
3,França,4794,8186,6307,6014,4378,3151,6052,7380,4231,6043,6148,6966,2018,Europa,69650
4,Alemanha,3877,5055,7282,3092,2811,2345,3233,3375,3735,4078,4486,5448,2018,Europa,48817
5,Reino Unido,3638,5479,4260,2730,2120,2212,2345,2788,2737,3462,3520,3694,2018,Europa,38985
6,Itália,3748,3341,3540,2324,1532,1751,2559,5029,2401,2449,3457,5793,2018,Europa,37924
7,Colômbia,1676,1653,3421,2026,2499,3457,2329,3078,3485,4401,4148,4098,2018,América do Sul,36271
8,Uruguai,3110,2696,4403,2189,1776,1479,2152,2522,3859,3313,2581,2550,2018,América do Sul,32630
9,Portugal,2384,2992,3472,2144,1596,1175,1696,2020,1681,2137,2857,4400,2018,Europa,28554


Unnamed: 0,País,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro,Ano,Continente,Total
0,Argentina,51022,44972,47236,27788,20291,18614,24658,22450,23317,25085,27249,34360,2019,América do Sul,367042
1,Chile,19037,21203,13301,8811,10116,12553,10734,9885,12720,12516,9742,13123,2019,América do Sul,153741
2,Estados Unidos,8882,10285,14123,7313,7843,9219,8922,9620,8236,9452,9756,13333,2019,América do Norte,116984
3,França,4848,9945,7584,6167,4347,2942,6683,7722,3484,6120,5695,6107,2019,Europa,71644
4,Reino Unido,3499,4760,5305,4557,3242,2840,3415,3832,4008,4066,4442,4251,2019,Europa,48217
5,Alemanha,3391,4787,5741,3729,2316,2304,3060,2848,3541,3972,3754,4384,2019,Europa,43827
6,Itália,3266,3382,2939,3367,1875,1769,2178,5304,1770,1902,2644,4982,2019,Europa,35378
7,Uruguai,3418,4050,3159,4300,2064,2438,2089,2533,3215,1752,1673,2415,2019,América do Sul,33106
8,Portugal,2706,3266,3494,3319,1984,1706,1703,2654,2466,1936,2534,3909,2019,Europa,31677
9,Colômbia,2288,1882,2196,2028,1775,4643,1757,2293,2519,2538,2489,2599,2019,América do Sul,29007


In [37]:
display(df.info())

<class 'pandas.core.frame.DataFrame'>
Index: 94 entries, 1 to 99
Data columns (total 15 columns):
 #   Column      Non-Null Count  Dtype 
---  ------      --------------  ----- 
 0   País        94 non-null     object
 1   Janeiro     94 non-null     int64 
 2   Fevereiro   94 non-null     int64 
 3   Março       94 non-null     int64 
 4   Abril       94 non-null     int64 
 5   Maio        94 non-null     int64 
 6   Junho       94 non-null     int64 
 7   Julho       94 non-null     int64 
 8   Agosto      94 non-null     int64 
 9   Setembro    94 non-null     int64 
 10  Outubro     94 non-null     int64 
 11  Novembro    94 non-null     int64 
 12  Dezembro    94 non-null     int64 
 13  Ano         94 non-null     object
 14  Continente  94 non-null     object
dtypes: int64(12), object(3)
memory usage: 11.8+ KB


None

In [33]:
df.describe()

Unnamed: 0,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro
count,94.0,94.0,94.0,94.0,94.0,94.0,94.0,94.0,94.0,94.0,94.0,94.0
mean,1347.893617,1451.276596,1451.234043,984.180851,771.340426,829.297872,934.648936,955.414894,917.819149,967.393617,999.170213,1232.297872
std,5658.567259,5281.059397,5281.878774,3189.329983,2496.028586,2541.893811,2984.370688,2853.488227,2892.606311,3096.406069,3192.889953,4070.067234
min,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
25%,32.25,44.25,59.5,40.5,27.5,28.0,31.75,33.0,31.5,29.25,35.0,47.25
50%,123.5,144.5,222.5,127.5,109.0,120.0,87.5,88.0,101.5,133.5,153.0,176.0
75%,566.0,607.5,848.0,563.0,399.0,408.5,460.5,486.5,530.25,545.5,542.25,593.0
max,51022.0,44972.0,47236.0,27788.0,20291.0,18614.0,24658.0,22450.0,23317.0,25085.0,27249.0,34360.0


In [2]:
import xlrd

# Abre o arquivo XLS
workbook = xlrd.open_workbook('2675.xls')

# Seleciona a primeira planilha
sheet = workbook.sheet_by_index(0)

# Imprime o valor da primeira célula
print(sheet.cell_value(0, 0))


ModuleNotFoundError: No module named 'xlrd'

In [1]:
import pandas as pd

df = pd.read_csv('2675.xls - 2007.csv')
df.head()

Unnamed: 0,Data.Rio,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11,Unnamed: 12,Unnamed: 13
0,,,,,,,,,,,,,,
1,Tabela 2675 - Chegada mensal de turistas pelo ...,,,,,,,,,,,,,
2,,,,,,,,,,,,,,
3,Continentes e países de residência permanente,Número de turistas,,,,,,,,,,,,
4,,Total,Janeiro,Fevereiro,Março,Abril,Maio,Junho,Julho,Agosto,Setembro,Outubro,Novembro,Dezembro
