## Um pouco sobre a base de dados 

O arquivo mostra dados coletados entre 2022 e 2023 pela Eurostat, uma organização europeia de estatística, que dizem respeito ao fluxo de imigrantes nos países europeus. São apresentadas informações como a quantidade de imigrantes com nacionalidade e sem nacionalidade residindo em cada país europeu e dados sobre o perfil dessa população, como o percentual de homens e mulheres e de pessoas provenientes de países-membros ou não da União Europeia.

## Importação das bibliotecas + leitura e visão geral da base de dados

In [None]:
import pandas as pd
import numpy as np


In [None]:
df = pd.read_csv("EU Immigrants.csv")

df.head()


In [None]:
df.shape

In [None]:
df.columns

In [None]:
df_slice_sem_nulos = df[2:31] #separando a parte da tabela em que as linhas estão preenchidas para verificar se há dados duplicados nelas
df_slice_sem_nulos

df_slice_sem_nulos.duplicated() #verificando se há dados duplicados na parte da tabela que não apresenta linhas vazias (e não há dados duplicados)

In [None]:
#método incluído para contabilizar a quantidade de posições nulas na tabela 
df.isnull().sum()

## Função para tratamento dos dados
Esta função foi criada para:

* Remover valores nulos (no caso deste DF em particular, as últimas 34 linhas)
* Reordenar valores (arbitrariamente)
* Excluir 1 coluna (arbitrariamente)
* Resetar o índice
* Exportar o DF modificado para csv


In [None]:
def processamento(df):
   df.drop(columns=['IMMIGRANTS WITH NATIONALITY(THOUSANDS)'], inplace=True) #remove 1 coluna
   df.dropna(subset=['EU COUNTRIES'], inplace=True)  #remove as 34 linhas finais, que estão vazias
   df.sort_values(['PERCENTAGE OF IMMIGRANTS BY SEX(MALE)'], axis = 0, ascending=True, inplace=True) #coloca os percentuais dessa coluna em ordem crescente
   df.reset_index(drop=True, inplace=True)
   df.to_csv("exercicio_imigracao_ue.csv")
   
 
   

In [None]:
copia_df_inicial = df.copy() #as alterações do tratamento de dados serão feitas nessa cópia
copia_df_inicial

In [None]:
processamento(copia_df_inicial)
copia_df_inicial

## Insights
### Algumas curiosidades aferidas...
* A média do número de imigrantes nos países europeus no período contemplado pela pesquisa é de 127,5 (em milhares).
* O país europeu com a maior população imigrante feminina é o Chipre, com 53,5% de mulheres neste grupo.
* Já a Croácia é o país com a maior população imigrante masculina, contabilizando 72,7% de homens neste grupo.
* Quase metade da população de imigrantes de Lieshtenstein provém de países que não fazem parte da União Europeia (47,3%). Este também é o país com o maior percentual de imigrantes (68,6%) em relação à população total, ou seja, há mais imigrantes do que locais vivendo em Lieshtenstein. 
* A Romênia, em contrapartida, apresenta o menor percentual de imigrantes nascidos em países que não fazem parte da União Europeia (0,7%) e o menor percentual de imigrantes em relação à população total (1,7%). 

In [None]:
copia_df_inicial[['PERCENTAGE OF IMMIGRANTS BY SEX(FEMALE)', 'PERCENTAGE OF IMMIGRANTS BY SEX(MALE)']].max()


In [None]:
valor_min = copia_df_inicial['%AGE OF BORN IN NON-EU COUNTRY'].min()
valor_min 
resultado = copia_df_inicial[copia_df_inicial['%AGE OF BORN IN NON-EU COUNTRY'] == valor_min]
resultado

In [None]:
#valor_max = copia_df_inicial['%AGE OF BORN IN NON-EU COUNTRY'].max()
#valor_max
resultado = copia_df_inicial[copia_df_inicial['%AGE OF BORN IN NON-EU COUNTRY'] == valor_max]
resultado

In [None]:
valor_max = copia_df_inicial['%AGE OF FOREIGN BORN IMMIGRANTS BY TOTAL POPULATION'].max()
copia_df_inicial[copia_df_inicial['%AGE OF FOREIGN BORN IMMIGRANTS BY TOTAL POPULATION'] == valor_max]

In [None]:
valor_min = copia_df_inicial['%AGE OF FOREIGN BORN IMMIGRANTS BY TOTAL POPULATION'].min()
copia_df_inicial[copia_df_inicial['%AGE OF FOREIGN BORN IMMIGRANTS BY TOTAL POPULATION'] == valor_min]

In [None]:
media_total_de_imigrantes = copia_df_inicial['TOTAL IMMIGRANTS(IN THOUSANDS)'].mean()
media_total_de_imigrantes