In [11]:
#Importações
import plotly.express as px
import plotly.graph_objs as go
import pandas as pd

In [12]:
# Criando DataSet para utilização neste mini projeto de Analise Exploratória de Dados, dataset proprio do plotly
data = px.data.gapminder()
data.head()

Unnamed: 0,country,continent,year,lifeExp,pop,gdpPercap,iso_alpha,iso_num
0,Afghanistan,Asia,1952,28.801,8425333,779.445314,AFG,4
1,Afghanistan,Asia,1957,30.332,9240934,820.85303,AFG,4
2,Afghanistan,Asia,1962,31.997,10267083,853.10071,AFG,4
3,Afghanistan,Asia,1967,34.02,11537966,836.197138,AFG,4
4,Afghanistan,Asia,1972,36.088,13079460,739.981106,AFG,4


In [13]:
# Verificando informações das colunas
data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1704 entries, 0 to 1703
Data columns (total 8 columns):
 #   Column     Non-Null Count  Dtype  
---  ------     --------------  -----  
 0   country    1704 non-null   object 
 1   continent  1704 non-null   object 
 2   year       1704 non-null   int64  
 3   lifeExp    1704 non-null   float64
 4   pop        1704 non-null   int64  
 5   gdpPercap  1704 non-null   float64
 6   iso_alpha  1704 non-null   object 
 7   iso_num    1704 non-null   int64  
dtypes: float64(2), int64(3), object(3)
memory usage: 106.6+ KB


In [14]:
# Traduzindo colunas
data.columns = ['Pais','Continente','Ano','ExpVida','Populacao','Pib','Iso_Alpha','Iso_Num']
data.head()

Unnamed: 0,Pais,Continente,Ano,ExpVida,Populacao,Pib,Iso_Alpha,Iso_Num
0,Afghanistan,Asia,1952,28.801,8425333,779.445314,AFG,4
1,Afghanistan,Asia,1957,30.332,9240934,820.85303,AFG,4
2,Afghanistan,Asia,1962,31.997,10267083,853.10071,AFG,4
3,Afghanistan,Asia,1967,34.02,11537966,836.197138,AFG,4
4,Afghanistan,Asia,1972,36.088,13079460,739.981106,AFG,4


***Informações sobre o DataSet:***

---



---




1.   **country(pais):** Esta coluna contém o nome do país ao qual as informações se referem. Cada país tem várias entradas ao longo dos anos.

2.   **continent(continente):** A coluna "continent" indica a qual continente o país pertence.

3.   **year(ano):** Esta coluna representa o ano em que os dados foram registrados. O conjunto de dados abrange vários anos, permitindo análises ao longo do tempo.

4.   **lifeExp(expvida)** A coluna "lifeExp" representa a expectativa de vida média em anos para os cidadãos do país em um determinado ano.

5.   **pop(populacao):** A coluna "pop" contém a população do país naquele ano.

6.   **gdpPercap(pib):** "gdpPercap" é a abreviação de "GDP per capita" (Produto Interno Bruto per capita). Representa a renda média por pessoa no país naquele ano.

7.   **iso_alpha:** Esta coluna contém códigos alfanuméricos de três letras que representam a identificação de cada país de acordo com o padrão da norma ISO 3166-1 alpha-3. Esses códigos são usados para identificar exclusivamente países em todo o mundo. Por exemplo, "USA" é o código ISO alpha-3 para os Estados Unidos, "CAN" para o Canadá e assim por diante.

8.   **iso_num:** Esta coluna contém códigos numéricos de três dígitos que representam a identificação de cada país de acordo com o padrão da norma ISO 3166-1 numeric. Esses códigos numéricos também são usados para identificar países de forma exclusiva. Por exemplo, "840" é o código ISO numérico para os Estados Unidos, "124" para o Canadá, etc

In [15]:
# Criação de DataFrame Separado para Agrupar o PIB de cada Continente por Ano
data_continente_ano = data.groupby(['Continente','Ano'])['Pib'].sum().reset_index()
data_continente_ano.head()

Unnamed: 0,Continente,Ano,Pib
0,Africa,1952,65133.768223
1,Africa,1957,72032.275237
2,Africa,1962,83100.098892
3,Africa,1967,106618.917645
4,Africa,1972,121660.015058


In [16]:
# Criando Gráfico de Comparativo de PIB x Continente
fig = go.Figure() # Criando Plot

#Criando Linhas através de um For para ganhar agilidade e evitar redundância
for continente in data_continente_ano['Continente'].unique():
  fig.add_trace(go.Scatter(x = data_continente_ano[data_continente_ano['Continente'] == continente]['Ano'],
                          y = data_continente_ano[data_continente_ano['Continente'] == continente]['Pib'],
                          mode = 'lines',
                          name = continente))

fig.update_layout(title = 'Evolução de PIB por Contiente (1950-2007)',
                  font_family = 'Arial',
                  legend_title = 'Continentes',
                  legend_title_font_color = 'red',
                  xaxis = {'title':'Ano'},
                  yaxis = {'title': 'PIB', 'showticklabels': False}
                  )

fig.show()

In [17]:
# Criação de DataFrame Separado com 4 Paises para Análise
lista = ['Brazil', 'United States', 'Cuba', 'Venezuela']
data_pais = data.query('Pais in @lista')
data_pais.Pais.unique()

array(['Brazil', 'Cuba', 'United States', 'Venezuela'], dtype=object)

In [18]:
# Criando Gráfico de Comparativo de Expectativa de Vida x Paises (De minha escolha)
fig = go.Figure() # Criando Plot

#Criando Linhas
fig.add_trace(go.Scatter(x = data_pais[data_pais['Pais'] == 'Brazil']['Ano'],
                         y = data_pais[data_pais['Pais'] == 'Brazil']['ExpVida'],
                         mode = 'lines',
                         name = 'Brasil',
                         line = {'color':'black', 'width' : 3}
                         ))

fig.add_trace(go.Scatter(x = data_pais[data_pais['Pais'] == 'Cuba']['Ano'],
                         y = data_pais[data_pais['Pais'] == 'Cuba']['ExpVida'],
                         mode = 'lines',
                         name = 'Cuba',
                         line = {'color':'gray', 'width' : 3}
                         ))

fig.add_trace(go.Scatter(x = data_pais[data_pais['Pais'] == 'United States']['Ano'],
                         y = data_pais[data_pais['Pais'] == 'United States']['ExpVida'],
                         mode = 'lines',
                         name = 'Estados Unidos',
                         line = {'color':'blue', 'width' : 3}
                         ))

fig.add_trace(go.Scatter(x = data_pais[data_pais['Pais'] == 'Venezuela']['Ano'],
                         y = data_pais[data_pais['Pais'] == 'Venezuela']['ExpVida'],
                         mode = 'lines',
                         name = 'Venezuela',
                         line = {'color':'red', 'width' : 3}
                         ))

fig.update_layout(title = 'Evolução de Expectativa de Vida entre Países Escolhidos (1950-2007)',
                  font_family = 'Arial',
                  legend_title = 'Países',
                  legend_title_font_color = 'red',
                  xaxis = {'title':'Ano'},
                  yaxis = {'title': 'Expectativa de Vida'}
                  )

fig.show()

In [19]:
# Criando DataFrame específico para dados de Israel
data_israel = data.query('Pais == "Israel"')
data_israel.head()

Unnamed: 0,Pais,Continente,Ano,ExpVida,Populacao,Pib,Iso_Alpha,Iso_Num
756,Israel,Asia,1952,65.39,1620914,4086.522128,ISR,376
757,Israel,Asia,1957,67.84,1944401,5385.278451,ISR,376
758,Israel,Asia,1962,69.39,2310904,7105.630706,ISR,376
759,Israel,Asia,1967,70.75,2693585,8393.741404,ISR,376
760,Israel,Asia,1972,71.63,3095893,12786.93223,ISR,376


In [20]:
# Criando Gráfico  para Verificar a Populção de Isreal no Decorrer do Tempo, em alusão ao Ano e PIB
fig = px.bar(data_israel, x = 'Ano', y = 'Populacao',
             labels = {'Populacao':'População'},
             title = 'População em Israel (1952-2007)',
             color = 'Pib')

fig.show()

In [21]:
# Criando Gráfico de Pizza para visualização da população por continente
fig = px.pie(data, values = 'Populacao', names = 'Continente',
             title = 'População por Continente (1950-2007)',
             color_discrete_sequence= px.colors.sequential.Bluyl)
fig.show()