In [1]:
import pandas
import plotly.express as px
import plotly.graph_objects as go
import plotly.subplots as sp

In [2]:
pib = pandas.read_csv(
    "https://raw.githubusercontent.com/alura-cursos/dataviz-graficos-composicao-relacionamento/main/dados/pib_br_2002_2020_estados.csv"
)
pib.head()

Unnamed: 0,ano,sigla_uf,regiao,pib,impostos_liquidos,va,va_agropecuaria,va_industria,va_servicos,va_adespss
0,2002,RO,Norte,7467629886,839731192,6627898698,715526872,1191090432,2484579193,2236702207
1,2003,RO,Norte,9425010486,1108434936,8316575548,1278658831,1216605061,3376727040,2444584625
2,2004,RO,Norte,11004641436,1288806654,9715834778,1288515348,1674933817,3986529419,2765856199
3,2005,RO,Norte,12511821181,1476144194,11035676990,1342222120,1887932121,4603783904,3201738843
4,2006,RO,Norte,13054713344,1613809974,11440903374,1238006193,2210692147,4320526746,3671678293


In [3]:
pib.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 513 entries, 0 to 512
Data columns (total 10 columns):
 #   Column             Non-Null Count  Dtype 
---  ------             --------------  ----- 
 0   ano                513 non-null    int64 
 1   sigla_uf           513 non-null    object
 2   regiao             513 non-null    object
 3   pib                513 non-null    int64 
 4   impostos_liquidos  513 non-null    int64 
 5   va                 513 non-null    int64 
 6   va_agropecuaria    513 non-null    int64 
 7   va_industria       513 non-null    int64 
 8   va_servicos        513 non-null    int64 
 9   va_adespss         513 non-null    int64 
dtypes: int64(8), object(2)
memory usage: 40.2+ KB


# Como estão dispostos os valores agregados de serviços por região do Brasil no ano de 2018?

In [4]:
df_services_2018 = (
    pib.query("ano == 2018").groupby("regiao")["va_servicos"].sum().reset_index()
)
df_services_2018

Unnamed: 0,regiao,va_servicos
0,Centro-Oeste,296250896281
1,Nordeste,433449662991
2,Norte,133394247965
3,Sudeste,1933221862566
4,Sul,546627330178


In [5]:
fig = px.pie(
    df_services_2018,
    values="va_servicos",
    names="regiao",
    color="regiao",
    color_discrete_sequence=px.colors.qualitative.Dark24,
    height=600,
    width=800
)
fig.update_traces(
    textposition="inside",
    textinfo="percent+label",
    textfont=dict(color="white"),
    texttemplate="<b>%{label}<br>%{percent}",
    hoverinfo="skip",
    hovertemplate=None,
)
fig.update_layout(
    title_text="<b>Composição dos valores agregados do setor de serviços em 2018",
    showlegend=False,
)
fig.show()

# Qual a participação da Região Norte nos valores agregados da indústria de todo Brasil nos anos de 2010 e 2020?

In [6]:
pib_norte_2010 = pib.query("ano == 2010")[['regiao', 'pib']]
pib_norte_2010.loc[pib_norte_2010['regiao'] != 'Norte', 'regiao'] = 'Outros'
pib_norte_2010 = pib_norte_2010.groupby('regiao').sum()
pib_norte_2010

Unnamed: 0_level_0,pib
regiao,Unnamed: 1_level_1
Norte,207093644805
Outros,3678753355168


In [7]:
pib_norte_2020 = pib.query("ano == 2020")[['regiao', 'pib']]
pib_norte_2020.loc[pib_norte_2020['regiao'] != 'Norte', 'regiao'] = 'Outros'
pib_norte_2020 = pib_norte_2020.groupby('regiao').sum()
pib_norte_2020

Unnamed: 0_level_0,pib
regiao,Unnamed: 1_level_1
Norte,478173048893
Outros,7131423951126


In [8]:
# Defina as cores para o gráfico
colors = ['#1f77b4', '#7f7f7f']

# Crie os subplots com o tipo "pie"
fig = sp.make_subplots(rows=1, cols=2, specs=[[{"type": "pie"}, {"type": "pie"}]])

# Crie o primeiro gráfico de pizza
fig.add_trace(go.Pie(
    labels=pib_norte_2010.index,
    values=pib_norte_2010['pib'],
    textinfo='label+percent',
    marker=dict(colors=colors),
    hole=0.6,
    sort=False,
    rotation=270,
    hoverinfo='skip',
    hovertemplate=None
), row=1, col=1)

# Crie o segundo gráfico de pizza
fig.add_trace(go.Pie(
    labels=pib_norte_2020.index,
    values=pib_norte_2020['pib'],
    textinfo='label+percent',
    marker=dict(colors=colors),
    hole=0.6,
    sort=False,
    rotation=270,
    hoverinfo='skip',
    hovertemplate=None
), row=1, col=2)

# Personalize o layout
fig.update_layout(
    title='<b>Participação da Região Norte nos Valores Agregados da Indústria</b><br>Em 2010 e 2020',
    title_font=dict(size=18),
    showlegend=False,
    height=600,
    width=800,
    annotations=[
        dict(
            text='2010',
            x=0.18,
            y=0.5,
            font_size=20,
            showarrow=False,
        ),
        dict(
            text='2020',
            x=0.82,
            y=0.5,
            font_size=20,
            showarrow=False,
        )
    ]
)

# Mostre o gráfico
fig.show()

A região Norte registrou um incremento de 0,95% no período de 2010 a 2020 no Produto Interno Bruto (PIB) proveniente do setor industrial quando comparado com as outras regiões do Brasil