[Obesity among adults by country, 1975-2016](https://www.kaggle.com/amanarora/obesity-among-adults-by-country-19752016/)


In [None]:
import pandas as pd
import numpy as np
import plotly 
import matplotlib.pyplot as plt


In [None]:
df_obesity = pd.read_csv(r"I:\ARQUIVOS PROJETOS\Análise de dados de Obesidade e PIB\analise-de-obesidade-e-pib-per-capita\Datasets/obesity_cleaned.csv")

In [None]:
# Criar variáveis para trabalhar com colunas específicas
countries = df_obesity['Country']
years = df_obesity['Year']
obesity_percentages = df_obesity['Obesity (%)']
sexes = df_obesity['Sex']

# Exemplo de como você pode usar essas variáveis
for country, year, obesity_percentage, sex in zip(countries, years, obesity_percentages, sexes):
    print(f"Country: {country}, Year: {year}, Obesity: {obesity_percentage}, Sex: {sex}")

In [None]:
df_obesity.head()

In [None]:
df_obesity.tail()

In [None]:
df_obesity.shape

In [None]:
df_obesity.info()

In [None]:
df_obesity.dtypes.value_counts()

In [None]:
# Excluir a coluna 'Unnamed: 0'
df_obesity = df_obesity.drop('Unnamed: 0', axis=1, errors='ignore')



In [None]:
df_obesity.head()

In [None]:
df_obesity.isnull().sum()

In [None]:
df_obesity.isna().sum()

In [None]:
df_obesity.columns

In [None]:
# Supondo que seu DataFrame seja df_obesity
df_obesity.set_index('Year', inplace=True)


In [None]:
df_obesity.head()

In [None]:
# Substituir "No" por NaN na coluna 'Obesity (%)'
df_obesity["Obesity (%)"].replace("No", np.nan, inplace=True)

# Extrair apenas a parte numérica antes do espaço na coluna 'Obesity (%)' e converter para float
def extract_obesity(x):
    try:
        return float(x.split(" ")[0])
    except ValueError:
        return np.nan

df_obesity["Obesity"] = df_obesity["Obesity (%)"].apply(extract_obesity)


In [None]:
df_obesity.head()

In [None]:
df_obesity.info()

In [None]:
df_obesity['Country'].unique()

In [None]:
mean_obesity_by_sex = df_obesity.groupby('Sex')['Obesity'].mean()

In [None]:
mean_obesity_by_sex 

In [None]:
import plotly.graph_objects as go
# Criar figura
fig = go.Figure()

# Adicionar barras para cada sexo
for sex, mean_obesity in mean_obesity_by_sex.items():
    fig.add_trace(go.Bar(
        x=[sex],
        y=[mean_obesity],
        name=sex
    ))

# Atualizar layout do gráfico
fig.update_layout(
    title='Percentual Médio de Obesidade por Sexo',
    xaxis=dict(title='Sexo'),
    yaxis=dict(title='Percentual de Obesidade'),
    barmode='group'  # agrupar as barras por categoria (sexo)
)

# Exibir o gráfico
fig.show()

In [None]:
# Gráfico de Linhas Comparando Homens e Mulheres
plt.figure(figsize=(12, 6))
sns.lineplot(data=df_obesity, x='Year', y='Obesity (%)', hue='Sex', style='Sex')
plt.title('Comparação de Prevalência de Obesidade entre Homens e Mulheres')
plt.xlabel('Ano')
plt.ylabel('Obesidade (%)')
plt.legend(title='Sexo', bbox_to_anchor=(1.05, 1), loc='upper left')
plt.grid(True)
plt.show()


In [None]:
# Encontrar o índice do máximo valor na coluna 'Obesity'
max_obesity_index = df_obesity['Obesity'].idxmax()

# Obter as informações do país e sexo correspondentes
country_max_obesity = df_obesity.loc[max_obesity_index, 'Country']
sex_max_obesity = df_obesity.loc[max_obesity_index, 'Sex']
max_obesity_percent = df_obesity.loc[max_obesity_index, 'Obesity']

# Exibir o resultado
print(f"País com maior obesidade: {country_max_obesity}")
print(f"Sexo com maior obesidade: {sex_max_obesity}")
print(f"Percentual de obesidade: {max_obesity_percent}%")


In [None]:
import plotly.express as px

# Substitua 'df_obesity' pelo nome real do seu DataFrame
fig = px.bar(df_obesity, x='Sex', y='Obesity', color='Country',
             title='Percentual de Obesidade por Sexo em Diferentes Países',
             labels={'Obesity': 'Percentual de Obesidade'})

# Personalize o layout se necessário
fig.update_layout(
    xaxis_title='Sexo',
    yaxis_title='Percentual de Obesidade',
    barmode='group'  # Agrupa as barras por sexo
)

# Exibir o gráfico
fig.show()


In [None]:
# Filtrar o DataFrame para incluir apenas os dados do Brasil
df_brazil_sex = df_obesity[df_obesity['Country'] == 'Brazil']

# Calcular a média de obesidade por sexo
mean_obesity_brazil_by_sex = df_brazil_sex.groupby('Sex')['Obesity'].mean().reset_index()

# Exibir a média de obesidade do Brasil por sexo
print(mean_obesity_brazil_by_sex)


In [None]:
import plotly.express as px

# Filtrar o DataFrame para incluir apenas os dados do Brasil
df_brazil_sex = df_obesity[df_obesity['Country'] == 'Brazil']

# Calcular a média de obesidade por sexo no Brasil
mean_obesity_brazil_by_sex = df_brazil_sex.groupby('Sex')['Obesity'].mean().reset_index()

# Calcular a média de obesidade por sexo mundial
mean_obesity_by_sex = df_obesity.groupby('Sex')['Obesity'].mean().reset_index()

# Criar um DataFrame combinado para comparar
df_combined = pd.concat([mean_obesity_by_sex, mean_obesity_brazil_by_sex.assign(Location='Brazil')])

# Plotar o gráfico comparativo
fig = px.bar(df_combined, x='Sex', y='Obesity', color='Location', title='Comparativo de Obesidade por Sexo',
             labels={'Obesity': 'Média de Obesidade (%)', 'Location': 'Localização'})

# Mostrar o gráfico
fig.show()


In [None]:
import plotly.express as px

# Filtrar o DataFrame para incluir apenas os dados do Brasil
df_brazil_sex = df_obesity[df_obesity['Country'] == 'Brazil']

# Calcular a média de obesidade por sexo no Brasil
mean_obesity_brazil_by_sex = df_brazil_sex.groupby('Sex')['Obesity'].mean().reset_index()

# Calcular a média de obesidade por sexo mundial
mean_obesity_by_sex = df_obesity.groupby('Sex')['Obesity'].mean().reset_index()

# Criar um DataFrame combinado para comparar Brasil e média mundial
df_combined = pd.concat([mean_obesity_by_sex.assign(Location='World'), mean_obesity_brazil_by_sex.assign(Location='Brazil')])

# Plotar o gráfico comparativo
fig = px.bar(df_combined, x='Sex', y='Obesity', color='Location', title='Comparativo de Obesidade por Sexo',
             labels={'Obesity': 'Média de Obesidade (%)', 'Location': 'Localização'})

# Mostrar o gráfico
fig.show()


In [None]:
import plotly.express as px

# Filtrar os dados para o intervalo desejado
df_world_mean = df_obesity[(df_obesity.index >= 1975) & (df_obesity.index <= 2016)]

# Calcular a média mundial por ano
mean_world_by_year = df_world_mean.groupby(df_world_mean.index)['Obesity'].mean().reset_index()

# Plotar a evolução da média mundial entre os anos de 1975 e 2016
fig = px.line(mean_world_by_year, x='Year', y='Obesity', title='Evolução da média mundial de obesidade (1975-2016)')
fig.show()


In [None]:
import plotly.express as px

# Filtrar os dados para incluir apenas o Brasil
df_brazil = df_obesity[df_obesity['Country'] == 'Brazil']

# Resetar o índice para tornar o "Year" uma coluna novamente
df_brazil_reset = df_brazil.reset_index()

# Plotar a evolução da obesidade no Brasil
fig = px.line(df_brazil_reset, x='Year', y='Obesity', title='Evolução da obesidade no Brasil (1975-2016)')
fig.show()


In [None]:
import plotly.express as px

# Filtrar os dados para incluir apenas o Brasil
df_brazil = df_obesity[df_obesity['Country'] == 'Brazil']

# Resetar o índice para tornar o "Year" uma coluna novamente
df_brazil_reset = df_brazil.reset_index()

# Filtrar os dados para o intervalo desejado
df_world_mean = df_obesity[(df_obesity.index >= 1975) & (df_obesity.index <= 2016)]

# Calcular a média mundial por ano
mean_world_by_year = df_world_mean.groupby(df_world_mean.index)['Obesity'].mean().reset_index()

# Plotar a evolução da obesidade no Brasil e média mundial
fig = px.line(df_brazil_reset, x='Year', y='Obesity', title='Evolução da obesidade no Brasil e Média Mundial (1975-2016)',
              line_shape='linear', labels={'Obesity': 'Obesidade (%) - Brasil'})

# Adicionar a linha da média mundial ao mesmo gráfico
fig.add_trace(px.line(mean_world_by_year, x='Year', y='Obesity', title='Média Mundial',
                      line_shape='linear', labels={'Obesity': 'Obesidade (%) - Média Mundial'}).data[0])

# Ajustar as cores das linhas
fig.update_traces(line=dict(color='blue'), selector=dict(name='Obesity - Brasil'))
fig.update_traces(line=dict(color='red'), selector=dict(name='Obesity - Média Mundial'))

# Mostrar o gráfico
fig.show()



- Quais são os 5 países com a maior e a menor taxa de aumento nos índices de obesidade no período observado?

In [None]:
# Calcular a diferença nos índices de obesidade entre o primeiro e o último ano para cada país
df_obesity['Obesity Change'] = df_obesity.groupby('Country')['Obesity'].transform(lambda x: x.iloc[-1] - x.iloc[0])

# Encontrar os 5 países com a maior taxa de aumento
top_increase = df_obesity.sort_values('Obesity Change', ascending=False).head(5)

# Encontrar os 5 países com a menor taxa de aumento
top_decrease = df_obesity.sort_values('Obesity Change').head(5)

# Exibir os resultados
print("Top 5 países com a maior taxa de aumento:")
print(top_increase[['Country', 'Obesity Change']])

print("\nTop 5 países com a menor taxa de aumento:")
print(top_decrease[['Country', 'Obesity Change']])


In [None]:
import plotly.express as px

# Calcular a diferença nos índices de obesidade entre o primeiro e o último ano para cada país
df_obesity['Obesity Change'] = df_obesity.groupby('Country')['Obesity'].transform(lambda x: x.iloc[-1] - x.iloc[0])

# Encontrar os 5 países com a maior taxa de aumento
top_increase = df_obesity.sort_values('Obesity Change', ascending=False).head(5)

# Encontrar os 5 países com a menor taxa de aumento
top_decrease = df_obesity.sort_values('Obesity Change').head(5)

# Exibir os resultados
print("Top 5 países com a maior taxa de aumento:")
print(top_increase[['Country', 'Obesity Change']])

print("\nTop 5 países com a menor taxa de aumento:")
print(top_decrease[['Country', 'Obesity Change']])

# Plotar o gráfico
fig = px.bar(df_obesity, x='Country', y='Obesity Change',
             title='Diferença nos Índices de Obesidade entre o Primeiro e o Último Ano',
             labels={'Obesity Change': 'Variação nos Índices de Obesidade'},
             color='Country', color_discrete_map={'Country': 'viridis'})

# Ajustar layout
fig.update_layout(barmode='group')

# Mostrar o gráfico
fig.show()


In [None]:
# Filtrar o DataFrame para incluir apenas os dados do Brasil no período desejado
df_brazil_ranking = df_obesity.loc[(df_obesity['Country'] == 'Brazil') & (df_obesity.index >= 1975) & (df_obesity.index <= 2016)]

# Calcular a posição no ranking ano a ano
brazil_ranking_by_year = df_brazil_ranking['Obesity'].rank(ascending=False)

# Exibir a posição no ranking ano a ano
print(brazil_ranking_by_year)


In [None]:
import plotly.express as px

# Filtrar o DataFrame para incluir apenas os dados do Brasil no período desejado
df_brazil_ranking = df_obesity.loc[(df_obesity['Country'] == 'Brazil') & (df_obesity.index >= 1975) & (df_obesity.index <= 2016)]

# Calcular a posição no ranking ano a ano
brazil_ranking_by_year = df_brazil_ranking['Obesity'].rank(ascending=False)

# Criar DataFrame para o gráfico
df_plot = pd.DataFrame({'Year': brazil_ranking_by_year.index, 'Ranking Position': brazil_ranking_by_year.values})

# Plotar o gráfico
fig = px.line(df_plot, x='Year', y='Ranking Position', title='Posição no Ranking de Obesidade do Brasil (1975-2016)',
              labels={'Ranking Position': 'Posição no Ranking'})

# Mostrar o gráfico
fig.show()


In [None]:
import plotly.express as px

# Filtrar o DataFrame para incluir apenas os dados do Brasil no período desejado
df_brazil_sex = df_obesity[(df_obesity['Country'] == 'Brazil') & (df_obesity.index >= 1975) & (df_obesity.index <= 2016)]

# Calcular a posição no ranking por sexo ano a ano
brazil_ranking_by_sex = df_brazil_sex.groupby('Sex')['Obesity'].rank(ascending=False)

# Criar DataFrame para o gráfico
df_plot_sex = pd.DataFrame({'Year': df_brazil_sex.index, 'Sex': brazil_ranking_by_sex.index, 'Ranking Position': brazil_ranking_by_sex.values})

# Plotar o gráfico
fig_sex = px.line(df_plot_sex, x='Year', y='Ranking Position', color='Sex', title='Evolução no Ranking de Obesidade por Sexo no Brasil (1975-2016)',
                   labels={'Ranking Position': 'Posição no Ranking', 'Sex': 'Sexo'})

# Mostrar o gráfico
fig_sex.show()


- Quais os países com maiores e menores níveis percetuais de obesidade em 2015?

In [None]:
df_2015 = df_obesity[df_obesity.index == 2015].copy()
df_2015[df_2015["Obesity"] == df_2015["Obesity"].max()]

In [None]:
df_2015 = df_obesity[df_obesity.index == 2015].copy()
df_2015[df_2015["Obesity"] == df_2015["Obesity"].min()]

- Qual a diferença média percentual de obesidade entre sexos ao longo dos anos para o Brasil?

In [None]:
# Filtrar o DataFrame para incluir apenas os dados do Brasil
df_brazil = df_obesity[df_obesity['Country'] == 'Brazil']

# Calcular a diferença percentual de obesidade entre sexos
df_brazil['Obesity Difference'] = df_brazil.groupby(df_brazil.index)['Obesity'].transform(lambda x: (x.diff() / x.shift()) * 100)

# Calcular a média da diferença percentual ao longo dos anos
mean_difference = df_brazil.groupby(df_brazil.index)['Obesity Difference'].mean().reset_index()

# Plotar o gráfico
fig = px.line(mean_difference, x='Year', y='Obesity Difference', title='Diferença Média Percentual de Obesidade entre Sexos no Brasil',
              labels={'Obesity Difference': 'Diferença Média Percentual de Obesidade'})

# Mostrar o gráfico
fig.show()

In [None]:
# Criar um novo índice numérico
df_obesity_reset = df_obesity.reset_index()

# Filtrar o DataFrame para incluir apenas os dados do Brasil
df_brazil = df_obesity_reset[df_obesity_reset['Country'] == 'Brazil']

# Calcular a diferença percentual de obesidade entre sexos
df_brazil['Obesity Difference'] = df_brazil.groupby(['Year', 'Sex'])['Obesity'].transform(lambda x: (x.diff() / x.shift()) * 100)

# Calcular a média da diferença percentual ao longo dos anos
mean_difference = df_brazil.groupby(['Year', 'Sex'])['Obesity Difference'].mean().reset_index()

# Plotar o gráfico
fig = px.line(mean_difference, x='Year', y='Obesity Difference', color='Sex',
              title='Diferença Média Percentual de Obesidade entre Sexos no Brasil',
              labels={'Obesity Difference': 'Diferença Média Percentual de Obesidade'})

# Mostrar o gráfico
fig.show()