In [2]:
import pandas as pd
from plotly.subplots import make_subplots
import plotly.graph_objects as go
import plotly.figure_factory as ff

In [3]:
dados = pd.read_csv('dados\pop_idade.csv')
dados

Unnamed: 0,idade
0,39
1,33
2,41
3,50
4,32
...,...
495,40
496,24
497,33
498,26


In [27]:
# Create subplots
fig = make_subplots(rows=1, cols=2, subplot_titles=['Histograma', 'Curva KDE'])

# Histogram plot
histogram_trace = go.Histogram(
    x=dados['idade'],
    histfunc='count',
    showlegend=False,
    name='Idade',
    hoverinfo='y+x',
    hovertemplate='%{x}<br>Frequência: %{y}'
)
fig.add_trace(histogram_trace, row=1, col=1)

# KDE plot
kde_figure = ff.create_distplot([dados['idade']], ['Idade'], show_hist=False)
for trace in kde_figure['data']:
    trace.update(fill='tozeroy', showlegend=False, hoverinfo='y+x', hovertemplate='%{x}<br>Probabilidade: %{y:.2%}')
    fig.add_trace(trace, row=1, col=2)

# Update layout
fig.update_layout(
    title='Distribuição da idade da população de Cidade Alegre para uma amostra de 500 pessoas',
    font={'size': 16},
    template='plotly_dark',
    annotations=[
        {'x': 0.04, 'y': 1.01, 'font': {'size': 18}},
        {'x': 0.587, 'y': 1.01, 'font': {'size': 18}},
    ]
)

# Update traces
fig.update_traces(marker_line_width=1, marker_line_color="white")

# Set y and x limits
fig.update_yaxes(title='Probabilidade', row=1, col=2, tickformat=".0%", title_font=dict(size=16))
fig.update_yaxes(title='Frequência', row=1, col=1, title_font=dict(size=16))
fig.update_xaxes(range=[dados['idade'].min(), dados['idade'].max()])

# Calculate the median
median_value = dados['idade'].median()

# Add a vertical line to the KDE plot at the median
fig.add_shape(
    go.layout.Shape(
        type="line",
        x0=median_value,
        x1=median_value,
        y0=0,
        y1=0.045,
        line=dict(color="red", width=2, dash="dash"),
    ),
    row=1,
    col=2,
)

# Add text annotation
fig.add_annotation(
    go.layout.Annotation(
        text=f'Mediana = {median_value:.0f} anos',
        x=(median_value + 8),
        y=0.042,
        showarrow=False,
        font=dict(color="red", size=12),
    ),
    row=1,
    col=2,
)

# Show the figure
fig.show()
