# **CI√äNCIA DE DADOS** - DCA3501

UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE, NATAL/RN

DEPARTAMENTO DE ENGENHARIA DE COMPUTA√á√ÉO E AUTOMA√á√ÉO

(C) 2025-2026 CARLOS M D VIEGAS

https://github.com/cmdviegas

# Introdu√ß√£o ao Streamlit

Este notebook apresenta uma introdu√ß√£o ao uso do Streamlit para criar aplica√ß√µes web interativas para visualiza√ß√£o e an√°lise de dados.

## O que √© o Streamlit?

O Streamlit √© uma biblioteca Python que transforma scripts de an√°lise de dados em aplica√ß√µes web interativas.

√â bastante utilizada para:
- Explorar dados interativamente;
- Criar dashboards r√°pidos;
- Comunicar resultados e insights de forma visual.

Site oficial: [https://streamlit.io](https://streamlit.io)

## Instala√ß√£o e execu√ß√£o

O Streamlit √© um app web: quando voc√™ executa `streamlit run app.py`, ele sobe um servidor HTTP (por padr√£o na porta `8501/tcp`) e espera que o navegador acesse `http://localhost:8501`.

> ATEN√á√ÉO:  
>
> Localmente, em seu computador, isto funciona perfeitamente uma vez que o navegador e o servidor est√£o na mesma m√°quina.  
>
> Entretanto, no Google Colab, o kernel roda em um servidor remoto do Google, n√£o no seu computador. Voc√™ at√© consegue iniciar o servidor, mas as conex√µes externas s√£o bloqueadas e o navegador n√£o consegue "entrar" no servidor do Colab para visualizar o app.
>
> Para contornar essa limita√ß√£o, podemos usar uma ferramenta que cria um t√∫nel seguro entre o ambiente remoto do Colab e o seu navegador. Esta ferramenta chama-se `ngrok`. O `ngrok` gera uma URL p√∫blica tempor√°ria (exemplo: `https://xyz.ngrok.io`) que redireciona as requisi√ß√µes dessa URL para a porta interna onde o Streamlit est√° rodando dentro do Colab.
>
> Dessa forma, mesmo que o servidor esteja rodando em um ambiente isolado, voc√™ pode acessar e interagir com o app normalmente pelo navegador.  

### Instala√ß√£o

- Localmente, em um terminal, instalar por meio do pip:
    ```
    pip install streamlit
    ```

- No Colab, em uma c√©lula python, instalar por meio do pip os pacotes `streamlit` e `ngrok`:
    ```
    !pip install streamlit pyngrok -q
    ```

### Execu√ß√£o

- Localmente, para executar uma aplica√ß√£o, em um terminal:

    ```
    streamlit run app.py
    ```

    Depois acessar: `http://localhost:8501`

<br>

- No Colab, com `ngrok`, em uma c√©lula python:

    ```
    !ngrok authtoken SEU_TOKEN_AQUI

    from pyngrok import ngrok

    # Iniciar o Streamlit
    !streamlit run app.py --server.port 8501 --server.headless true > /dev/null 2>&1 &

    # Abrir o t√∫nel
    public_url = ngrok.connect(port=8501)
    print("Seu app Streamlit est√° dispon√≠vel em:", public_url)
    ```

    Depois acessar o endere√ßo informado acima por `public_url`.

In [None]:
# Para instalar o Streamlit e o ngrok no Colab
!pip install streamlit pyngrok -q

In [None]:
# Habilitar o ngrok com seu token
# √â necess√°rio criar uma conta no ngrok para obter o token
# Ap√≥s criar a conta, acesse https://dashboard.ngrok.com/get-started/your-authtoken e copie seu token
!ngrok authtoken SEU_TOKEN_AQUI

In [None]:
# Importa√ß√£o da biblioteca ngrok
from pyngrok import ngrok


## Primeiro app: "Hello, Streamlit!"


In [None]:
%%writefile app_hello.py
import streamlit as st

st.title("Ol√°, Streamlit! üëã")
st.subheader("Primeiro app em Python para Ci√™ncia de Dados")
st.write("Com Streamlit, √© f√°cil transformar an√°lises em interfaces visuais.")
st.markdown("> Experimente alterar o c√≥digo e recarregar o app para ver mudan√ßas em tempo real!")

In [None]:
# Iniciar o Streamlit (localmente)
#!streamlit run app_hello.py

# Iniciar o Streamlit (ngrok)
!streamlit run app_hello.py --server.port 8501 --server.headless true > /dev/null 2>&1 &
public_url = ngrok.connect(addr=8501)
print("Seu app Streamlit est√° dispon√≠vel em:", public_url)

In [None]:
# Para iniciar outras aplica√ß√µes, √© sempre necess√°rio encerrar o streamlit em execu√ß√£o e iniciar o novo app.
!kill $(lsof -t -i:8501) # Encerra o streamlit em execu√ß√£o na porta 8501

## Interatividade com widgets
Streamlit permite criar **entradas do usu√°rio** com facilidade (sliders, checkboxes, selects, etc).

In [None]:
%%writefile app_widgets.py
import streamlit as st

st.title("Interatividade no Streamlit")

# Slider
idade = st.slider("Escolha uma idade", 0, 100, 25)
st.write(f"Idade selecionada: {idade} anos")

# Selectbox
profissao = st.selectbox("Escolha sua profiss√£o", ["Estudante", "Engenheiro", "Cientista de Dados", "Professor"])
st.write(f"Profiss√£o: {profissao}")

# Checkbox
mostrar_texto = st.checkbox("Mostrar mensagem secreta")
if mostrar_texto:
    st.success("üéâ Parab√©ns! Voc√™ descobriu a mensagem secreta!")

In [None]:
# Iniciar o Streamlit (localmente)
#!streamlit run app_widgets.py

# Iniciar o Streamlit (ngrok)
!streamlit run app_widgets.py --server.port 8501 --server.headless true > /dev/null 2>&1 &
public_url = ngrok.connect(addr=8501)
print("Seu app Streamlit est√° dispon√≠vel em:", public_url)

In [None]:
# Para iniciar outras aplica√ß√µes, √© sempre necess√°rio encerrar o streamlit em execu√ß√£o e iniciar o novo app.
!kill $(lsof -t -i:8501) # Encerra o streamlit em execu√ß√£o na porta 8501

## Exibindo dados e gr√°ficos
Vamos usar o dataset `penguins` (Seaborn) para praticar exibi√ß√£o e gr√°ficos no Streamlit.

In [None]:
%%writefile app_penguins.py
import streamlit as st
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt

st.title("An√°lise Interativa ‚Äî Pinguins")

# Carregar dataset
df = sns.load_dataset("penguins")
st.dataframe(df.head())

# Estat√≠sticas b√°sicas
st.write("Resumo estat√≠stico:")
st.write(df.describe())

# Filtro por esp√©cie
especie = st.selectbox("Escolha a esp√©cie:", df['species'].unique())
df_filtrado = df[df['species'] == especie]

# Gr√°fico de dispers√£o
fig, ax = plt.subplots()
ax.scatter(df_filtrado['bill_length_mm'], df_filtrado['flipper_length_mm'], color='tab:blue')
ax.set_xlabel("Comprimento do Bico (mm)")
ax.set_ylabel("Comprimento da Nadadeira (mm)")
ax.set_title(f"Rela√ß√£o entre medidas corporais ‚Äî {especie}")
st.pyplot(fig)

In [None]:
# Iniciar o Streamlit (localmente)
#!streamlit run app_penguins.py

# Iniciar o Streamlit (ngrok)
!streamlit run app_penguins.py --server.port 8501 --server.headless true > /dev/null 2>&1 &
public_url = ngrok.connect(addr=8501)
print("Seu app Streamlit est√° dispon√≠vel em:", public_url)

In [None]:
# Para iniciar outras aplica√ß√µes, √© sempre necess√°rio encerrar o streamlit em execu√ß√£o e iniciar o novo app.
!kill $(lsof -t -i:8501) # Encerra o streamlit em execu√ß√£o na porta 8501

## Layout e organiza√ß√£o (sidebar, colunas, abas)
Use `st.sidebar`, `st.columns` e `st.tabs` para estruturar o app de forma mais profissional.

In [None]:
%%writefile app_layout.py
import streamlit as st
import seaborn as sns
import matplotlib.pyplot as plt

st.set_page_config(page_title="Explora√ß√£o de Dados ‚Äî Pinguins", layout="wide")
st.title("Dashboard Interativo com Streamlit")

df = sns.load_dataset("penguins")

# Sidebar
st.sidebar.header("Filtros")
especie = st.sidebar.multiselect("Esp√©cie:", df['species'].unique(), default=df['species'].unique())

df_filtrado = df[df['species'].isin(especie)]

# Colunas
col1, col2 = st.columns(2)

with col1:
    st.subheader("Visualiza√ß√£o")
    fig, ax = plt.subplots()
    sns.boxplot(data=df_filtrado, x='species', y='bill_length_mm', ax=ax, palette='Blues')
    st.pyplot(fig)

with col2:
    st.subheader("Dados filtrados")
    st.dataframe(df_filtrado)

# Abas
tab1, tab2 = st.tabs(["Estat√≠sticas", "Correla√ß√£o"])
with tab1:
    st.write(df_filtrado.describe())
with tab2:
    st.write(df_filtrado.corr(numeric_only=True))
    st.bar_chart(df_filtrado.corr(numeric_only=True))

In [None]:
# Iniciar o Streamlit (localmente)
#!streamlit run app_layout.py

# Iniciar o Streamlit (ngrok)
!streamlit run app_layout.py --server.port 8501 --server.headless true > /dev/null 2>&1 &
public_url = ngrok.connect(addr=8501)
print("Seu app Streamlit est√° dispon√≠vel em:", public_url)

In [None]:
# Para iniciar outras aplica√ß√µes, √© sempre necess√°rio encerrar o streamlit em execu√ß√£o e iniciar o novo app.
!kill $(lsof -t -i:8501) # Encerra o streamlit em execu√ß√£o na porta 8501

## Boas pr√°ticas e conclus√£o

- Use t√≠tulos narrativos ‚Äî explique o que cada gr√°fico mostra.  
- Crie interatividade relevante ‚Äî n√£o adicione widgets sem prop√≥sito.  
- Mantenha a simplicidade visual.  
- Agrupe informa√ß√µes por se√ß√µes (abas, colunas, sidebar).  
- Sempre comece com uma pergunta de neg√≥cio ou cient√≠fica.  


## Exemplo Avan√ßado - An√°lise Estat√≠stica dos Pinguins

In [None]:
%%writefile app_penguins_avancado.py
import streamlit as st
import seaborn as sns
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import shapiro, ttest_ind

# ---- CONFIGURA√á√ïES GERAIS ----
st.set_page_config(page_title="An√°lise Estat√≠stica Interativa ‚Äî Pinguins", layout="wide")
st.title("üêß An√°lise Estat√≠stica Interativa ‚Äî Pinguins de Palmer")

# ---- DADOS ----
df = sns.load_dataset("penguins").dropna()

# ---- SIDEBAR ----
st.sidebar.header("Filtros de An√°lise")
especies = st.sidebar.multiselect("Esp√©cies:", df["species"].unique(), default=df["species"].unique())
sexo = st.sidebar.multiselect("Sexo:", df["sex"].dropna().unique(), default=df["sex"].dropna().unique())
ilhas = st.sidebar.multiselect("Ilha:", df["island"].unique(), default=df["island"].unique())

df_filtrado = df[
    (df["species"].isin(especies)) &
    (df["sex"].isin(sexo)) &
    (df["island"].isin(ilhas))
]

st.sidebar.write(f"üîé {len(df_filtrado)} pinguins selecionados")

# ---- ABAS ----
tab1, tab2, tab3, tab4 = st.tabs([
    "üìä Distribui√ß√µes", "üìà Correla√ß√£o e Rela√ß√µes", "üß™ Testes Estat√≠sticos", "üó£Ô∏è Insights"
])

# ---- ABA 1: DISTRIBUI√á√ïES ----
with tab1:
    st.subheader("Distribui√ß√µes das Vari√°veis Num√©ricas")
    col1, col2 = st.columns(2)

    with col1:
        var1 = st.selectbox("Selecione a vari√°vel para visualizar (Histograma):", df_filtrado.select_dtypes("number").columns)
        fig, ax = plt.subplots()
        sns.histplot(data=df_filtrado, x=var1, hue="species", kde=True, palette="viridis", ax=ax)
        ax.set_title(f"Distribui√ß√£o de {var1}")
        st.pyplot(fig)
    
    with col2:
        var2 = st.selectbox("Selecione outra vari√°vel (Violinplot):", df_filtrado.select_dtypes("number").columns)
        fig, ax = plt.subplots()
        sns.violinplot(data=df_filtrado, x="species", y=var2, hue="sex", split=True, palette="Set2", ax=ax)
        ax.set_title(f"Distribui√ß√£o de {var2} por esp√©cie e sexo")
        st.pyplot(fig)

    st.write("Resumo estat√≠stico:")
    st.dataframe(df_filtrado.describe().T.style.highlight_max(color='lightgreen'))

# ---- ABA 2: CORRELA√á√ÉO E RELA√á√ïES ----
with tab2:
    st.subheader("Correla√ß√£o e Rela√ß√µes entre Vari√°veis")
    corr = df_filtrado.select_dtypes("number").corr()

    # Heatmap
    fig, ax = plt.subplots(figsize=(6,4))
    sns.heatmap(corr, annot=True, cmap="coolwarm", ax=ax)
    ax.set_title("Matriz de Correla√ß√£o")
    st.pyplot(fig)

    # Scatter interativo
    st.markdown("### Rela√ß√£o entre duas vari√°veis")
    c1, c2 = st.columns(2)
    with c1:
        eixo_x = st.selectbox("Eixo X:", df_filtrado.select_dtypes("number").columns, index=0)
    with c2:
        eixo_y = st.selectbox("Eixo Y:", df_filtrado.select_dtypes("number").columns, index=1)
    
    fig, ax = plt.subplots()
    sns.scatterplot(data=df_filtrado, x=eixo_x, y=eixo_y, hue="species", style="sex", palette="Set1", s=90, ax=ax)
    ax.set_title(f"Rela√ß√£o entre {eixo_x} e {eixo_y}")
    st.pyplot(fig)

    st.info("Dica: Rela√ß√µes mais inclinadas indicam correla√ß√£o forte entre as vari√°veis.")

# ---- ABA 3: TESTES ESTAT√çSTICOS ----
with tab3:
    st.subheader("Testes Estat√≠sticos")
    variavel_teste = st.selectbox("Escolha a vari√°vel num√©rica:", df_filtrado.select_dtypes("number").columns)

    # Normalidade (Shapiro)
    stat, p_shapiro = shapiro(df_filtrado[variavel_teste])
    st.write(f"Teste de normalidade (Shapiro-Wilk): p = {p_shapiro:.4f}")
    if p_shapiro < 0.05:
        st.warning("‚ö†Ô∏è Os dados n√£o seguem uma distribui√ß√£o normal (p < 0.05).")
    else:
        st.success("‚úÖ Os dados seguem uma distribui√ß√£o aproximadamente normal.")

    # Teste t
    especies_disp = df_filtrado["species"].unique()
    if len(especies_disp) == 2:
        dados1 = df_filtrado[df_filtrado["species"] == especies_disp[0]][variavel_teste]
        dados2 = df_filtrado[df_filtrado["species"] == especies_disp[1]][variavel_teste]
        t_stat, p_valor = ttest_ind(dados1, dados2)
        st.write(f"Teste t: p = {p_valor:.4f}")
        if p_valor < 0.05:
            st.success(f"‚úÖ Diferen√ßa significativa entre {especies_disp[0]} e {especies_disp[1]}")
        else:
            st.warning("‚ÑπÔ∏è Nenhuma diferen√ßa significativa detectada.")

    # Boxplot
    fig, ax = plt.subplots()
    sns.boxplot(data=df_filtrado, x="species", y=variavel_teste, palette="pastel", ax=ax)
    ax.set_title(f"Compara√ß√£o de {variavel_teste} entre esp√©cies")
    st.pyplot(fig)

# ---- ABA 4: INSIGHTS ----
with tab4:
    st.subheader("Resumo e Narrativa Estat√≠stica")
    st.markdown("""
    ### Interpreta√ß√£o geral
    - As esp√©cies apresentam diferen√ßas morfol√≥gicas marcantes nos tamanhos de bico, nadadeiras e massa corporal.  
    - O gr√°fico de dispers√£o sugere padr√µes distintos de correla√ß√£o entre medidas corporais.  
    - A matriz de correla√ß√£o mostra rela√ß√µes fortes entre massa corporal e comprimento da nadadeira, por exemplo.  
    - Testes de hip√≥tese confirmam que h√° diferen√ßas estatisticamente significativas em v√°rias vari√°veis entre esp√©cies.  
    - As distribui√ß√µes (violin e histograma) indicam que os grupos s√£o relativamente distintos, embora haja sobreposi√ß√£o parcial.
    """)
    st.info("Conclus√£o: o conjunto de pinguins √© um excelente exemplo para demonstrar rela√ß√µes multivariadas e compara√ß√µes entre grupos em dados reais.")

In [None]:
# Iniciar o Streamlit (localmente)
#!streamlit run app_penguins_avancado.py

# Iniciar o Streamlit (ngrok)
!streamlit run app_penguins_avancado.py --server.port 8501 --server.headless true > /dev/null 2>&1 &
public_url = ngrok.connect(addr=8501)
print("Seu app Streamlit est√° dispon√≠vel em:", public_url)

In [None]:
# Para iniciar outras aplica√ß√µes, √© sempre necess√°rio encerrar o streamlit em execu√ß√£o e iniciar o novo app.
!kill $(lsof -t -i:8501) # Encerra o streamlit em execu√ß√£o na porta 8501

In [None]:
# Encerrar a sess√£o ngrok ap√≥s o uso
ngrok.kill()