# ‚ñ∂Ô∏è Cap√≠tulo 8 ‚Äî Lendo dados externos

## üíæ Manipula√ß√£o de Dados

* **Ler um CSV com pandas:** Utilizando a biblioteca fundamental para I/O de dados.
* **Mostrar tabela com dash-ag-grid ou dash_table:** Exibindo os dados brutos no app.
* **Explicar brevemente limites e vantagens:** Considera√ß√µes sobre performance e visualiza√ß√£o de tabelas grandes.

---

# PROCESSAMENTO de dados com Pandas

O Pandas √© a ferramenta essencial para manipula√ß√£o de dados em Python. Ele permite que voc√™ transforme dicion√°rios ou arquivos brutos em estruturas tabulares chamadas DataFrames.

Principais Opera√ß√µes Realizadas:
Cria√ß√£o do DataFrame: Convertendo um dicion√°rio Python em uma tabela estruturada.

Exporta√ß√£o para Excel: O m√©todo .to_excel() gera um arquivo .xlsx, ideal para usu√°rios que dependem de planilhas.

Exporta√ß√£o para CSV: O m√©todo .to_csv() salva os dados em formato de texto delimitado, que √© leve e universal para sistemas de dados.

In [1]:
import pandas as pd

# Criando o DataFrame conforme o exemplo da imagem
dados = {
    "Cidade": ["Jo√£o Pessoa", "Jo√£o Pessoa", "Jo√£o Pessoa", "Campina Grande", "Campina Grande", "Campina Grande", "Patos", "Patos", "Patos"],
    "Ano": [2000, 2010, 2022, 2000, 2010, 2022, 2000, 2010, 2022],
    "Populacao": [597934, 723515, 833932, 355331, 385213, 419379, 91402, 100674, 103165],
    "PIB_Bilhoes": [5.2, 14.8, 22.1, 3.1, 7.8, 10.3, 0.5, 1.2, 2.1]
}

df = pd.DataFrame(dados)

# Exportando para Excel e CSV (como mostrado no seu c√≥digo)
df.to_excel("cidades_pb_excel.xlsx", index=False)
df.to_csv("cidades_pb.csv", index=False)

# Para ler o arquivo posteriormente:
# df_lido = pd.read_csv("cidades_pb.csv")
df.head()

Unnamed: 0,Cidade,Ano,Populacao,PIB_Bilhoes
0,Jo√£o Pessoa,2000,597934,5.2
1,Jo√£o Pessoa,2010,723515,14.8
2,Jo√£o Pessoa,2022,833932,22.1
3,Campina Grande,2000,355331,3.1
4,Campina Grande,2010,385213,7.8


# Visualiza√ß√£o tabular com o componente dash_ag_grid

O Dash AG Grid √© uma das bibliotecas mais poderosas para exibir tabelas interativas, permitindo que o usu√°rio filtre e ordene dados diretamente no navegador.

Configura√ß√µes Utilizadas (dashGridOptions):
pagination: Ativa a quebra da tabela em p√°ginas, evitando que a tela fique excessivamente longa.

paginationPageSize: Define exatamente quantas linhas ser√£o exibidas por vez (no seu caso, 20).

defaultColDef: Define comportamentos padr√£o para todas as colunas, como permitir redimensionamento e filtros.

In [None]:
import pandas as pd
from dash import Dash, html
import dash_ag_grid as dag


# Op√ß√£o A: URL Externa (Gapminder)
url_gapminder = "https://raw.githubusercontent.com/plotly/datasets/master/gapminder2007.csv"
df = pd.read_csv(url_gapminder)

# Op√ß√£o B: Arquivo Local (Exemplo de cidades da PB que salvamos)
# df = pd.read_csv("cidades_pb.csv")

# Op√ß√£o C: Dados de Pesquisa UFPB (Exemplo conceitual)
# df = pd.read_csv("projetos_pesquisa_ufpb.csv") 


app = Dash(__name__)

app.layout = html.Div([
    html.H3("Visualizador de Dados Din√¢mico"),
    dag.AgGrid(
        id="tabela-dados",
        # Transformamos o DF escolhido acima em registros para o AG Grid
        rowData=df.to_dict("records"), 
        columnDefs=[{"field": i} for i in df.columns],
        defaultColDef={"resizable": True, "sortable": True, "filter": True},
        dashGridOptions={
            "pagination": True, 
            "paginationPageSize": 20
        }
    )
])

if __name__ == "__main__":
    # Usando app.run para evitar erros de vers√£o obsoleta
    app.run(debug=True)