In [None]:
import pandas as pd
import json
import numpy as np
import requests

### Transformando coluna de DisNo. para _id, para o CouchDB reconhecer

In [None]:
df = pd.read_excel("emdat.xlsx")
print(df.columns.tolist())
df.columns = df.columns.str.strip()
df = df.rename(columns={"DisNo.": "_id"})
print(df.columns.tolist())

['DisNo.', 'Historic', 'Classification Key', 'Disaster Group', 'Disaster Subgroup', 'Disaster Type', 'Disaster Subtype', 'External IDs', 'Event Name', 'ISO', 'Country', 'Subregion', 'Region', 'Location', 'Origin', 'Associated Types', 'OFDA/BHA Response', 'Appeal', 'Declaration', "AID Contribution ('000 US$)", 'Magnitude', 'Magnitude Scale', 'Latitude', 'Longitude', 'River Basin', 'Start Year', 'Start Month', 'Start Day', 'End Year', 'End Month', 'End Day', 'Total Deaths', 'No. Injured', 'No. Affected', 'No. Homeless', 'Total Affected', "Reconstruction Costs ('000 US$)", "Reconstruction Costs, Adjusted ('000 US$)", "Insured Damage ('000 US$)", "Insured Damage, Adjusted ('000 US$)", "Total Damage ('000 US$)", "Total Damage, Adjusted ('000 US$)", 'CPI', 'Admin Units', 'Entry Date', 'Last Update']
['_id', 'Historic', 'Classification Key', 'Disaster Group', 'Disaster Subgroup', 'Disaster Type', 'Disaster Subtype', 'External IDs', 'Event Name', 'ISO', 'Country', 'Subregion', 'Region', 'Locat

### Mudar o formatode .XLSX para .json

In [None]:
df["_id"] = df["_id"].astype(str)
# Substitui NaN por None para JSON válido
df = df.replace({np.nan: None})
docs = df.to_dict(orient="records")
with open("emdat_docs.json", "w", encoding="utf-8") as f:
    json.dump(docs, f, ensure_ascii=False, indent=2)

### script para colocar os dados na database do CouchDB

In [None]:

COUCHDB_URL = "http://localhost:5984"
DB_NAME = "desastres_emdat"
USERNAME = "Thais"       # seu usuário do CouchDB
PASSWORD = "thaismelo"   # sua senha do CouchDB


resp = requests.get(f"{COUCHDB_URL}/{DB_NAME}", auth=(USERNAME, PASSWORD))
if resp.status_code == 404:
    print(f"Criando banco de dados '{DB_NAME}'...")
    resp_create = requests.put(f"{COUCHDB_URL}/{DB_NAME}", auth=(USERNAME, PASSWORD))
    if resp_create.status_code == 201:
        print("Banco criado com sucesso!")
    else:
        print("Erro ao criar banco:", resp_create.text)
        exit(1)
else:
    print(f"Banco '{DB_NAME}' já existe.")

# Passo 7: Envia documentos em lote (_bulk_docs)
payload = {"docs": docs}
headers = {"Content-Type": "application/json"}

print(f"Inserindo {len(docs)} documentos no CouchDB...")

response = requests.post(
    f"{COUCHDB_URL}/{DB_NAME}/_bulk_docs",
    auth=(USERNAME, PASSWORD),
    headers=headers,
    data=json.dumps(payload)
)

if response.status_code == 201:
    print("Documentos inseridos com sucesso!")
else:
    print("Erro ao inserir documentos:", response.status_code, response.text)


Banco 'desastres_emdat' já existe.
Inserindo 26996 documentos no CouchDB...
Documentos inseridos com sucesso!


# Consultas

In [None]:
!pip install couchdb

In [None]:
import couchdb

couch = couchdb.Server("http://Thais:thaismelo@localhost:5984/")
db = couch['desastres_emdat']

pais = "Brazil"

In [None]:
def consulta_1_total_desastres_por_pais(db, pais):
    # Conta quantos desastres existem para o país
    count = 0
    for row in db.view('_all_docs', include_docs=True):
        doc = row.doc
        if doc.get("Country") == pais:
            count += 1
    return count

def consulta_2_total_desastres_por_pais_ano(db, pais, ano):
    # Conta desastres no país em determinado ano
    count = 0
    for row in db.view('_all_docs', include_docs=True):
        doc = row.doc
        if doc.get("Country") == pais and doc.get("Start Year") == ano:
            count += 1
    return count

def consulta_3_top_5_desastres_mais_mortais(db, pais):
    # Retorna os 5 desastres com mais mortes no país
    desastres = []
    for row in db.view('_all_docs', include_docs=True):
        doc = row.doc
        if doc.get("Country") == pais and doc.get("Total Deaths"):
            desastres.append((doc.get("Event Name"), doc.get("Total Deaths")))
    desastres.sort(key=lambda x: x[1], reverse=True)
    return desastres[:5]

def consulta_4_total_pessoas_afetadas(db, pais):
    # Soma o total de pessoas afetadas no país
    total = 0
    for row in db.view('_all_docs', include_docs=True):
        doc = row.doc
        if doc.get("Country") == pais and doc.get("Total Affected"):
            total += doc.get("Total Affected", 0)
    return total

def consulta_5_total_danos_economicos(db, pais):
    # Soma o total de danos econômicos no país (total_damage_usd_000)
    total = 0
    for row in db.view('_all_docs', include_docs=True):
        doc = row.doc
        if doc.get("Country") == pais and doc.get("Total Damage ('000 US$)"):
            total += doc.get("Total Damage ('000 US$)", 0)
    return total

def consulta_6_desastres_por_tipo(db, pais):
    # Retorna dicionário {tipo: quantidade} de desastres no país
    tipos = {}
    for row in db.view('_all_docs', include_docs=True):
        doc = row.doc
        if doc.get("Country") == pais:
            tipo = doc.get("Disaster Type")
            if tipo:
                tipos[tipo] = tipos.get(tipo, 0) + 1
    return tipos

def consulta_7_desastres_por_grupo(db, pais):
    # Retorna dicionário {grupo: quantidade} de desastres no país
    grupos = {}
    for row in db.view('_all_docs', include_docs=True):
        doc = row.doc
        if doc.get("Country") == pais:
            grupo = doc.get("Disaster Group")
            if grupo:
                grupos[grupo] = grupos.get(grupo, 0) + 1
    return grupos

def consulta_8_tendencia_historica(db, pais):
    # Retorna dict {ano: total de desastres} para o país (ordem crescente ano)
    anos = {}
    for row in db.view('_all_docs', include_docs=True):
        doc = row.doc
        if doc.get("Country") == pais and doc.get("Start Year"):
            ano = doc.get("Start Year")
            anos[ano] = anos.get(ano, 0) + 1
    return dict(sorted(anos.items()))

def consulta_9_lista_desastres_filtrada(db, pais, grupo=None, tipo=None, ano=None):
    # Retorna lista de documentos filtrados por país, grupo, tipo e ano (opcionais)
    resultados = []
    for row in db.view('_all_docs', include_docs=True):
        doc = row.doc
        if doc.get("Country") != pais:
            continue
        if grupo and doc.get("Disaster Group") != grupo:
            continue
        if tipo and doc.get("Disaster Type") != tipo:
            continue
        if ano and doc.get("Start Year") != ano:
            continue
        resultados.append(doc)
    return resultados

def consulta_10_exportar_dados_json(db, pais):
    # Retorna lista de docs para exportar em JSON (apenas do país)
    resultados = []
    for row in db.view('_all_docs', include_docs=True):
        doc = row.doc
        if doc.get("Country") == pais:
            resultados.append(doc)
    return resultados


In [None]:
print("Total de desastres:", consulta_1_total_desastres_por_pais(db, pais))
print("Top 5 mais mortais:", consulta_3_top_5_desastres_mais_mortais(db, pais))
print("Total de pessoas afetadas:", consulta_4_total_pessoas_afetadas(db, pais))
print("Total de danos econômicos:", consulta_5_total_danos_economicos(db, pais))
print("Desastres por tipo:", consulta_6_desastres_por_tipo(db, pais ))
print("Desastres por grupo:", consulta_7_desastres_por_grupo(db, pais))
print("Tendência histórica:", consulta_8_tendencia_historica(db, pais))
print("Lista de desastres filtrada:", consulta_9_lista_desastres_filtrada(db, pais, grupo="Natural", tipo="Flood", ano=2020))
print("Exportar dados JSON:", consulta_10_exportar_dados_json(db, pais))

Total de desastres: 481
Top 5 mais mortais: [(None, 1500.0), (None, 900.0), (None, 785.0), ('Oil pipeline', 508.0), (None, 436.0)]
Total de pessoas afetadas: 121840270.0
Total de danos econômicos: 52302581.0
Desastres por tipo: {'Air': 30, 'Flood': 187, 'Storm': 26, 'Mass movement (wet)': 26, 'Fire (Miscellaneous)': 14, 'Extreme temperature': 7, 'Rail': 6, 'Drought': 22, 'Industrial accident (General)': 3, 'Epidemic': 18, 'Water': 26, 'Fire (Industrial)': 1, 'Miscellaneous accident (General)': 5, 'Explosion (Industrial)': 6, 'Earthquake': 2, 'Radiation': 1, 'Road': 75, 'Collapse (Miscellaneous)': 14, 'Infestation': 1, 'Collapse (Industrial)': 3, 'Explosion (Miscellaneous)': 2, 'Wildfire': 4, 'Chemical spill': 1, 'Poisoning': 1}
Desastres por grupo: {'Technological': 188, 'Natural': 293}
Tendência histórica: {1928: 2, 1939: 2, 1943: 2, 1944: 3, 1948: 1, 1949: 1, 1956: 2, 1957: 1, 1959: 2, 1961: 1, 1963: 1, 1964: 3, 1965: 2, 1966: 5, 1967: 5, 1968: 1, 1969: 1, 1970: 3, 1971: 2, 1972: 1, 