# Relatório Exploratório - Incidentes de Incêndio em San Francisco
 Esse notebook utiliza os dados processados e agregados na **Camada Gold** para eventuais consultas nas tabelas SQL.
## Consultas
 * O número total de incidentes ao longo do tempo (por ano e mês). 
 * Os distritos com maior e menor número de incidentes. 
 * O total de perdas estimadas (propriedade e conteúdo) por batalhão. 
 * Os tipos de incidentes mais comuns.
## Fonte de Dados:
Os dados para este relatório são provenientes das seguintes tabelas agregadas na Camada Gold: 
  * `fire_incidents_gold_by_time`: Agregações por ano e mês. 
  * `fire_incidents_gold_by_district`: Agregações por distrito. 
  * `fire_incidents_gold_by_battalion`: Agregações por batalhão.

In [0]:

# Importar bibliotecas necessárias para consultas e visualizações
from pyspark.sql.functions import col, desc, sum, count
from pyspark.sql.types import LongType, DoubleType, StringType, DateType

# Nomes das Tabelas Gold 
gold_agg_by_time_simple = "fire_incidents_gold_by_time"
gold_agg_by_district_simple = "fire_incidents_gold_by_district"
gold_agg_by_battalion_simple = "fire_incidents_gold_by_battalion"

print("Tabelas Gold disponíveis para consulta:")
print(f"- Por Tempo (Ano/Mês): {gold_agg_by_time_simple}")
print(f"- Por Distrito: {gold_agg_by_district_simple}")
print(f"- Por Batalhão: {gold_agg_by_battalion_simple}")

## 1. Tendência de Incidentes ao Longo do Tempo (Ano e Mês):
Esta seção visualiza o número total de incidentes e as perdas estimadas ao longo dos anos e meses.


In [0]:
%sql
SELECT
  incident_year,
  incident_month,
  total_incidents,
  total_property_loss,
  total_contents_loss
FROM
  fire_incidents_gold_by_time
ORDER BY
  incident_year,
  incident_month;

## 2. Top 10 Distritos com Mais Incidentes:
Esta visualização destaca os dez distritos com a maior ocorrência de incidentes de incêndio.

In [0]:
%sql
SELECT
  district_name,
  total_incidents,
  total_property_loss,
  total_contents_loss
FROM
  fire_incidents_gold_by_district
ORDER BY
  total_incidents DESC
LIMIT 10;

## 3. Análise de Perdas Estimadas por Batalhão:
Esta seção mostra o total de perdas estimadas (propriedade e conteúdo) por batalhão.

In [0]:
%sql
SELECT
  battalion_id,
  total_incidents,
  total_property_loss,
  total_contents_loss
FROM
  fire_incidents_gold_by_battalion
ORDER BY
  total_property_loss DESC;

## 4. Os tipos de incidentes mais comuns.
 Para uma análise mais detalhada sobre os tipos de incidentes, podemos consultar a Camada Silver, que contém os dados limpos mas ainda não agregados por tipo de situação.

In [0]:
%sql
SELECT
  `Primary Situation`,
  COUNT(ID) AS total_occurrences
FROM
  fire_incidents_silver
WHERE
  `Primary Situation` IS NOT NULL
GROUP BY
  `Primary Situation`
ORDER BY
  total_occurrences DESC
LIMIT 10;