## Importando o DuckDB e conectando a um banco

In [14]:
import duckdb
conn = duckdb.connect('banco_projeto2.duckdb')

## Criando as tabelas no Banco de Dados

In [15]:
sql_criacao = '''
DROP TABLE IF EXISTS unidade_de_conservacao;
DROP TABLE IF EXISTS mutirao_limpeza;

CREATE TABLE unidade_de_conservacao (
    id_uc INT PRIMARY KEY,
    nome TEXT NOT NULL,
    ano_de_criacao INT,
    area_soma_biomas FLOAT,
    area_soma_biomas_continentais FLOAT,
    area_marinha FLOAT,
    nome_bioma TEXT,
    nome_municipio TEXT,
    estado TEXT,
    categoria_manejo TEXT,
    categoria_iucn TEXT,
    plano_de_manejo TEXT,
    esfera_administrativa TEXT
);

CREATE TABLE mutirao_limpeza(
    id_mutirao INT PRIMARY KEY,
    data_do_ocorrido DATE NOT NULL,
    horario_de_inicio TIME NOT NULL,
    numero_aproximado_de_participantes INT,
    duracao_total TIME NOT NULL,
    nome_municipio TEXT,
    estado TEXT,
    nome_local_de_coleta TEXT,
    nome_instituicao TEXT,
    carater_instituicao TEXT,
    plastico INT,
    borracha INT,
    madeira INT,
    produtos_texteis INT,
    papel INT,
    metal INT,
    vidro INT,
    materiais_de_pesca INT,
    outros_residuos INT
);
'''

conn.execute(sql_criacao)


<duckdb.duckdb.DuckDBPyConnection at 0x7151a13f3eb0>

## Populando o Banco de Dados com os Dataframes

In [16]:
# populando a tabela unidade de conservacao
uc_rename = {
    'Nome da UC': 'nome',
    'Ano de Criacao': 'ano_de_criacao',
    'Area soma biomas': 'area_soma_biomas',
    'Area soma biomas continentais': 'area_soma_biomas_continentais',
    'Area Marinha': 'area_marinha',
    'Bioma declarado': 'nome_bioma',
    'Cidade': 'nome_municipio',
    'Estado': 'estado',
    'Categoria de Manejo': 'categoria_manejo',
    'Categoria IUCN': 'categoria_iucn',
    'Plano de Manejo': 'plano_de_manejo',
    'Esfera Administrativa': 'esfera_administrativa'
}
df_uc_para_inserir = df_ucons.rename(columns=uc_rename)
conn.execute("DELETE FROM unidade_de_conservacao")
conn.execute("INSERT INTO unidade_de_conservacao SELECT * FROM df_uc_para_inserir")


# populando a tabela mutirao limpeza
mutirao_rename = {
    'Data do mutirão': 'data_do_ocorrido',
    'Horário de início': 'horario_de_inicio',
    'Número aproximado de participantes (total)': 'numero_aproximado_de_participantes',
    'Duração total (coleta + triagem)': 'duracao_total',
    'Cidade': 'nome_municipio',
    'Estado': 'estado',
    'Nome do local (exemplo: praia de boa viagem)': 'nome_local_de_coleta',
    'Instituição Organizadora': 'nome_instituicao',
    'Caráter da instituição': 'carater_instituicao',
    'Plástico (total)': 'plastico',
    'Borracha (total)': 'borracha',
    'Madeira (total)': 'madeira',
    'Produtos têxteis (total)': 'produtos_texteis',
    'Papel (total)': 'papel',
    'Metal (total)': 'metal',
    'Vidro (total)': 'vidro',
    'Materiais de Pesca (total)': 'materiais_de_pesca',
    'Outros Resíduos (total)': 'outros_residuos'
}

df_mutirao_para_inserir = df_mutiraolimp.rename(columns=mutirao_rename)
df_mutirao_para_inserir['data_do_ocorrido'] = pd.to_datetime(df_mutirao_para_inserir['data_do_ocorrido'], dayfirst=True)
ordem_colunas_mutirao = [
    'id_mutirao', 'data_do_ocorrido', 'horario_de_inicio', 'numero_aproximado_de_participantes',
    'duracao_total', 'nome_municipio', 'estado', 'nome_local_de_coleta', 'nome_instituicao',
    'carater_instituicao', 'plastico', 'borracha', 'madeira', 'produtos_texteis', 'papel',
    'metal', 'vidro', 'materiais_de_pesca', 'outros_residuos'
]
df_mutirao_para_inserir = df_mutirao_para_inserir[ordem_colunas_mutirao]
conn.execute("DELETE FROM mutirao_limpeza")
conn.execute("INSERT INTO mutirao_limpeza SELECT * FROM df_mutirao_para_inserir")

conn.commit()

<duckdb.duckdb.DuckDBPyConnection at 0x7151a13f3eb0>

## Query 1  -  Proporção de Unidades de Conservação vs. Lixo Extraído por Cidade em Mutirões de Limpeza

Esta query analisa a relação entre a presença de unidades de conservação ambiental e a quantidade de lixo coletado em mutirões de limpeza por cidade. O objetivo é entender se áreas com mais proteção ambiental tendem a gerar menos resíduos ou se há outras correlações relevantes.

In [26]:
query_1 = '''
    SELECT
    	cidade_uc, COUNT(nome_uc) AS qtd_uc, SUM(lixo_total) AS lixo_total_municipio
    FROM (
    	SELECT
    		"unidade_de_conservacao".nome_municipio AS cidade_uc,
    		"unidade_de_conservacao".nome AS nome_uc,
    		"mutirao_limpeza".nome_municipio AS cidade_ml,
    		"mutirao_limpeza".id_mutirao,
    		("mutirao_limpeza".plastico + "mutirao_limpeza".borracha + "mutirao_limpeza".madeira +
            "mutirao_limpeza".produtos_texteis + "mutirao_limpeza".papel + "mutirao_limpeza".metal + 
            "mutirao_limpeza".vidro + "mutirao_limpeza".materiais_de_pesca + "mutirao_limpeza".outros_residuos) AS lixo_total
    	FROM
    		"unidade_de_conservacao"
    	JOIN "mutirao_limpeza" ON "mutirao_limpeza".nome_municipio = "unidade_de_conservacao".nome_municipio
    ) AS new_query
    GROUP BY cidade_uc
    ORDER BY qtd_uc
'''
query_1_resultado = conn.execute(query_1).fetchdf()

## Query 2 - Proporção de Lixo Extraído vs. Unidades de Conservação por Estado

Esta query compara a quantidade de lixo coletado em mutirões de limpeza com o número de unidades de conservação em cada estado. O objetivo é identificar se estados com mais áreas protegidas têm menor volume de resíduos ou se há padrões distintos na geração de lixo.

In [25]:
query_2 = '''
    SELECT
    	estado, COUNT(nome_uc) AS qtd_uc, SUM(lixo_total) AS lixo_total_estado
    FROM (
    	SELECT
    		"mutirao_limpeza".id_mutirao,
    		"mutirao_limpeza".estado AS estado,
    		"unidade_de_conservacao".nome AS nome_uc,
    		"mutirao_limpeza".nome_municipio AS cidade_ml,
    		"mutirao_limpeza".id_mutirao,
    		("mutirao_limpeza".plastico + "mutirao_limpeza".borracha + "mutirao_limpeza".madeira +
            "mutirao_limpeza".produtos_texteis + "mutirao_limpeza".papel + "mutirao_limpeza".metal + 
            "mutirao_limpeza".vidro + "mutirao_limpeza".materiais_de_pesca + "mutirao_limpeza".outros_residuos) AS lixo_total
    	FROM
    		"unidade_de_conservacao"
    	JOIN "mutirao_limpeza" ON "mutirao_limpeza".nome_municipio = "unidade_de_conservacao".nome_municipio
    ) AS new_query
    GROUP BY estado
    ORDER BY lixo_total_estado;
'''
query_2_resultado = conn.execute(query_2).fetchdf()

## Query 3 - Análise de Resíduos por Bioma em Mutirões de Limpeza

Esta query avalia a distribuição de tipos e quantidades de lixo coletado em mutirões de limpeza, segmentado por biomas brasileiros. O objetivo é identificar padrões de descarte e potencial impacto ambiental em diferentes ecossistemas.

In [24]:
query_3 = '''
    SELECT (plastico_total + madeira_total + borracha_total + produtos_texteis_total + papel_total + metal_total +
	   vidro_total + materiais_de_pesca_total + outros_residuos_total) AS qtd_lixo_total, *
    FROM(
    	SELECT u.nome_bioma AS bioma_declarado, COUNT(u.nome_municipio) AS cidades_total, SUM(plastico) AS plastico_total, SUM(madeira) AS madeira_total,
    	       SUM(borracha) AS borracha_total, SUM(produtos_texteis) AS produtos_texteis_total,
    		   SUM(papel) AS papel_total, SUM(metal) AS metal_total, SUM(vidro) AS vidro_total, SUM(materiais_de_pesca) AS materiais_de_pesca_total,
    		   SUM(outros_residuos) AS outros_residuos_total
    	FROM "mutirao_limpeza" AS m
        JOIN "unidade_de_conservacao" AS u ON m.nome_municipio = u.nome_municipio
    	GROUP BY nome_bioma
    )
ORDER BY qtd_lixo_total
'''
query_3_resultado = conn.execute(query_3).fetchdf()

## Query 4 - Eficiência das Instituições Organizadoras por Natureza (Público vs. Privado)

Esta query avalia o desempenho de instituições organizadoras de mutirões de limpeza, categorizadas por seu caráter (público, privado, ONG, etc.), com base no volume total de resíduos coletados. O objetivo é identificar quais tipos de organizações têm maior impacto nas ações de limpeza.

In [23]:
query_4 = '''
    SELECT 
        carater_instituicao AS carater_da_instituicao, COUNT(id_mutirao) AS qtd_mutiroes, 
        SUM(plastico + borracha + madeira + produtos_texteis + papel + metal + vidro + materiais_de_pesca + outros_residuos) AS lixo_total
    FROM 
        "mutirao_limpeza"
    GROUP BY 
        carater_instituicao
    ORDER BY 
        lixo_total;
'''
query_4_resultado = conn.execute(query_4).fetchdf()

## Query 5 - Análise de Eficiência dos Mutirões de Limpeza por Ano

Esta query avalia a eficiência dos mutirões de limpeza em um ano específico, com métricas como:

- Volume total de resíduos coletados

- Produtividade por participante

- Intensidade da coleta (lixo por minuto)

- Comparativo entre meses/estações do ano

In [22]:
query_5 = '''
    SELECT 
        *, (lixo_total_ano / participantes_no_ano) AS lixo_extraido_por_pessoa, (lixo_total_ano / (total_segundos_mutirao / 60.0)) AS lixo_extraido_por_minuto
    FROM (
        SELECT 
            EXTRACT(YEAR FROM data_do_ocorrido) AS ano,
            SUM(numero_aproximado_de_participantes) AS participantes_no_ano,
            SUM(EXTRACT(EPOCH FROM duracao_total)) AS total_segundos_mutirao,
            COUNT(nome_municipio) AS total_municipios_participantes,
            SUM(plastico) AS plastico_total,
            SUM(borracha) AS borracha_total,
            SUM(madeira) AS madeira_total,
            SUM(produtos_texteis) AS produtos_texteis_total,
            SUM(papel) AS papel_total,
            SUM(metal) AS metal_total,
            SUM(vidro) AS vidro_total,
            SUM(materiais_de_pesca) AS materiais_de_pesca_total,
            SUM(outros_residuos) AS outros_residuos_total,
            SUM(plastico + borracha + madeira + produtos_texteis + papel + metal + vidro + materiais_de_pesca + outros_residuos) AS lixo_total_ano
        FROM 
            mutirao_limpeza 
        GROUP BY 
            ano
        ORDER BY 
            ano
    )
'''
query_5_resultado = conn.execute(query_5).fetchdf()