# Capítulo 01: Introdução ao Apache Iceberg

Este notebook apresenta conceitos fundamentais do Apache Iceberg integrado com DuckDB.

**Objetivo:** Entender o que é Iceberg e realizar análises básicas em tabelas Iceberg.

**Conteúdo:**
- Instalação e configuração inicial
- Conceitos básicos de Iceberg
- Primeira query em tabela Iceberg

## 3. Primeira Query em Tabela Iceberg

Vamos criar uma conexão e fazer uma query exemplo (nota: o caminho da tabela deve ser ajustado para seu ambiente).

## 2. O que é Apache Iceberg?

**Apache Iceberg** é um formato de tabela aberto para dados analíticos de larga escala que oferece:

- **Time Travel**: Consultar dados históricos
- **Schema Evolution**: Modificar schema sem reescrever dados
- **ACID Transactions**: Garantias transacionais
- **Particionamento Eficiente**: Otimização automática de queries

**DuckDB + Iceberg** = Análise SQL rápida em tabelas Iceberg, sem precisar de Spark!

In [None]:
# Importar bibliotecas e função auxiliar
import duckdb
import importlib.util


def has_module(name):
    """Verifica se um módulo Python está disponível"""
    return importlib.util.find_spec(name) is not None


def safe_install_ext(con, ext_name):
    """Instala e carrega extensão DuckDB com tratamento de erros"""
    try:
        con.execute(f"INSTALL {ext_name}")
        con.execute(f"LOAD {ext_name}")
        print(f"✅ Extensão '{ext_name}' instalada e carregada com sucesso")
        return True
    except Exception as e:
        print(f"⚠️  Aviso: Falha ao instalar/carregar {ext_name}: {e}")
        return False


print("Funções auxiliares carregadas!")

In [None]:
# Instalar DuckDB se necessário
import sys
!{sys.executable} -m pip install -q duckdb pyarrow

## 1. Instalação e Configuração Inicial

Primeiro, vamos instalar as dependências necessárias e carregar a extensão Iceberg.

In [None]:
# Criar conexão e instalar extensão Iceberg
con = duckdb.connect()
safe_install_ext(con, "iceberg")

# Exemplo de query em tabela Iceberg
# NOTA: Ajuste o caminho para uma tabela Iceberg real em seu ambiente
try:
    result = con.execute("""
        SELECT category, sum(revenue) as total_revenue
        FROM iceberg_scan('s3://bucket/sales')
        GROUP BY category
        LIMIT 10
    """).df()
    
    print("✅ Query executada com sucesso!")
    print(result)
except Exception as e:
    print(f"ℹ️  Exemplo demonstrativo - ajuste o caminho da tabela Iceberg")
    print(f"Erro: {e}")

## 4. Próximos Passos

Neste capítulo você aprendeu:
- ✅ Como instalar e configurar DuckDB com Iceberg
- ✅ Conceitos básicos do Apache Iceberg
- ✅ Estrutura básica de queries em tabelas Iceberg

**Próximo:** Capítulo 02 - Instalação e Configuração detalhada