# Cap√≠tulo 02: Instala√ß√£o e Configura√ß√£o HTTPFS

Este cap√≠tulo cobre a configura√ß√£o da extens√£o HTTPFS para acesso HTTP/HTTPS e S3.

## ‚öôÔ∏è Instala√ß√£o e Carregamento da Extens√£o HTTPFS

In [None]:
!pip install duckdb -q

## üì¶ Instala√ß√£o Inicial

In [None]:
import duckdb
con = duckdb.connect(database=':memory:')

# Instalar e carregar extens√£o HTTPFS
con.execute("""
INSTALL httpfs;
LOAD httpfs;
""")
print(con.fetchall())

In [None]:
# Bearer Token
con.execute("""
CREATE SECRET http_auth (
    TYPE http,
    BEARER_TOKEN 'your_bearer_token_here'
);
""")
print(con.fetchall())

# Headers customizados
con.execute("""
CREATE SECRET http_auth (
    TYPE http,
    EXTRA_HTTP_HEADERS MAP {
        'Authorization': 'Bearer token_value',
        'X-Custom-Header': 'custom_value'
    }
);
""")
print(con.fetchall())

## üîë Autentica√ß√£o HTTP

In [None]:
# Configura√ß√µes de performance
con.execute("""
SET http_timeout = 30000;  -- 30 segundos
SET threads = 4;  -- Controlar paralelismo
SET http_keep_alive = true;  -- Reutilizar conex√µes
""")
print(con.fetchall())

### Configura√ß√µes de Timeout e Paralelismo

In [None]:
# L√™ apenas a coluna especificada (n√£o baixa o arquivo inteiro)
con.execute("""
SELECT column_a
FROM 'https://example.com/large_file.parquet';
""")
print(con.fetchall())

# Count usando apenas metadados (r√°pido)
con.execute("""
SELECT count(*)
FROM 'https://shell.duckdb.org/data/tpch/0_01/parquet/lineitem.parquet';
""")
print(con.fetchall())

## üöÄ Otimiza√ß√µes de Performance

### Leitura Colunar Eficiente

In [None]:
# Ver estrutura sem baixar todo o arquivo
con.execute("""
SELECT *
FROM parquet_schema('https://shell.duckdb.org/data/tpch/0_01/parquet/customer.parquet');
""")
print(con.fetchall())

### An√°lise de Schema

In [None]:
# Dataset p√∫blico do DuckDB
con.execute("""
SELECT *
FROM 'https://shell.duckdb.org/data/tpch/0_01/parquet/lineitem.parquet'
LIMIT 10;
""")
print(con.fetchall())

## üìö Exemplos de Leitura HTTP/HTTPS

### Dataset P√∫blico DuckDB

In [None]:
# Configurar certificado CA
con.execute("""
LOAD httpfs;
SET ca_cert_file = '/path/to/certificate.pem';
SET enable_server_cert_verification = true;
""")
print(con.fetchall())

# Desabilitar verifica√ß√£o SSL (n√£o recomendado para produ√ß√£o)
con.execute("""
SET enable_server_cert_verification = false;
""")
print(con.fetchall())

## üîê Configura√ß√µes SSL/TLS

In [None]:
# Configurar proxy via SET
con.execute("""
SET http_proxy = 'http://proxy.company.com:8080';
SET http_proxy_username = 'your_username';
SET http_proxy_password = 'your_password';
""")
print(con.fetchall())

# Ou usando SECRET
con.execute("""
CREATE SECRET http_proxy (
    TYPE http,
    HTTP_PROXY 'http://proxy.company.com:8080',
    HTTP_PROXY_USERNAME 'your_username',
    HTTP_PROXY_PASSWORD 'your_password'
);
""")
print(con.fetchall())

## üåê Configura√ß√£o de Proxy

In [None]:
# Teste b√°sico de conectividade com dataset p√∫blico
con.execute("""
SELECT count(*) FROM 'https://shell.duckdb.org/data/tpch/0_01/parquet/lineitem.parquet';
""")
print(con.fetchall())

## üß™ Teste de Conectividade

In [None]:
# Ver todas as extens√µes instaladas
con.execute("""
SELECT * FROM duckdb_extensions();
""")
print(con.fetchall())

## ‚úÖ Verifica√ß√£o de Extens√µes

In [None]:
# DuckDB carrega automaticamente a extens√£o quando necess√°rio
con.execute("""
SELECT * FROM 'https://example.com/data.parquet';
""")
# DuckDB detecta, baixa, instala e carrega automaticamente

## üîÑ Auto-Loading (Carregamento Autom√°tico)