In [1]:
!pip install basedosdados
!pip install --upgrade shapely
!pip install --upgrade basedosdados geopandas


Collecting basedosdados
  Downloading basedosdados-1.6.11-py3-none-any.whl.metadata (4.3 kB)
Collecting Jinja2==3.0.3 (from basedosdados)
  Downloading Jinja2-3.0.3-py3-none-any.whl.metadata (3.5 kB)
Collecting ckanapi==4.6 (from basedosdados)
  Downloading ckanapi-4.6.tar.gz (32 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting click==8.0.3 (from basedosdados)
  Downloading click-8.0.3-py3-none-any.whl.metadata (3.2 kB)
Collecting google-cloud-bigquery==2.30.1 (from basedosdados)
  Downloading google_cloud_bigquery-2.30.1-py2.py3-none-any.whl.metadata (7.7 kB)
Collecting google-cloud-bigquery-storage==1.1.0 (from basedosdados)
  Downloading google_cloud_bigquery_storage-1.1.0-py2.py3-none-any.whl.metadata (5.0 kB)
Collecting google-cloud-storage==1.42.3 (from basedosdados)
  Downloading google_cloud_storage-1.42.3-py2.py3-none-any.whl.metadata (5.6 kB)
Collecting importlib-metadata<5.0.0,>=4.11.3 (from basedosdados)
  Downloading importlib_metadata-4.13.0-py3-none-an

Collecting shapely
  Using cached shapely-2.0.6-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (7.0 kB)
Using cached shapely-2.0.6-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (2.5 MB)
Installing collected packages: shapely
  Attempting uninstall: shapely
    Found existing installation: Shapely 1.8.5.post1
    Uninstalling Shapely-1.8.5.post1:
      Successfully uninstalled Shapely-1.8.5.post1
[31mERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
basedosdados 1.6.11 requires shapely<2.0.0,>=1.6.0, but you have shapely 2.0.6 which is incompatible.[0m[31m
[0mSuccessfully installed shapely-2.0.6
Collecting shapely<2.0.0,>=1.6.0 (from basedosdados)
  Using cached Shapely-1.8.5.post1-cp310-cp310-manylinux_2_12_x86_64.manylinux2010_x86_64.whl.metadata (43 kB)
INFO: pip is looking at multiple versions of geopandas to determine whi

In [5]:
import basedosdados as bd
import pandas as pd

# Carregar query

In [7]:
# carregar nossa query para o python

query = '''-- Etapa 0: Filtrar empresas ativas e não-MEI no ano de 2020 em MG
WITH empresas_ativas_2020 AS (
  SELECT DISTINCT
    e.cnpj,  -- CNPJ completo
    e.id_municipio,
    e.cnae_fiscal_principal,
    e.data_inicio_atividade,
    s.opcao_mei,  -- Verificar se a empresa é MEI
    emp.razao_social,
    e.situacao_cadastral,  -- Verificar se a empresa está ativa
    SUBSTR(e.cnpj, 1, 8) AS cnpj_basico  -- Extrair CNPJ básico para comparação
  FROM basedosdados.br_me_cnpj.estabelecimentos e
  INNER JOIN basedosdados.br_me_cnpj.empresas emp
    ON e.cnpj_basico = emp.cnpj_basico
  INNER JOIN basedosdados.br_me_cnpj.simples s
    ON e.cnpj_basico = s.cnpj_basico
  WHERE s.opcao_mei != 1  -- Excluir MEIs
    AND e.situacao_cadastral = '2'  -- Empresas ativas
    AND LENGTH(e.cnpj) = 14  -- Apenas CNPJs completos
    AND e.data_inicio_atividade <= '2020-01-01'  -- Existiam em 2020
),

-- Etapa 1: Filtrar apenas NCMs de cobre na tabela ncm_importacao para 2020
ncm_cobre_2020 AS (
  SELECT DISTINCT
    ni.ano,
    ni.sigla_uf_ncm AS sigla_uf,  -- Usar sigla_uf para fazer o JOIN com municipios_importacao
    ni.id_ncm,
    SUM(ni.peso_liquido_kg) AS total_peso_cobre,
    SUM(ni.valor_fob_dolar) AS total_valor_fob
  FROM basedosdados.br_me_comex_stat.ncm_importacao ni
  WHERE ni.id_ncm IN ('74010000', '74020000', '74030000', '74040000', '74050000',
                      '74070000', '74080000', '74090000', '74100000', '74110000', '74120000')  -- NCMs de cobre
    AND ni.ano = 2020  -- Foco no ano de 2020
  GROUP BY ni.ano, ni.sigla_uf_ncm, ni.id_ncm
),

-- Etapa 2: Obter municípios de MG com informações de importação para 2020
municipios_importacao_2020 AS (
  SELECT DISTINCT
    mi.ano,
    mi.id_municipio,
    mi.sigla_uf,
    SUM(mi.peso_liquido_kg) AS total_peso_municipio,
    SUM(mi.valor_fob_dolar) AS total_valor_fob_municipio
  FROM basedosdados.br_me_comex_stat.municipio_importacao mi
  WHERE mi.sigla_uf = 'MG'
    AND mi.ano = 2020  -- Foco no ano de 2020
  GROUP BY mi.ano, mi.id_municipio, mi.sigla_uf
),

-- Etapa 3: Calcular a proporção para cada empresa no município
proporcao_empresa AS (
  SELECT
    ei.id_municipio,
    ei.cnpj,
    ei.razao_social,
    ei.cnae_2_primaria AS cnae_principal,  -- Correção para usar cnae_2_primaria em vez de cnae_principal
    COUNT(ei.cnpj) OVER(PARTITION BY ei.id_municipio) AS total_empresas_no_municipio  -- Contar o total de empresas no município
  FROM basedosdados.br_me_exportadoras_importadoras.estabelecimentos ei
  INNER JOIN empresas_ativas_2020 ea  -- Associar apenas empresas ativas e não-MEI
    ON ei.cnpj = ea.cnpj
  WHERE LENGTH(ei.cnpj) = 14
    AND ei.sigla_uf = 'MG'
    AND ei.ano = 2020
),

-- Etapa 4: Combinar informações de empresas com municípios e calcular proporção
municipios_ncm_ajustado AS (
  SELECT DISTINCT
    mi.id_municipio,
    nc.total_peso_cobre,  -- Corrigido para usar nc e não mn
    nc.total_valor_fob,   -- Corrigido para usar nc e não mn
    mi.total_peso_municipio,
    mi.total_valor_fob_municipio,
    pe.cnpj,
    pe.razao_social,
    pe.total_empresas_no_municipio,
    nc.total_peso_cobre / pe.total_empresas_no_municipio AS peso_cobre_por_empresa,  -- Distribuir o peso proporcionalmente
    nc.total_valor_fob / pe.total_empresas_no_municipio AS valor_fob_por_empresa  -- Distribuir o valor FOB proporcionalmente
  FROM municipios_importacao_2020 mi  -- Referenciar corretamente a subquery
  INNER JOIN ncm_cobre_2020 nc  -- Adicionar ncm_cobre_2020 para garantir que total_peso_cobre e total_valor_fob sejam acessíveis
    ON mi.sigla_uf = nc.sigla_uf  -- Associar pela sigla do estado (MG)
  LEFT JOIN proporcao_empresa pe
    ON mi.id_municipio = pe.id_municipio
)

-- Query Final: Resultados Ajustados
SELECT DISTINCT
  cnpj,
  razao_social,
  id_municipio,
  peso_cobre_por_empresa AS peso_cobre_ajustado,
  valor_fob_por_empresa AS valor_fob_ajustado,
  total_peso_municipio,
  total_valor_fob_municipio
FROM municipios_ncm_ajustado
ORDER BY valor_fob_ajustado DESC, razao_social'''

In [8]:
dados = bd.read_sql(query, billing_project_id= "poetic-axle-423105-f3", reauth = True)

dados

Downloading: 100%|██████████| 1265/1265 [00:00<00:00, 5149.77rows/s]


Unnamed: 0,cnpj,razao_social,id_municipio,peso_cobre_ajustado,valor_fob_ajustado,total_peso_municipio,total_valor_fob_municipio
0,21666252000124,ABNER JERUEL MENDES 08628243623,3142601,58691.0,396437.0,17243,168068
1,13604470000106,ABRAHAO SIMAO DE OLIVEIRA FILHO,3134806,58691.0,396437.0,5632,14252
2,71066427000130,ACO SALES LTDA,3152105,58691.0,396437.0,2505195,4798110
3,19599390000196,ALL IN INDUSTRIA COMERCIO IMPORTACAO E EXPORTA...,3137809,58691.0,396437.0,575173,1004144
4,17290656000199,AZEITE VERDEOLIVA LTDA,3121100,58691.0,396437.0,3360,23696
...,...,...,...,...,...,...,...
1260,,,3141405,,,1789,308943
1261,,,3157104,,,180,5242
1262,,,3157708,,,262,3305
1263,,,3168903,,,5417,66487


In [9]:
dados.to_csv('dados_importadoras_mg_cobre_peso_valor.csv')