# **Pescadores Proficionais no Brasil**
### **AUTOR:** Antonino Marques Jares
### **CONCURSO:** 1º Concurso de Reúso de Dados Abertos da CGU

In [None]:
!pip install pandas matplotlib numpy



In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.animation as animation
from IPython.display import HTML
import numpy as np

In [None]:
# origem dados dos estados e municipios https://github.com/kelvins/municipios-brasileiros/blob/main/csv/municipios.csv
df_estado = pd.read_csv('estados.csv', sep=',')
df_municipios = pd.read_csv('municipios.csv', sep=',')

In [None]:
# Primeiras linhas
df_estado.head(3)

Unnamed: 0,codigo_uf,uf,nome,latitude,longitude,regiao
0,11,RO,Rondônia,-10.83,-63.34,Norte
1,12,AC,Acre,-8.77,-70.55,Norte
2,13,AM,Amazonas,-3.47,-65.1,Norte


In [None]:
# Primeiras linhas
df_municipios.head(3)

Unnamed: 0,codigo_ibge,nome,latitude,longitude,capital,codigo_uf,siafi_id,ddd,fuso_horario
0,5200050,Abadia de Goiás,-16.7573,-49.4412,0,52,1050,62,America/Sao_Paulo
1,3100104,Abadia dos Dourados,-18.4831,-47.3916,0,31,4001,34,America/Sao_Paulo
2,5200100,Abadiânia,-16.197,-48.7057,0,52,9201,62,America/Sao_Paulo


In [None]:
# adicionando UF com um Join entre Df_Estado e Df_Municipio
df_municipios = df_municipios.join(
    df_estado.set_index('codigo_uf')[['uf']],
    on='codigo_uf',
    how='left'
)
df_municipios.head()

Unnamed: 0,codigo_ibge,nome,latitude,longitude,capital,codigo_uf,siafi_id,ddd,fuso_horario,uf
0,5200050,Abadia de Goiás,-16.7573,-49.4412,0,52,1050,62,America/Sao_Paulo,GO
1,3100104,Abadia dos Dourados,-18.4831,-47.3916,0,31,4001,34,America/Sao_Paulo,MG
2,5200100,Abadiânia,-16.197,-48.7057,0,52,9201,62,America/Sao_Paulo,GO
3,3100203,Abaeté,-19.1551,-45.4444,0,31,4003,37,America/Sao_Paulo,MG
4,1500107,Abaetetuba,-1.72183,-48.8788,0,15,401,91,America/Sao_Paulo,PA


In [None]:
# Renomear a coluna 'nome' para 'municipio'
df_municipios = df_municipios.rename(columns={'nome': 'municipio'})
# Atribuindo o reordenamento ao DataFrame
nova_ordem = ['uf','municipio', 'latitude','longitude']
df_municipios = df_municipios[nova_ordem]
# Renomear as colunas
df_municipios = df_municipios.rename(columns={'uf': 'UF'})
df_municipios = df_municipios.rename(columns={'municipio': 'MUNICIPIO'})
df_municipios = df_municipios.rename(columns={'latitude': 'LATITUDE'})
df_municipios = df_municipios.rename(columns={'longitude': 'LONGITUDE'})
df_municipios.head(3)

Unnamed: 0,UF,MUNICIPIO,LATITUDE,LONGITUDE
0,GO,Abadia de Goiás,-16.7573,-49.4412
1,MG,Abadia dos Dourados,-18.4831,-47.3916
2,GO,Abadiânia,-16.197,-48.7057


# Fonte de Dados
https://dados.gov.br/dados/conjuntos-dados/base-de-dados-dos-registros-de-pescadores-e-pescadoras-profissionais

In [None]:
df_brasil = pd.read_excel('AC_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_brasil = df_brasil[nova_ordem]
df_brasil['qtd'] = 1

In [None]:
def verifica_dataset():
  print("\n\n primeiras linhas \n","========================\n\n",df_brasil.head(3))
  print("\n\n ultimas linhas \n","========================\n\n",df_brasil.tail(3))
  total_linhas = len(df_brasil)
  print("\n\n Total de linhas:", total_linhas)

In [None]:
df_temporario = pd.read_excel('AL_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

        UF   Municipio Forma de Atuacao  qtd
38152  AL   Piaçabuçu     Desembarcado    1
38153  AL  Belo Monte     Desembarcado    1
38154  AL    São Brás     Desembarcado    1


 Total de linhas: 38155


In [None]:
df_temporario = pd.read_excel('AM_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

         UF                  Municipio Forma de Atuacao  qtd
159005  AM  Santa Isabel do Rio Negro     Desembarcado    1
159006  AM                    Humaitá     Desembarcado    1
159007  AM                    Humaitá     Desembarcado    1


 Total de linhas: 159008


In [None]:
df_temporario = pd.read_excel('AP_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

         UF Municipio Forma de Atuacao  qtd
183009  AP   Santana     Desembarcado    1
183010  AP   Mazagão     Desembarcado    1
183011  AP   Santana     Desembarcado    1


 Total de linhas: 183012


In [None]:
df_temporario = pd.read_excel('BA_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

         UF  Municipio Forma de Atuacao  qtd
330170  BA   Juazeiro     Desembarcado    1
330171  BA      Barra     Desembarcado    1
330172  BA  Wanderley     Desembarcado    1


 Total de linhas: 330173


In [None]:
df_temporario = pd.read_excel('CE_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

         UF Municipio Forma de Atuacao  qtd
361581  CE   Itarema     Desembarcado    1
361582  CE  Tamboril     Desembarcado    1
361583  CE   Varjota     Desembarcado    1


 Total de linhas: 361584


In [None]:
df_temporario = pd.read_excel('DF_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

         UF Municipio Forma de Atuacao  qtd
361994  DF  Brasília     Desembarcado    1
361995  DF  Brasília        Embarcado    1
361996  DF  Brasília     Desembarcado    1


 Total de linhas: 361997


In [None]:
df_temporario = pd.read_excel('ES_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

         UF   Municipio Forma de Atuacao  qtd
395910  ES    Linhares     Desembarcado    1
395911  ES  Itapemirim     Desembarcado    1
395912  ES  Marataízes     Desembarcado    1


 Total de linhas: 395913


In [None]:
df_temporario = pd.read_excel('GO_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

         UF               Municipio Forma de Atuacao  qtd
398541  GO            Inaciolândia        Embarcado    1
398542  GO  São Miguel do Araguaia     Desembarcado    1
398543  GO               São Simão     Desembarcado    1


 Total de linhas: 398544


In [None]:
df_temporario = pd.read_excel('MA_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

         UF          Municipio Forma de Atuacao  qtd
988597  MA  Amapá do Maranhão     Desembarcado    1
988598  MA  Capinzal do Norte     Desembarcado    1
988599  MA             Tutóia     Desembarcado    1


 Total de linhas: 988600


In [None]:
df_temporario = pd.read_excel('MG_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF   Municipio Forma de Atuacao  qtd
1018806  MG   Ituiutaba     Desembarcado    1
1018807  MG  Uberlândia     Desembarcado    1
1018808  MG  Cana Verde     Desembarcado    1


 Total de linhas: 1018809


In [None]:
df_temporario = pd.read_excel('MS_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF   Municipio Forma de Atuacao  qtd
1026356  MS     Corumbá     Desembarcado    1
1026357  MS  Ponta Porã     Desembarcado    1
1026358  MS       Coxim     Desembarcado    1


 Total de linhas: 1026359


In [None]:
df_temporario = pd.read_excel('MT_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF         Municipio Forma de Atuacao  qtd
1037991  MT  Barão de Melgaço     Desembarcado    1
1037992  MT           Cáceres     Desembarcado    1
1037993  MT           Cáceres        Embarcado    1


 Total de linhas: 1037994


In [None]:
df_temporario = pd.read_excel('PA_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF Municipio Forma de Atuacao  qtd
1385484  PA    Curuçá     Desembarcado    1
1385485  PA    Curuçá     Desembarcado    1
1385486  PA    Gurupá     Desembarcado    1


 Total de linhas: 1385487


In [None]:
df_temporario = pd.read_excel('PB_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF   Municipio Forma de Atuacao  qtd
1435553  PB   Itabaiana     Desembarcado    1
1435554  PB     Mogeiro     Desembarcado    1
1435555  PB  Itaporanga     Desembarcado    1


 Total de linhas: 1435556


In [None]:
df_temporario = pd.read_excel('PE_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF                Municipio Forma de Atuacao  qtd
1458521  PE  Jaboatão dos Guararapes     Desembarcado    1
1458522  PE                 Igarassu     Desembarcado    1
1458523  PE                Petrolina     Desembarcado    1


 Total de linhas: 1458524


In [None]:
df_temporario = pd.read_excel('PI_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF          Municipio Forma de Atuacao  qtd
1525921  PI  Capitão de Campos     Desembarcado    1
1525922  PI  Capitão de Campos     Desembarcado    1
1525923  PI  Cajueiro da Praia     Desembarcado    1


 Total de linhas: 1525924


In [None]:
df_temporario = pd.read_excel('PR_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF          Municipio Forma de Atuacao  qtd
1538884  PR  São Pedro do Ivaí        Embarcado    1
1538885  PR          Guaratuba     Desembarcado    1
1538886  PR            Ibiporã        Embarcado    1


 Total de linhas: 1538887


In [None]:
df_temporario = pd.read_excel('RJ_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF Municipio Forma de Atuacao  qtd
1557533  RJ   Niterói     Desembarcado    1
1557534  RJ   Niterói     Desembarcado    1
1557535  RJ   Niterói     Desembarcado    1


 Total de linhas: 1557536


In [None]:
df_temporario = pd.read_excel('RN_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF    Municipio Forma de Atuacao  qtd
1581883  RN        Macau     Desembarcado    1
1581884  RN  Ceará-Mirim     Desembarcado    1
1581885  RN  João Câmara     Desembarcado    1


 Total de linhas: 1581886


In [None]:
df_temporario = pd.read_excel('RO_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF    Municipio Forma de Atuacao  qtd
1592618  RO  Porto Velho     Desembarcado    1
1592619  RO  Porto Velho     Desembarcado    1
1592620  RO  Porto Velho     Desembarcado    1


 Total de linhas: 1592621


In [None]:
df_temporario = pd.read_excel('RR_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF Municipio Forma de Atuacao  qtd
1602069  RR  São Luiz     Desembarcado    1
1602070  RR     Cantá     Desembarcado    1
1602071  RR   Mucajaí     Desembarcado    1


 Total de linhas: 1602072


In [None]:
df_temporario = pd.read_excel('RS_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF             Municipio Forma de Atuacao  qtd
1623318  RS           São Nicolau     Desembarcado    1
1623319  RS  Frederico Westphalen     Desembarcado    1
1623320  RS               Taquari     Desembarcado    1


 Total de linhas: 1623321


In [None]:
df_temporario = pd.read_excel('SC_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF   Municipio Forma de Atuacao  qtd
1652161  SC   Joinville     Desembarcado    1
1652162  SC   Jaguaruna     Desembarcado    1
1652163  SC  Navegantes        Embarcado    1


 Total de linhas: 1652164


In [None]:
df_temporario = pd.read_excel('SE_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF       Municipio Forma de Atuacao  qtd
1689073  SE  Porto da Folha     Desembarcado    1
1689074  SE          Gararu     Desembarcado    1
1689075  SE         Propriá     Desembarcado    1


 Total de linhas: 1689076


In [None]:
df_temporario = pd.read_excel('SP_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF  Municipio Forma de Atuacao  qtd
1732365  SP   Castilho     Desembarcado    1
1732366  SP    Itupeva        Embarcado    1
1732367  SP  São Paulo        Embarcado    1


 Total de linhas: 1732368


In [None]:
df_temporario = pd.read_excel('TO_Pescadores.xlsx', sheet_name='in')
nova_ordem = ['UF','Municipio','Forma de Atuacao']
df_temporario = df_temporario[nova_ordem]
df_temporario['qtd'] = 1
df_brasil = pd.concat([df_brasil, df_temporario], ignore_index=True)
verifica_dataset()



 primeiras linhas 

    UF       Municipio Forma de Atuacao  qtd
0  AC      Rio Branco     Desembarcado    1
1  AC      Rio Branco     Desembarcado    1
2  AC  Sena Madureira     Desembarcado    1


 ultimas linhas 

          UF        Municipio Forma de Atuacao  qtd
1741483  TO  Carrasco Bonito     Desembarcado    1
1741484  TO       Araguatins     Desembarcado    1
1741485  TO      Palmeirante     Desembarcado    1


 Total de linhas: 1741486


In [None]:
# Renomear a coluna 'nome' para 'municipio'
df_brasil = df_brasil.rename(columns={'Forma de Atuacao': 'TIPO'})
df_brasil = df_brasil.rename(columns={'Municipio': 'MUNICIPIO'})
df_brasil = df_brasil.rename(columns={'qtd': 'QTD'})
# Agrupar por 'uf', 'municipio' e 'tipo', e somar 'qtd'
df_brasil = df_brasil.groupby(['UF', 'MUNICIPIO', 'TIPO'])['QTD'].sum().reset_index()
verifica_dataset()



 primeiras linhas 

    UF     MUNICIPIO          TIPO  QTD
0  AC    Acrelândia  Desembarcado   68
1  AC  Assis Brasil  Desembarcado  509
2  AC     Brasiléia  Desembarcado  800


 ultimas linhas 

       UF     MUNICIPIO          TIPO  QTD
6121  TO  Wanderlândia  Desembarcado    5
6122  TO       Xambioá  Desembarcado  157
6123  TO       Xambioá     Embarcado    2


 Total de linhas: 6124


In [None]:
# 1. Realizar o merge mantendo TIPO e QTD de df_brasil e adicionando coordenadas
df_brasil = pd.merge(
    df_brasil[['UF', 'MUNICIPIO', 'TIPO', 'QTD']],
    df_municipios[['UF', 'MUNICIPIO', 'LATITUDE', 'LONGITUDE']],
    on=['UF', 'MUNICIPIO'],
    how='left'
)

# 2. Reordenar as colunas (opcional)
nova_ordem = ['UF', 'MUNICIPIO', 'LATITUDE', 'LONGITUDE', 'TIPO', 'QTD']
df_brasil = df_brasil[nova_ordem]

# 3. Pivotear o DataFrame (se necessário para visualização)
# Note que aqui usamos df_brasil, não df_estado como no seu código original
df_pivot = df_brasil.pivot_table(
    index=['UF', 'MUNICIPIO', 'LATITUDE', 'LONGITUDE'],
    columns='TIPO',
    values='QTD',
    aggfunc='sum'  # ou 'first', dependendo da sua necessidade
).fillna(0).reset_index()
df_pivot = df_pivot.rename(columns={'Desembarcado': 'DESEMBARCADO'})
df_pivot = df_pivot.rename(columns={'Embarcado': 'EMBARCADO'})
# Verificar o resultado
print("DataFrame com coordenadas:")
print(df_brasil.tail())

print("\nDataFrame pivotado:")
print(df_pivot.tail())

DataFrame com coordenadas:
      UF     MUNICIPIO  LATITUDE  LONGITUDE          TIPO  QTD
6119  TO    Tocantínia  -9.56320   -48.3741     Embarcado    3
6120  TO    Tupiratins  -8.39388   -48.1277  Desembarcado   22
6121  TO  Wanderlândia  -6.85274   -47.9601  Desembarcado    5
6122  TO       Xambioá  -6.41410   -48.5320  Desembarcado  157
6123  TO       Xambioá  -6.41410   -48.5320     Embarcado    2

DataFrame pivotado:
TIPO  UF       MUNICIPIO  LATITUDE  LONGITUDE  DESEMBARCADO  EMBARCADO
4265  TO  Tocantinópolis  -6.32447   -47.4224         399.0        1.0
4266  TO      Tocantínia  -9.56320   -48.3741           2.0        3.0
4267  TO      Tupiratins  -8.39388   -48.1277          22.0        0.0
4268  TO    Wanderlândia  -6.85274   -47.9601           5.0        0.0
4269  TO         Xambioá  -6.41410   -48.5320         157.0        2.0


In [None]:
# Converter para JSON mantendo a estrutura pivotada
json_pivot = df_pivot.to_json(orient='records', indent=4)

# Salvar em arquivo (opcional)
with open('dados_pescadores_no_brasil.json', 'w', encoding='utf-8') as f:
    f.write(json_pivot)

print(json_pivot)

[
    {
        "UF":"AC",
        "MUNICIPIO":"Acrel\u00e2ndia",
        "LATITUDE":-9.82581,
        "LONGITUDE":-66.8972,
        "DESEMBARCADO":68.0,
        "EMBARCADO":0.0
    },
    {
        "UF":"AC",
        "MUNICIPIO":"Assis Brasil",
        "LATITUDE":-10.9298,
        "LONGITUDE":-69.5738,
        "DESEMBARCADO":509.0,
        "EMBARCADO":0.0
    },
    {
        "UF":"AC",
        "MUNICIPIO":"Brasil\u00e9ia",
        "LATITUDE":-10.995,
        "LONGITUDE":-68.7497,
        "DESEMBARCADO":800.0,
        "EMBARCADO":0.0
    },
    {
        "UF":"AC",
        "MUNICIPIO":"Bujari",
        "LATITUDE":-9.81528,
        "LONGITUDE":-67.955,
        "DESEMBARCADO":78.0,
        "EMBARCADO":0.0
    },
    {
        "UF":"AC",
        "MUNICIPIO":"Capixaba",
        "LATITUDE":-10.566,
        "LONGITUDE":-67.686,
        "DESEMBARCADO":68.0,
        "EMBARCADO":0.0
    },
    {
        "UF":"AC",
        "MUNICIPIO":"Cruzeiro do Sul",
        "LATITUDE":-7.62762,
        "LON

# Próximo passo é incorporar ao HTML o JSON construído aqui
### Futuramente esse método poderá gerar uma API que manterá a página atualizada.

### **AUTOR:** Antonino Marques Jares