<a href="https://colab.research.google.com/github/Rafael-Maranhao/portfolio/blob/main/notebook_startup.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#üå± Levantamento de Dados: Filial de Startup Agr√≠cola
<br>

#### Objetivo

<br>

##### Identificar as melhores cidades para instala√ß√£o de um novo escrit√≥rio, considerando:
<br>

##### üèôÔ∏è Top 100 cidades mais populosas do Brasil;


##### üåæ Ter √°reas produtoras de soja.

<br>
<br>

### üìö Importa√ß√£o de Bibliotecas

In [58]:
import urllib3
import json
import pandas as pd
import os

### üîç Visualiza√ß√£o Completa (Pandas)  

In [59]:
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)

### üì° Importa√ß√£o de dados da API do IBGE

In [60]:
# Fun√ß√£o para obter dados da API com tratamento de erro
def get_data(url):
    http = urllib3.PoolManager()
    try:
        r = http.request('GET', url)
        return json.loads(r.data)
    except Exception as e:
        print(f"Erro ao acessar API: {str(e)}")
        return None

# Obter dados
print("Coletando dados de popula√ß√£o...")
dados_populacao = get_data('https://servicodados.ibge.gov.br/api/v3/agregados/6579/periodos/2021/variaveis/9324?localidades=N6[all]')

print("Coletando dados de √°rea de soja...")
dados_soja = get_data('https://servicodados.ibge.gov.br/api/v3/agregados/1612/periodos/2021/variaveis/109?localidades=N6[all]&classificacao=81[2713]')

Coletando dados de popula√ß√£o...
Coletando dados de √°rea de soja...


### üìä Processamento dos dados (cria√ß√£o de dataframes para os dados de popula√ß√£o e de √°rea de soja)

In [61]:
# Fun√ß√£o para processar dados de popula√ß√£o
def processar_populacao(dados):
    municipios = []
    if dados and len(dados) > 0:
        for item in dados[0]['resultados'][0]['series']:
            try:
                municipios.append({
                    'codigo': item['localidade']['id'],
                    'municipio': item['localidade']['nome'],
                    'populacao': int(item['serie']['2021'])
                })
            except:
                continue
    return pd.DataFrame(municipios)

# Fun√ß√£o para processar dados de soja
def processar_soja(dados):
    municipios = []
    if dados and len(dados) > 0:
        for item in dados[0]['resultados'][0]['series']:
            try:
                valor = item['serie']['2021']
                # Considera apenas valores num√©ricos positivos
                if valor not in ['-', '...', '0']:
                    area = float(valor)
                    if area > 0:
                        municipios.append({
                            'codigo': item['localidade']['id'],
                            'municipio': item['localidade']['nome'],
                            'area_soja': area
                        })
            except:
                continue
    return pd.DataFrame(municipios)

# Processar os dados
print("Processando dados...")
df_pop = processar_populacao(dados_populacao)
df_soja = processar_soja(dados_soja)

Processando dados...


### üèôÔ∏è Filtragem dos 100 Munic√≠pios Mais Populosos

In [62]:
top_100_pop = df_pop.nlargest(100, 'populacao')

### üîÑ Cruzamento de Dados (de popula√ß√£o com de √°reas de soja)

In [63]:
df_final = pd.merge(top_100_pop, df_soja, on=['codigo', 'municipio'], how='inner')

### üìä Ordena√ß√£o Final

In [64]:
df_final = df_final.sort_values('populacao', ascending=False)

### ‚ú® Formata√ß√£o dos Resultados

In [65]:
df_final['area_soja'] = df_final['area_soja'].apply(lambda x: f"{x:,.0f} ha")
df_final['populacao'] = df_final['populacao'].apply(lambda x: f"{x:,}")

### üéØ Resultados Finais

In [66]:
print("\n" + "="*80)
print("MUNIC√çPIOS RECOMENDADOS PARA O NOVO ESCRIT√ìRIO".center(80))
print("(Entre os 100 mais populosos com produ√ß√£o de soja > 0)".center(80))
print("="*80 + "\n")

# Configurar a formata√ß√£o da tabela
from tabulate import tabulate

# Formatar os dados para exibi√ß√£o
df_display = df_final[['municipio', 'populacao', 'area_soja']].copy()
df_display.columns = ['MUNIC√çPIO', 'POPULA√á√ÉO', '√ÅREA DE SOJA (ha)']  # Renomear colunas

# Usar tabulate para melhor formata√ß√£o
print(tabulate(df_display,
               headers='keys',
               tablefmt='pretty',
               stralign='left',
               showindex=False,
               colalign=('left', 'right', 'right')))

print("\n" + "="*80)
print(f"Total de munic√≠pios recomendados: {len(df_final)}".center(80))
print("="*80)


                 MUNIC√çPIOS RECOMENDADOS PARA O NOVO ESCRIT√ìRIO                 
             (Entre os 100 mais populosos com produ√ß√£o de soja > 0)             

+----------------------------+-----------+-------------------+
| MUNIC√çPIO                  | POPULA√á√ÉO | √ÅREA DE SOJA (ha) |
+----------------------------+-----------+-------------------+
| Bras√≠lia - DF              | 3,094,325 |         80,000 ha |
| Goi√¢nia - GO               | 1,555,626 |          1,150 ha |
| Porto Alegre - RS          | 1,492,530 |            398 ha |
| Campinas - SP              | 1,223,237 |            800 ha |
| Campo Grande - MS          |   916,001 |         94,000 ha |
| Ribeir√£o Preto - SP        |   720,116 |            700 ha |
| Uberl√¢ndia - MG            |   706,597 |         58,000 ha |
| Sorocaba - SP              |   695,328 |            700 ha |
| Cuiab√° - MT                |   623,614 |            338 ha |
| Londrina - PR              |   580,870 |         62,000 ha |
| Po

### üíæ Exporta√ß√£o dos Resultados

In [67]:
# Salvar em CSV (mantendo o original)
df_final.to_csv('municipios_recomendados.csv', index=False)
print("\nArquivo 'municipios_recomendados.csv' salvo com todos os dados.")


Arquivo 'municipios_recomendados.csv' salvo com todos os dados.
