# Sobre o projeto

Este projeto oferece a oportunidade de compreender melhor a distribuição de recursos culturais por meio da Lei Rouanet e extrair insights significativos sobre a diversidade e impacto dos projetos financiados. 

**Objetivo do projeto**

Realizar uma análise exploratória de dados (EDA) no conjunto de dados da Lei Rouanet, buscando compreender padrões, tendências e insights relacionados aos projetos culturais financiados por meio dessa lei de incentivo à cultura no Brasil.

## Passos do projeto

**1. Coleta e Carregamento dos Dados**

- Obter o dataset da Lei Rouanet, disponibilizado pelo Ministério da Cultura ou por fontes confiáveis relacionadas.
- Carregar os dados em um DataFrame do pandas.

**2. Exploração Inicial**

- Fazer uma exploração inicial para entender a estrutura do dataset, tipos de variáveis e dados disponíveis.

**3. Limpar e preparar os dados**

- Tratar valores ausentes, inconsistências ou duplicatas.
- Converter datas para o formato adequado.
- Analisar e ajustar categorias relevantes.

**4. Analisar a distribuição de recursos**

- Explorar a distribuição de recursos financeiros ao longo do tempo.
- Identificar os projetos que receberam a maior e menor quantidade de financiamento.

**5. Segmentação por áreas culturais**

- Classificar os projetos por categorias culturais (música, artes cênicas, audiovisual, etc.).
- Analisar a distribuição de recursos por essas diferentes áreas.

**6. Participação geográfica**

- Visualizar a participação geográfica dos projetos. Qual região do Brasil recebeu mais incentivos culturais?

**7. Evolução ao longo dos anos**

- Criar gráficos de linha ou de área para mostrar a evolução do número de projetos financiados e do montante investido ao longo dos anos.

**8. Análise de contrapartidas**

- Explorar as contrapartidas oferecidas pelos proponentes dos projetos. Quais tipos de contrapartidas são mais comuns?

**9. Influência de grandes projetos**

- Identificar e analisar grandes projetos que receberam um montante significativo de financiamento. Como esses projetos influenciam a distribuição geral?

**10. Análise de sucesso**

- Definir critérios para o sucesso de um projeto (por exemplo, avaliação do público, impacto cultural) e explorar quais características estão associadas a projetos bem-sucedidos.

**11. Conclusões e insights**

- Resumir as principais descobertas do projeto.
- Identificar padrões interessantes, tendências ao longo do tempo e qualquer insight que possa ser valioso para as partes interessadas e tomadores de decisão.

## Ferramentas utilizadas

- Python (pandas, numpy, matplotlib)
- Jupyter Notebook para documentação e visualização interativa.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import requests
import json

In [None]:
urls_salic = ["https://api.salic.cultura.gov.br/v1/projetos/?limit=100&offset=14600&",
              # "http://api.salic.cultura.gov.br/v1/projetos",
              # "http://api.salic.cultura.gov.br/v1/propostas",
              # "http://api.salic.cultura.gov.br/v1/incentivadores",
              # "http://api.salic.cultura.gov.br/v1/fornecedores",
              # "http://api.salic.cultura.gov.br/v1/proponentes",
             ]

totais = {}
dfs = {}

for url in urls_salic:
    entidade = url.split("/")[-1]
    dados = []
    proxima_url = url

    while proxima_url:
        try:
            response = requests.get(proxima_url)
            response.raise_for_status()
        except requests.exceptions.HTTPError as http_err:
            print(f'Ocorreu um erro HTTP: {http_err}')
        except Exception as e:
            print(f'Ocorreu outro tipo de erro: {e}, {response.status_code}, {proxima_url}')
        else:        
            conteudo = response.text   
    
            while "\xa0" in conteudo:
                conteudo = conteudo.replace('\xa0', ' ')  
                
            conteudo = json.loads(conteudo)
            dados.extend(conteudo["_embedded"][entidade])
            proxima_url = conteudo["_links"].get("next")

    totais[entidade] = conteudo["total"]
    dfs[entidade] = pd.DataFrame(dados)

In [None]:
urls_salic = ["http://api.salic.cultura.gov.br/v1/projetos",
              "http://api.salic.cultura.gov.br/v1/propostas",
              "http://api.salic.cultura.gov.br/v1/incentivadores",
              "http://api.salic.cultura.gov.br/v1/fornecedores",
              "http://api.salic.cultura.gov.br/v1/proponentes",
             ]

totais = {}
erros_urls = []
dfs = {}

for url in urls_salic:
    entidade = url.split("/")[-1]
    dados = []
    response = requests.get(url)
    
    if response.status_code == 200:
        total = response.json()["_links"]["total"]
        totais[entidade] = total

        for i in range(0, total + 1, 100):
            pagina = f"{url}/?limit=100&offset={100 * i}&"
            try:
                response = request.get(pagina)
                response.raise_for_status()
            except requests.exceptions.HTTPError as http_err:
                print(f'Ocorreu um erro HTTP: {http_err}')
                erros_urls.append(pagina)
                continue
            except Exception as e:
                print(f'Ocorreu outro tipo de erro: {e}')
                erros_urls.append(pagina)
                continue
            else:        
                conteudo = response.text   
        
                while "\xa0" in conteudo:
                    conteudo = conteudo.replace('\xa0', ' ')  
                    
                conteudo = json.loads(conteudo)
                dados.extend(conteudo["_embedded"][entidade])

    dfs[entidade] = pd.DataFrame(dados)

In [None]:
len(dados)

In [None]:
dados

In [None]:
totais