### Agência Nacional do Cinema - ANCINE

#### Desafios e Oportunidades na Indústria Cinematográfica Brasileira: Uma Análise de Ciência de Dados

#### **Contexto de Negócio**

A qualidade e a amplitude da indústria cinematográfica de um país são reflexos não apenas da sua cultura e sociedade, mas também das suas aspirações, desafios e conquistas. No Brasil, embora a indústria cinematográfica seja ativa e produza um número considerável de filmes anualmente em comparação com países de economias semelhantes, ela enfrenta uma batalha cultural com o cinema estrangeiro, principalmente o americano.

O consumo de entretenimento audiovisual no Brasil é largamente dominado pela indústria americana, em parte devido à sua habilidade de produzir filmes com grandes orçamentos e alto apelo comercial. Isso coloca as produções locais em uma competição desafiadora, muitas vezes com recursos financeiros e de marketing limitados em comparação com seus concorrentes estrangeiros.

Um dos principais fatores a considerar é a disparidade no acesso aos recursos dentro da indústria cinematográfica. Enquanto grandes estúdios e produções de alto orçamento geralmente conseguem financiamento e apoio comercial mais facilmente, cineastas independentes e produções de menor escala muitas vezes enfrentam dificuldades para garantir financiamento e distribuição adequada.

Além disso, as políticas públicas e os incentivos governamentais desempenham um papel crucial na sustentabilidade da indústria cinematográfica nacional. Investimentos em programas de financiamento, subsídios e incentivos fiscais podem ajudar a impulsionar a produção local e promover uma maior diversidade de vozes e perspectivas no cinema brasileiro.

___

#### **Objetivo**  

O objetivo principal deste projeto é analisar dados da indústria cinematográfica brasileira para entender melhor os desafios enfrentados e identificar possíveis soluções para promover um ambiente mais sustentável e diversificado para a produção nacional de filmes.

---
#### **Metodologia**  

Utilizaremos uma abordagem de ciência de dados, com análise exploratória dos dados fornecidos pela ANCINE, incluindo registros de agentes econômicos, atividades na indústria, financiamento de projetos, perfil de investidores e realizadores, entre outros. Faremos uso de técnicas estatísticas e de visualização de dados para identificar padrões e tendências relevantes.

---

#### **Desafios Identificados**  

Disparidade no Acesso a Recursos: Acesso desigual aos recursos dentro da indústria cinematográfica, com grandes estúdios e produções de alto orçamento tendo vantagens significativas em relação a cineastas independentes.

Domínio do Cinema Estrangeiro: Predomínio do cinema estrangeiro, principalmente o americano, no mercado brasileiro, o que cria uma competição desigual para as produções locais.

---

#### **Possíveis Soluções**  

**Incentivos Governamentais:** Implementação de políticas públicas e incentivos governamentais para promover a produção local, como subsídios, incentivos fiscais e programas de financiamento específicos para cineastas independentes.

**Promoção da Diversidade:** Apoio e promoção de uma maior diversidade de vozes e perspectivas na indústria cinematográfica brasileira, através de programas de apoio a produções de menor escala e de nicho.

---


#### **Conclusão**  

Este projeto de ciência de dados visa fornecer insights valiosos sobre os desafios enfrentados pela indústria cinematográfica brasileira e propor possíveis soluções para promover um ambiente mais sustentável e diversificado para a produção nacional de filmes. Ao compreender melhor o contexto sócio-econômico da indústria, esperamos contribuir para o fortalecimento e crescimento do cinema brasileiro.

---




#### **Perguntas-chave**

**Quais são os principais agentes econômicos atuantes na indústria cinematográfica brasileira?**  

**Qual é a distribuição geográfica das produções cinematográficas no Brasil? Há concentração em determinadas regiões?**  

**Qual é o perfil dos investidores na indústria cinematográfica brasileira? Há diferenças significativas entre investidores de produções de grande escala e produções independentes?**  

**Como tem evoluído o financiamento de projetos cinematográficos ao longo do tempo? Há tendências ou padrões identificáveis?** 

**Qual é o perfil dos realizadores e produtores de filmes no Brasil? Há diversidade em termos de gênero, etnia e origem socioeconômica?**

**Quais são os gêneros cinematográficos mais populares no Brasil? Há diferenças regionais em termos de preferências de público?**  

**Como tem sido a distribuição de recursos financeiros e de marketing entre produções de diferentes escalas e orçamentos?**  

**Quais são os principais desafios enfrentados pelos cineastas independentes na produção e distribuição de seus filmes?**  

**Qual é o impacto das políticas públicas e dos incentivos governamentais na indústria cinematográfica brasileira?**  

**Como tem sido a recepção crítica e comercial das produções cinematográficas brasileiras em comparação com as produções estrangeiras?**  

**Quais são os principais obstáculos para a distribuição e exibição de filmes brasileiros nos mercados nacional e internacional?**  

---

#### **Varáveis**

##### **Leitura dos dados brutos**
df_agentes_economicos  
df_atividades_agentes_economicos  
df_projetos_renuncia_fiscal  
df_obras_nao_publicitaria_fomento_indireto  
df_obras_nao_publicitaria_investimento_fsa  
df_processos_em_prestação_de_contas  
df_investidores_projetos_renuncia_fiscal  
df_produtoras_independentes  
df_produtores_obras_nao_publicitarias_brasileiras  
df_projetos_contratados_fsa_desembolso  
df_projetos_renuncia_fiscal  
df_salas_e_complexos  

#### Importação das Bibliotecas

In [1]:
import pandas as pd
import numpy as np
import seaborn as sea
from matplotlib import pyplot as plt
import os
import csv

#### Carregamento dos dataframes

In [2]:
#Leitura dos data frames
df_agentes_economicos = pd.read_csv('AgentesEconomicosRegulares.csv',encoding='latin1', sep=';')
df_atividades_economicas_agentes = pd.read_csv('AtividadesEconomicasAgentesRegulares.csv', encoding='latin1', sep=';')
df_projetos_renuncia_fiscal = pd.read_csv('ProjetosRenunciaFiscal.csv', encoding='latin1', sep=';') 
df_obras_nao_publicitaria_fomento_indireto = pd.read_csv('ObrasNaoPubBrasileirasFomentoIndireto.csv', encoding='utf-16be', sep=';') #Encoding configurado no bloco de notas
df_obras_nao_publicitaria_investimento_fsa = pd.read_csv('ObrasNaoPubBrasileirasInvestimentoFsa.csv', encoding='utf-16be', sep=';') #Encoding configurado no bloco de notas
df_processos_em_prestação_de_contas = pd.read_csv('ProcessosEmPrestacaoDeContas.csv', encoding='latin1', sep=';') 
df_investidores_projetos_renuncia_fiscal = pd.read_csv('InvestidoresEmProjetosRenunciaFiscal.csv', encoding='latin1', sep=';') 
df_produtoras_independentes = pd.read_csv('ProdutorasIndependentes.csv', encoding='latin1', sep=';') 
df_produtores_obras_nao_publicitarias_brasileiras = pd.read_csv('ProdutoresDeObrasNaoPublicitariasBrasileiras.csv', encoding='latin1', sep=';') 
df_projetos_contratados_fsa_desembolso = pd.read_csv('ProjetosContratadosFSAeDesembolso.csv', encoding='latin1', sep=';') 
df_relacao_grupos_economicos = pd.read_csv('RelacaoGruposEconomicos.csv', encoding='latin1', sep=';') 
df_salas_e_complexos = pd.read_csv('SalasDeExibicaoEComplexos.csv', encoding='latin1', sep=';') 

#Declaração de variáveis
# df_agentes_economicos
# df_atividades_economicas_agentes
# df_projetos_renuncia_fiscal
# df_obras_nao_publicitaria_fomento_indireto
# df_obras_nao_publicitaria_investimento_fsa
# df_processos_em_prestação_de_contas
# df_investidores_projetos_renuncia_fiscal
# df_produtoras_independentes
# df_produtores_obras_nao_publicitarias_brasileiras
# df_projetos_contratados_fsa_desembolso
# df_projetos_renuncia_fiscal
# df_salas_e_complexos

### Limpeza, filtragem e declaração de variáveis dos Dados

#### Numeração dos dados para auxiliar na referencição em variáveis diversas

AgentesEconomicosRegulares = 1  
AtividadesEconomicasAgentesRegulares = 2  
ProjetosRenunciaFiscal = 3  
ObrasNaoPubBrasileirasFomentoIndireto = 4  
ObrasNaoPubBrasileirasInvestimentoFsa = 5  
ProcessosEmPrestacaoDeContas = 6  
InvestidoresEmProjetosRenunciaFiscal = 7  
ProdutorasIndependentes = 8  
ProdutoresDeObrasNaoPublicitariasBrasileiras = 9  
ProjetosContratadosFSAeDesembolso = 10  
RelacaoGruposEconomicos = 11  
SalasDeExibicaoEComplexos = 12  
 


In [9]:
#Agentes Econômicos - 1
agnts_economicos = pd.DataFrame(df_agentes_economicos)
mapping_1 = {'SIM' : True, 'NÃO' : False}

#adequando colunas
agnts_economicos['DATA_REGISTRO'] = pd.to_datetime(agnts_economicos['DATA_REGISTRO'], dayfirst=True)
agnts_economicos['DATA_CONSTITUICAO'] = pd.to_datetime(agnts_economicos['DATA_CONSTITUICAO'], dayfirst=True)
agnts_economicos['BRASILEIRO_INDEPENDENTE'] = agnts_economicos['BRASILEIRO_INDEPENDENTE'].map(mapping_1)

# agnts_economicos

###########################

#Atividade Econômica Agentes - 2
atividade_economicas_agnts = pd.DataFrame(df_atividades_economicas_agentes)
mapping_2 = {'SECUNDARIA' : 1, 'PRINCIPAL' : 0}

#adequando colunas
atividade_economicas_agnts['CLASSIFICACAO_ATIVIDADE'] = atividade_economicas_agnts['CLASSIFICACAO_ATIVIDADE'].map(mapping_2)

############################

#ProjetosRenunciaFiscal - 3

# df_projetos_renuncia_fiscal

############################

#ObrasNaoPubBrasileirasFomentoIndireto - 4

# df_obras_nao_publicitaria_fomento_indireto

############################
# df_obras_nao_publicitaria_investimento_fsa
# df_processos_em_prestação_de_contas
# df_investidores_projetos_renuncia_fiscal
# df_produtoras_independentes
# df_produtores_obras_nao_publicitarias_brasileiras
# df_projetos_contratados_fsa_desembolso
# df_projetos_renuncia_fiscal
# df_salas_e_complexos

In [20]:
atividade_economicas_agnts.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 136112 entries, 0 to 136111
Data columns (total 5 columns):
 #   Column                   Non-Null Count   Dtype 
---  ------                   --------------   ----- 
 0   REGISTRO_ANCINE          136112 non-null  int64 
 1   RAZAO_SOCIAL             136112 non-null  object
 2   CNPJ                     136112 non-null  object
 3   CLASSIFICACAO_ATIVIDADE  136112 non-null  int64 
 4   ATIVIDADE_ECONOMICA      136112 non-null  object
dtypes: int64(2), object(3)
memory usage: 5.2+ MB


In [5]:
atividade_economicas_agnts['CLASSIFICACAO_ATIVIDADE'].value_counts()

Series([], Name: count, dtype: int64)