### Agência Nacional do Cinema - ANCINE

#### Desafios e Oportunidades na Indústria Cinematográfica Brasileira: Uma Análise de Ciência de Dados

#### **Contexto de Negócio**

A qualidade e a amplitude da indústria cinematográfica de um país são reflexos não apenas da sua cultura e sociedade, mas também das suas aspirações, desafios e conquistas. No Brasil, embora a indústria cinematográfica seja ativa e produza um número considerável de filmes anualmente em comparação com países de economias semelhantes, ela enfrenta uma batalha cultural com o cinema estrangeiro, principalmente o americano.

O consumo de entretenimento audiovisual no Brasil é largamente dominado pela indústria americana, em parte devido à sua habilidade de produzir filmes com grandes orçamentos e alto apelo comercial. Isso coloca as produções locais em uma competição desafiadora, muitas vezes com recursos financeiros e de marketing limitados em comparação com seus concorrentes estrangeiros.

Um dos principais fatores a considerar é a disparidade no acesso aos recursos dentro da indústria cinematográfica. Enquanto grandes estúdios e produções de alto orçamento geralmente conseguem financiamento e apoio comercial mais facilmente, cineastas independentes e produções de menor escala muitas vezes enfrentam dificuldades para garantir financiamento e distribuição adequada.

Além disso, as políticas públicas e os incentivos governamentais desempenham um papel crucial na sustentabilidade da indústria cinematográfica nacional. Investimentos em programas de financiamento, subsídios e incentivos fiscais podem ajudar a impulsionar a produção local e promover uma maior diversidade de vozes e perspectivas no cinema brasileiro.

___

#### **Objetivo**  

O objetivo principal deste projeto é analisar dados da indústria cinematográfica brasileira para entender melhor os desafios enfrentados e identificar possíveis soluções para promover um ambiente mais sustentável e diversificado para a produção nacional de filmes.

---
#### **Metodologia**  

Utilizaremos uma abordagem de ciência de dados, com análise exploratória dos dados fornecidos pela ANCINE, incluindo registros de agentes econômicos, atividades na indústria, financiamento de projetos, perfil de investidores e realizadores, entre outros. Faremos uso de técnicas estatísticas e de visualização de dados para identificar padrões e tendências relevantes.

---

#### **Desafios Identificados**  

Disparidade no Acesso a Recursos: Acesso desigual aos recursos dentro da indústria cinematográfica, com grandes estúdios e produções de alto orçamento tendo vantagens significativas em relação a cineastas independentes.

Domínio do Cinema Estrangeiro: Predomínio do cinema estrangeiro, principalmente o americano, no mercado brasileiro, o que cria uma competição desigual para as produções locais.

---

#### **Possíveis Soluções**  

**Incentivos Governamentais:** Implementação de políticas públicas e incentivos governamentais para promover a produção local, como subsídios, incentivos fiscais e programas de financiamento específicos para cineastas independentes.

**Promoção da Diversidade:** Apoio e promoção de uma maior diversidade de vozes e perspectivas na indústria cinematográfica brasileira, através de programas de apoio a produções de menor escala e de nicho.

---


#### **Conclusão**  

Este projeto de ciência de dados visa fornecer insights valiosos sobre os desafios enfrentados pela indústria cinematográfica brasileira e propor possíveis soluções para promover um ambiente mais sustentável e diversificado para a produção nacional de filmes. Ao compreender melhor o contexto sócio-econômico da indústria, esperamos contribuir para o fortalecimento e crescimento do cinema brasileiro.

---




#### **Perguntas-chave**

**Quais são os principais agentes econômicos atuantes na indústria cinematográfica brasileira?**  

**Qual é a distribuição geográfica das produções cinematográficas no Brasil? Há concentração em determinadas regiões?**  

**Qual é o perfil dos investidores na indústria cinematográfica brasileira? Há diferenças significativas entre investidores de produções de grande escala e produções independentes?**  

**Como tem evoluído o financiamento de projetos cinematográficos ao longo do tempo? Há tendências ou padrões identificáveis?** 

**Qual é o perfil dos realizadores e produtores de filmes no Brasil? Há diversidade em termos de gênero, etnia e origem socioeconômica?**

**Quais são os gêneros cinematográficos mais populares no Brasil? Há diferenças regionais em termos de preferências de público?**  

**Como tem sido a distribuição de recursos financeiros e de marketing entre produções de diferentes escalas e orçamentos?**  

**Quais são os principais desafios enfrentados pelos cineastas independentes na produção e distribuição de seus filmes?**  

**Qual é o impacto das políticas públicas e dos incentivos governamentais na indústria cinematográfica brasileira?**  

**Como tem sido a recepção crítica e comercial das produções cinematográficas brasileiras em comparação com as produções estrangeiras?**  

**Quais são os principais obstáculos para a distribuição e exibição de filmes brasileiros nos mercados nacional e internacional?**  

---

#### Importação das Bibliotecas

In [1]:
import pandas as pd
import numpy as np
import seaborn as sea
from matplotlib import pyplot as plt
import os
import csv

#### Carregamento dos dataframes

In [16]:
# codificacoes = ['utf-8', 'latin1', 'iso-8859-1', 'utf-16']
# for codificacao in codificacoes:
#     try:
#         df = pd.read_csv('agentes-economicos-regulares.csv', encoding=codificacao, sep=';')
#         # Se a leitura for bem-sucedida, imprima o DataFrame e a codificação usada
#         print("Leitura bem-sucedida com a codificação:", codificacao)
#         print(df.head())
#         break
#     except UnicodeDecodeError:
#         print("Erro de decodificação com a codificação:", codificacao)


# df_agentes_economicos = pd.read_csv('C:\\Users\\syafo\\OneDrive\\Documentos\\GitHub\\AgenciaNacionalDoCinema_ANCINE\\dados_brutos\\agentes-economicos-regulares.csv', encoding='latin1', sep=';')
df_agentes_economicos = pd.read_csv('AgentesEconomicosRegulares.csv',encoding='latin1', delimiter=';')
# df_atividades_agentes_economicos = pd.read_csv('AtividadesEconomicasAgentesRegulares.csv', encoding='latin1', sep=';')
# df_projetos_renuncia_fiscal = pd.read_csv('ProjetosRenunciaFiscal.csv', encoding='latin1', sep=';') #ok
# df_obras_nao_publicitaria_fomento_indireto = pd.read_csv('ObrasNaoPubBrasileirasFomentoIndireto.csv', encoding='latin1', sep=';')
# df_obras_nao_publicitaria_investimento_fsa = pd.read_csv('ObrasNaoPubBrasileirasInvestimentoFsa.csv', encoding='latin1', sep=';')
df_processos_em_prestação_de_contas = pd.read_csv('ProcessosEmPrestacaoDeContas.csv', encoding='latin1', sep=';') #ok
# df_investidores_projetos_renuncia_fiscal = pd.read_csv('InvestidoresEmProjetosRenunciaFiscal.csv', encoding='latin1', sep=';') #ok
# df_produtoras_independentes = pd.read_csv('ProdutorasIndependentes.csv', encoding='latin1', sep=';') #ok

# with open('AgentesEconomicosRegulares.csv', 'r') as file:
#     # Leia todas as linhas do arquivo
#     linhas = file.readlines()

# linhas

data1 = []
with open('AgentesEconomicosRegulares.csv', 'r', encoding='latin1') as file:
    reader = csv.reader(file, delimiter=';')
    for row in reader:
        data1.append(row)

df_dir_obra_publi_estrang = pd.DataFrame(data1)
df_dir_obra_publi_estrang

# df_agentes_economicos.sample(10)
# df_atividades_agentes_economicos
# df_projetos_renuncia_fiscal
# df_obras_nao_publicitaria_fomento_indireto
# df_obras_nao_publicitaria_investimento_fsa
# df_processos_em_prestação_de_contas
# df_investidores_projetos_renuncia_fiscal
# df_produtoras_independentes

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,10
0,ÿþR�E�G�I�S�T�R�O�_�A�N�C�I�N�E�,�D�A�T�A�_�R�E�G�I�S�T�R�O�,�R�A�Z�A�O�_�S�O�C�I�A�L�,�C�N�P�J�,�D�A�T�A�_�C�O�N�S�T�I�T�U�I�C�A�O�,�U�F�,�M�U�N�I�C�I�P�I�O�,�C�O�D�I�G�O�_�M�U�N�I�C�I�P�I�O�_�I�B�G�E�,�C�L�A�S�S�I�F�I�C�A�C�A�O�_�A�G�E�N�T�E�_�E�C...,�N�A�T�U�R�E�Z�A�_�J�U�R�I�D�I�C�A�,�B�R�A�S�I�L�E�I�R�O�_�I�N�D�E�P�E�N�D�E�N�T�E�
1,�3�2�4�2�6�,�2�2�/�0�3�/�2�0�1�6�,�+�2� �P�R�O�D�U�Ç�Õ�E�S� �C�U�L�T�U�R�A�I�S� ...,�1�0�.�5�3�9�.�5�1�9�/�0�0�0�1�-�0�4�,�0�8�/�1�2�/�2�0�0�8�,�R�J�,�R�I�O� �D�E� �J�A�N�E�I�R�O�,�3�3�0�4�5�5�7�,�B�r�a�s�i�l�e�i�r�o� �i�n�d�e�p�e�n�d�e�n�t�e�,�S�o�c�i�e�d�a�d�e� �S�i�m�p�l�e�s� �L�i�m�i�t...,�S�I�M�
2,�4�6�5�7�2�,�1�1�/�0�9�/�2�0�2�0�,�+�2�4�2� �C�O�M�U�N�I�C�A�C�A�O� �L�T�D�A�-�M�E�,�2�3�.�7�0�5�.�5�2�4�/�0�0�0�1�-�8�3�,�1�9�/�1�1�/�2�0�1�5�,�D�F�,�B�R�A�S�Í�L�I�A�,�5�3�0�0�1�0�8�,�B�r�a�s�i�l�e�i�r�o� �i�n�d�e�p�e�n�d�e�n�t�e�,�S�o�c�i�e�d�a�d�e� �E�m�p�r�e�s�á�r�i�a� �L�i...,�S�I�M�
3,�5�2�1�7�9�,�1�3�/�1�0�/�2�0�2�2�,�.�9�7�6� �L�T�D�A�,�4�6�.�5�2�1�.�6�2�0�/�0�0�0�1�-�7�7�,�2�4�/�0�5�/�2�0�2�2�,�S�C�,�B�L�U�M�E�N�A�U�,�4�2�0�2�4�0�4�,�B�r�a�s�i�l�e�i�r�o� �i�n�d�e�p�e�n�d�e�n�t�e�,�S�o�c�i�e�d�a�d�e� �E�m�p�r�e�s�á�r�i�a� �L�i...,�S�I�M�
4,�2�3�8�0�9�,�1�9�/�0�4�/�2�0�1�3�,�0�5�1� �C�I�N�E� �&� �V�I�D�E�O� �L�T�D�A�.� ...,�1�7�.�6�5�9�.�8�3�7�/�0�0�0�1�-�4�0�,�1�3�/�0�2�/�2�0�1�3�,�S�P�,�S�Ã�O� �P�A�U�L�O�,�3�5�5�0�3�0�8�,�B�r�a�s�i�l�e�i�r�o� �i�n�d�e�p�e�n�d�e�n�t�e�,�S�o�c�i�e�d�a�d�e� �E�m�p�r�e�s�á�r�i�a� �L�i...,�S�I�M�
...,...,...,...,...,...,...,...,...,...,...,...
18549,�4�2�4�1�1�,�1�1�/�0�3�/�2�0�1�9�,�Í�T�A�C�A� �C�O�M�U�N�I�C�A�C�A�O�,�2�8�.�8�7�8�.�0�8�2�/�0�0�0�1�-�9�0�,�1�7�/�1�0�/�2�0�1�7�,�R�J�,�R�I�O� �D�E� �J�A�N�E�I�R�O�,�3�3�0�4�5�5�7�,�B�r�a�s�i�l�e�i�r�o� �i�n�d�e�p�e�n�d�e�n�t�e�,�E�m�p�r�e�s�a� �I�n�d�i�v�i�d�u�a�l� �d�e� �R...,�S�I�M�
18550,�5�5�8�0�6�,�2�0�/�1�0�/�2�0�2�3�,�Ó�C�I�O� �D�O� �O�F�Í�C�I�O� �P�R�O�D�U�C�O�E...,�0�8�.�2�7�7�.�0�2�4�/�0�0�0�1�-�0�2�,�2�2�/�0�8�/�2�0�0�6�,�R�J�,�R�I�O� �D�E� �J�A�N�E�I�R�O�,�3�3�0�4�5�5�7�,�B�r�a�s�i�l�e�i�r�o� �i�n�d�e�p�e�n�d�e�n�t�e�,�S�o�c�i�e�d�a�d�e� �E�m�p�r�e�s�á�r�i�a� �L�i...,�S�I�M�
18551,�3�4�2�9�,�1�8�/�0�3�/�2�0�0�5�,�Ó�P�E�R�A� �P�R�I�M�A� �P�R�O�D�U�Ç�Õ�E�S� �M...,�0�5�.�0�0�5�.�7�1�1�/�0�0�0�1�-�7�2�,�1�0�/�0�4�/�2�0�0�2�,�R�J�,�R�I�O� �D�E� �J�A�N�E�I�R�O�,�3�3�0�4�5�5�7�,�B�r�a�s�i�l�e�i�r�o� �i�n�d�e�p�e�n�d�e�n�t�e�,�S�o�c�i�e�d�a�d�e� �S�i�m�p�l�e�s� �L�i�m�i�t...,�S�I�M�
18552,�4�4�9�8�3�,�2�3�/�0�1�/�2�0�2�0�,�Ô�X�E� �E�V�E�N�T�O�S� �E�I�R�E�L�I� �M�E�,�0�7�.�1�2�0�.�4�6�4�/�0�0�0�1�-�8�0�,�0�7�/�1�2�/�2�0�0�4�,�A�L�,�M�A�C�E�I�Ó�,�2�7�0�4�3�0�2�,�B�r�a�s�i�l�e�i�r�o� �i�n�d�e�p�e�n�d�e�n�t�e�,�E�m�p�r�e�s�a� �I�n�d�i�v�i�d�u�a�l� �d�e� �R...,�S�I�M�


In [3]:
df_agentes_economicos.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 18553 entries, 0 to 18552
Data columns (total 11 columns):
 #   Column       Non-Null Count  Dtype  
---  ------       --------------  -----  
 0   ÿþR          0 non-null      float64
 1   Unnamed: 1   0 non-null      float64
 2   Unnamed: 2   0 non-null      float64
 3   Unnamed: 3   0 non-null      float64
 4   Unnamed: 4   0 non-null      float64
 5   Unnamed: 5   0 non-null      float64
 6   Unnamed: 6   0 non-null      float64
 7   Unnamed: 7   0 non-null      float64
 8   Unnamed: 8   0 non-null      float64
 9   Unnamed: 9   0 non-null      float64
 10  Unnamed: 10  0 non-null      float64
dtypes: float64(11)
memory usage: 1.6 MB
