### Lendo os dados do arquivo actors.csv

In [2]:
# Função para ler o arquivo 
def ler_arquivo_csv_manual(caminho):
    # Abre o arquivo manualmente 
    arquivo = open(caminho, 'r', encoding='utf-8')
    linhas = []
    for linha in arquivo:
        linhas.append(linha) 
    arquivo.close()
    return linhas

# Função para remover espaços extras antes e depois de uma string manualmente
def remover_espacos_extras(s):
    inicio = 0
    fim = len(s) - 1
    while inicio <= fim and s[inicio] == ' ':
        inicio += 1
    while fim >= inicio and s[fim] == ' ':
        fim -= 1
    return s[inicio:fim+1]

# Função para dividir as linhas corretamente ignorando vírgulas dentro de aspas
def dividir_linha(linha):
    campos = []
    campo = ''
    dentro_de_aspas = False
    for char in linha:
        if char == '"' and not dentro_de_aspas:
            dentro_de_aspas = True
        elif char == '"' and dentro_de_aspas:
            dentro_de_aspas = False
        elif char == ',' and not dentro_de_aspas:
            campos.append(remover_espacos_extras(campo))
            campo = ''
        else:
            campo += char
    campos.append(remover_espacos_extras(campo))  
    return campos

# Lendo os dados do arquivo CSV 
arquivo_caminho = 'actors.csv'
dados = ler_arquivo_csv_manual(arquivo_caminho)

### Etapa 1


In [3]:
# Função que processa os dados e encontra o ator/atriz com maior número de filmes
def etapa_1(dados):
    # Inicializa as variáveis para armazenar o maior número de filmes e o ator correspondente
    maior_qtd_filmes = 0
    ator_mais_filmes = ''
    
    # Percorre as linhas do arquivo, começando pela segunda linha ignorando cabeçalho
    for linha in dados[1:]:  
        # Divide a linha usando a função dividir_linha para ignorar vírgulas internas
        partes = dividir_linha(linha)
        
        # Verifica se o dado na posição 2 (Número de filmes) é um número válido
        try:
            qtd_filmes = int(float(partes[2].strip())) 
        except ValueError:
            print(f"Erro ao processar a linha: {linha}")
            continue
        
        # Obtem o nome do ator (primeiro campo)
        ator = partes[0].strip()
        
        # Atualiza o ator com maior número de filmes
        if qtd_filmes > maior_qtd_filmes:
            maior_qtd_filmes = qtd_filmes
            ator_mais_filmes = ator
    
    # Escreve o resultado no arquivo etapa1
    with open('etapa1.txt', 'w', encoding='utf-8') as arquivo:
        arquivo.write(f'O ator/atriz com maior número de filmes é {ator_mais_filmes}, com {maior_qtd_filmes} filmes.\n')

# Processando os dados
etapa_1(dados)


### Etapa 2

In [4]:
# Função para calcular a média da receita de bilheteira bruta(coluna Gross)
def etapa_2(dados):

    total_gross = 0
    total_filmes = 0
    
    for linha in dados[1:]:

        partes = dividir_linha(linha)
        
        # Verifica se o dado na posição 5 (Gross) é um número válido
        try:
            gross = float(partes[5].strip())  # Convertendo o valor de "gross" para float
        except ValueError:
            print(f"Erro ao processar a linha: {linha}")
            continue
        
        # Atualiza as variáveis de total de receita e quantidade de filmes
        total_gross += gross
        total_filmes += 1
    
    # Calcula a média de receita
    if total_filmes > 0:
        media_gross = total_gross / total_filmes
    else:
        media_gross = 0
    
    # Escreve o resultado no arquivo etapa2
    with open('etapa2.txt', 'w', encoding='utf-8') as arquivo:
        arquivo.write(f'A média de receita de bilheteira bruta dos principais filmes é {media_gross:.2f}.\n')

# Processando os dados para calcular a média de gross
etapa_2(dados)


### Etapa 3

In [5]:
# Função para processar os dados e encontrar o ator/atriz com maior média de receita por filme
def etapa_3(dados):
    
    maior_media = 0
    ator_com_maior_media = ''
    

    for linha in dados[1:]:

        partes = dividir_linha(linha)
        
        # Verifica se o dado na posição 3 (Average per Movie) é um número válido
        try:
            media_por_filme = float(partes[3].strip())  # Converte para float
        except ValueError:
            print(f"Erro ao processar a linha: {linha}")
            continue
        
        # Obtem o nome do ator
        ator = partes[0].strip()
        
        # Atualiza o ator com a maior média de receita por filme
        if media_por_filme > maior_media:
            maior_media = media_por_filme
            ator_com_maior_media = ator
    
    # Escreve o resultado no arquivo etapa3
    with open('etapa3.txt', 'w', encoding='utf-8') as arquivo:
        arquivo.write(f'O ator/atriz com a maior média de receita de bilheteira bruta por filme é {ator_com_maior_media}, com uma média de {maior_media:.2f}.\n')

# Processando os dados para encontrar a maior média
etapa_3(dados)

### Etapa 4

In [6]:
from collections import Counter

# Função para contar as aparições dos filmes de maior bilheteira
def etapa_4(dados):
    # Cria um contador para contar as aparições dos filmes de maior bilheteira
    filmes_contagem = Counter()

    # Percorre as linhas do arquivo, começando pela segunda linha ignorando cabeçalho
    for linha in dados[1:]:
        # Divide a linha usando a função dividir_linha para ignorar virgulas internas
        partes = dividir_linha(linha)
        
        # Extrai o nome do filme de maior bilheteira (#1 Movie)
        filme_mais_bilheteiro = partes[4].strip()
        
        # Atualiza a contagem do filme
        filmes_contagem[filme_mais_bilheteiro] += 1

    # Ordenando os filmes primeiro pela quantidade de aparições (decrescente) e depois pelo nome (alfabeticamente)
    filmes_ordenados = sorted(filmes_contagem.items(), key=lambda x: (-x[1], x[0]))

    # escreve o resultado no arquivo etapa4.txt
    with open('etapa4.txt', 'w', encoding='utf-8') as arquivo:
        for filme, quantidade in filmes_ordenados:
            arquivo.write(f'O filme {filme} aparece {quantidade} vez(es) no dataset.\n')

# Processando os dados para contar as aparições dos filmes de maior bilheteira
etapa_4(dados)

### Etapa 5

In [7]:
# Função para processar os dados e ordenar os atores pela receita bruta de bilheteira
def etapa_5(dados):
    # Cria uma lista de tuplas com o nome do ator e sua receita total bruta
    atores_receita = []

    # Percorre as linhas do arquivo, começando pela segunda linha ignorando cabeçalho
    for linha in dados[1:]:
        # Divide a linha usando a função dividir_linha para ignorar vírgulas internas
        partes = dividir_linha(linha)
        
        # Extrai o nome do ator e a receita total bruta
        ator = partes[0].strip()
        try:
            receita_total = float(partes[1].strip())  # Converte a receita total bruta para float
        except ValueError:
            print(f"Erro ao processar a linha: {linha}")
            continue
        
        # Adiciona o ator e sua receita à lista
        atores_receita.append((ator, receita_total))

    # Ordena os atores pela receita total bruta, de forma decrescente
    atores_receita.sort(key=lambda x: x[1], reverse=True)

    # Escreve o resultado no arquivo etapa5.txt
    with open('etapa5.txt', 'w', encoding='utf-8') as arquivo:
        for ator, receita in atores_receita:
            arquivo.write(f'{ator} - {receita:.2f}\n')

# Processando os dados para ordenar os atores pela receita bruta
etapa_5(dados)

