## Etapa 01 - Ator/atriz com o Maior Número de Filmes ##

In [1]:
# Abrindo e lendo o arquivo actors.csv
with open('actors.csv', 'r', encoding='utf-8') as file:
    lines = file.readlines()  # Lê todas as linhas do arquivo

# Identificando os índices das colunas
header = lines[0].strip().split(',')  # Lê o cabeçalho
actor_index = header.index('Actor')
num_movies_index = header.index('Number of Movies')

# Variáveis para armazenar o ator com maior número de filmes e a quantidade correspondente
max_movies = 0
top_actor = ""

# Iterando sobre os dados
for row in lines[1:]:
    data = row.strip().split(',')  # Dividir pelos separadores

    try:
        # Tentar converter para inteiro, ignorando valores não inteiros
        num_movies = int(float(data[num_movies_index].strip()))  # Converter para float e depois para int
    except ValueError:
        print(f"Valor inválido encontrado: {data[num_movies_index]}. Pulando esta linha.")
        continue  # Ignorar esta linha e continuar

    if num_movies > max_movies:
        max_movies = num_movies
        top_actor = data[actor_index]

# Resultado
result = f'O ator/atriz com o maior número de filmes é {top_actor}, com {max_movies} filmes.'

# Exibindo o resultado
print(result)

# Criando e escrevendo o resultado em um arquivo de texto
with open('etapa_1.txt', 'w', encoding='utf-8') as output_file:
    output_file.write(result)  # Escreve o resultado no arquivo


O ator/atriz com o maior número de filmes é "Robert Downey, com 3947 filmes.


## Etapa 02 - Média da Receita Bruta de Bilheteria (Gross) ## 

In [2]:
# Abrindo e lendo o arquivo actors.csv
with open('actors.csv', 'r', encoding='utf-8') as file:
    lines = file.readlines()

# Processando o cabeçalho e identificando o índice da coluna "Gross"
header = lines[0].strip().split(',')
gross_index = header.index('Gross')

# Variáveis para cálculo da média
total_gross = 0
count = 0

# Iterando sobre as linhas para somar o valor bruto e contar os atores
for row in lines[1:]:
    data = row.strip().split(',')
    try:
        total_gross += float(data[gross_index].strip())
        count += 1
    except ValueError:
        print(f"Valor inválido ignorado: {data[gross_index]}")

# Calculando a média
average_gross = total_gross / count if count > 0 else 0
result = f"Média da receita bruta (Gross) de todos os atores: {average_gross:.2f}"

# Exibindo o resultado
print(result)

# Criando e escrevendo o resultado em um arquivo de texto
with open('etapa_2.txt', 'w', encoding='utf-8') as output_file:
    output_file.write(result)  # Escreve o resultado no arquivo


Valor inválido ignorado: The Avengers
Média da receita bruta (Gross) de todos os atores: 424.72


## Etapa 03 - Ator/Atriz com Maior Média de Receita por Filme ##

In [3]:
# Abrindo e lendo o arquivo actors.csv
with open('actors.csv', 'r', encoding='utf-8') as file:
    lines = file.readlines()

# Processando o cabeçalho e identificando o índice da coluna "Average per Movie"
header = lines[0].strip().split(',')
average_index = header.index('Average per Movie')

# Variáveis para armazenar o ator com a maior média
max_average = 0
top_actor = ""

# Iterando para encontrar o maior valor
for row in lines[1:]:
    data = row.strip().split(',')
    try:
        average = float(data[average_index].strip())
        if average > max_average:
            max_average = average
            top_actor = data[header.index('Actor')]
    except ValueError:
        print(f"Valor inválido ignorado: {data[average_index]}")

# Resultado a ser salvo e exibido
result = f'O ator/atriz com a maior média de receita por filme é {top_actor}, com média de {max_average:.2f}.'

# Exibindo o resultado no console
print(result)

# Criando e escrevendo o resultado em um arquivo de texto
with open('etapa_3.txt', 'w', encoding='utf-8') as output_file:
    output_file.write(result)  # Escreve o resultado no arquivo


O ator/atriz com a maior média de receita por filme é Anthony Daniels, com média de 451.80.


## Etapa 04 - Contagem de Aparições dos Filmes na Coluna "#1 Movie" ##

In [4]:
from collections import Counter

# Abrindo e lendo o arquivo actors.csv
with open('actors.csv', 'r', encoding='utf-8') as file:
    lines = file.readlines()

# Processando o cabeçalho
header = lines[0].strip().split(',')
movie_index = header.index('#1 Movie')

# Contador para armazenar a frequência dos filmes
movie_counter = Counter()

# Contando as aparições de cada filme
for row in lines[1:]:
    data = row.strip().split(',')
    movie = data[movie_index].strip()
    movie_counter[movie] += 1

# Ordenando os filmes por frequência (decrescente) e por nome (crescente)
sorted_movies = sorted(movie_counter.items(), key=lambda x: (-x[1], x[0]))

# Resultado a ser salvo
result_lines = []
for i, (movie, count) in enumerate(sorted_movies, start=1):
    result_line = f"{i} - O filme '{movie}' aparece {count} vez(es) no dataset."
    print(result_line)  # Exibindo o resultado no console
    result_lines.append(result_line)  # Armazenando o resultado para o arquivo

# Criando e escrevendo o resultado em um arquivo de texto
with open('etapa_4.txt', 'w', encoding='utf-8') as output_file:
    output_file.write("\n".join(result_lines))  # Escreve todas as linhas no arquivo


1 - O filme 'The Avengers' aparece 5 vez(es) no dataset.
2 - O filme 'Catching Fire' aparece 4 vez(es) no dataset.
3 - O filme 'Harry Potter / Deathly Hallows (P2)' aparece 4 vez(es) no dataset.
4 - O filme 'Meet the Fockers' aparece 3 vez(es) no dataset.
5 - O filme 'Star Wars: The Force Awakens' aparece 3 vez(es) no dataset.
6 - O filme 'The Dark Knight' aparece 3 vez(es) no dataset.
7 - O filme 'Avengers: Age of Ultron' aparece 2 vez(es) no dataset.
8 - O filme 'Dead Man's Chest' aparece 2 vez(es) no dataset.
9 - O filme 'Night at the Museum' aparece 2 vez(es) no dataset.
10 - O filme 'Return of the King' aparece 2 vez(es) no dataset.
11 - O filme 'Shrek 2' aparece 2 vez(es) no dataset.
12 - O filme '74.50' aparece 1 vez(es) no dataset.
13 - O filme 'American Sniper' aparece 1 vez(es) no dataset.
14 - O filme 'Hotel Transylvania 2' aparece 1 vez(es) no dataset.
15 - O filme 'Independence Day' aparece 1 vez(es) no dataset.
16 - O filme 'Men in Black' aparece 1 vez(es) no dataset.
17 

## Etapa 05 - Listar os Atores e Suas Receitas Totais Brutas  ##

In [5]:
# Abrindo e lendo o arquivo actors.csv
with open('actors.csv', 'r', encoding='utf-8') as file:
    lines = file.readlines()

# Processando o cabeçalho
header = lines[0].strip().split(',')
actor_index = header.index('Actor')
total_gross_index = header.index('Total Gross')

# Lista para armazenar os atores e suas receitas
actors_gross = []

# Iterando sobre as linhas para extrair os dados
for row in lines[1:]:
    data = row.strip().split(',')
    try:
        actor = data[actor_index].strip()
        total_gross = float(data[total_gross_index].strip())
        actors_gross.append((actor, total_gross))
    except ValueError:
        print(f"Valor inválido encontrado: {data}")

# Ordenando pela receita total em ordem decrescente
actors_gross.sort(key=lambda x: x[1], reverse=True)

# Resultado a ser salvo
result_lines = []
for actor, gross in actors_gross:
    result_line = f"{actor} - {gross:.2f}"
    print(result_line)  # Exibindo o resultado no console
    result_lines.append(result_line)  # Armazenando o resultado para o arquivo

# Criando e escrevendo o resultado em um arquivo de texto
with open('etapa_5.txt', 'w', encoding='utf-8') as output_file:
    output_file.write("\n".join(result_lines))  # Escreve todas as linhas no arquivo


Valor inválido encontrado: ['"Robert Downey', ' Jr."', '3947.30 ', '53', '74.50 ', 'The Avengers', '623.40']
Harrison Ford - 4871.70
Samuel L. Jackson - 4772.80
Morgan Freeman - 4468.30
Tom Hanks - 4340.80
Eddie Murphy - 3810.40
Tom Cruise - 3587.20
Johnny Depp - 3368.60
Michael Caine - 3351.50
Scarlett Johansson - 3341.20
Gary Oldman - 3294.00
Robin Williams - 3279.30
Bruce Willis - 3189.40
Stellan Skarsgard - 3175.00
Anthony Daniels - 3162.90
Ian McKellen - 3150.40
Will Smith - 3149.10
Stanley Tucci - 3123.90
Matt Damon - 3107.30
Robert DeNiro - 3081.30
Cameron Diaz - 3031.70
Liam Neeson - 2942.70
Andy Serkis - 2890.60
Don Cheadle - 2885.40
Ben Stiller - 2827.00
Helena Bonham Carter - 2822.00
Orlando Bloom - 2815.80
Woody Harrelson - 2815.80
Cate Blanchett - 2802.60
Julia Roberts - 2735.30
Elizabeth Banks - 2726.30
Ralph Fiennes - 2715.30
Emma Watson - 2681.90
Tommy Lee Jones - 2681.30
Brad Pitt - 2680.90
Adam Sandler - 2661.00
Daniel Radcliffe - 2634.40
Jonah Hill - 2605.10
Owen Wil