In [2]:
#setando o nome do arquivo de entrada
arquivo_entrada = "disney_plus_shows.csv"
arquivo_saida = "relatorio-disney_teste.txt"

#criando classe filme e classe series
class DadosGerais:
    def __init__(self):
        self._dados = [] 

    #salvar os dados
    def salvar_dados(self, dados):
        atributos = [
            "_imdb_id", "_title", "_plot", "_type", "_rated", "_year",
            "_released_at", "_added_at", "_runtime", "_genre", "_director",
            "_writer", "_actors", "_language", "_country", "_awards",
            "_metascore", "_imdb_rating", "_imdb_vote"
        ]
        
        novo_item = {}
        for nome_attr, valor in zip(atributos, dados[:len(atributos)]):
            if isinstance(valor, str) and valor.upper() == "N/A":
                valor = None
            setattr(self, nome_attr, valor)
            novo_item[nome_attr[1:]] = valor  # remove o underscore ao salvar

         # adiciona o item √† lista interna
        self._dados.append(novo_item)
    
    #retornar todos os dados 
    def listar_dados(self):
        return self._dados
    
class Filmes(DadosGerais):
    pass

class Series(DadosGerais):
    pass

#M√©todos auxiliares

#A m√©dia da nota de todos os filmes no IMDB.****
def media_imdb_filmes(lista_objetos):
    soma = 0.0
    contador = 0

    for obj in lista_objetos:

        tipo = getattr(obj, "_type", None)
        
        if tipo == "movie":
           nota_str = getattr(obj, "_imdb_rating", "")

           try:
               if nota_str:
                   nota = float(nota_str)
                   soma += nota
                   contador += 1
           except ValueError:
               # ignora valores n√£o num√©ricos
               continue
   
    if contador == 0:
        return 0.0

    return soma / contador

#A m√©dia da nota de todos os filmes no Metascore****
def media_metascore_filmes(lista_objetos):
    soma = 0.0
    contador = 0

    for obj in lista_objetos:

        tipo = getattr(obj, "_type", None)
        
        if tipo == "movie":
           nota_str = getattr(obj, "_metascore", "")

           try:
               if nota_str:
                   nota = float(nota_str)
                   soma += nota
                   contador += 1
           except ValueError:
               # ignora valores n√£o num√©ricos
               continue
   
    if contador == 0:
        return 0.0

    return soma / contador

#A m√©dia do n√∫mero de votos de todos os filmes no IMDB****
def media_numero_votos_filmes(lista_objetos):
    soma = 0.0
    contador = 0

    for obj in lista_objetos:

        tipo = getattr(obj, "_type", None)
        
        if tipo == "movie":
           votos = getattr(obj, "_imdb_vote", "")

           try:
               if votos:
                   nota = float(votos)
                   soma += nota
                   contador += 1
           except ValueError:
               # ignora valores n√£o num√©ricos
               continue
   
    if contador == 0:
        return 0.0

    return soma / contador

#As 3 l√≠nguas mais usadas e as 3 l√≠nguas menos usadas no dataset****
def ranking_idiomas(lista_objetos):
    contagem_idiomas = {}

    for obj in lista_objetos:
        tipo = getattr(obj, "_type", None)
        
        if tipo == "movie":
            idioma = getattr(obj, "_language", "") or ""

            if idioma.strip(): #verificando se a string possui valor preenchido, para ignorar algum espa√ßo em branco
                lista_idioma = idioma.split(",") #separando o filme que possuir mais de um idioma
                
                for item in lista_idioma:
                    if item in contagem_idiomas:
                        contagem_idiomas[item] += 1
                    else:
                        contagem_idiomas[item] = 1
    
    #converter o dictionary em lista dict
    lista_idiomas = [{"Idioma": i, "quantidade": q} for i, q in contagem_idiomas.items()]

    # ordena a lista por quantidade (decrescente)
    lista_ordenada = sorted(lista_idiomas, key=lambda x: x["quantidade"], reverse=True)

    # top 3 mais usados
    top_3_mais = lista_ordenada[:3]

    # top 3 menos usados
    top_3_menos = lista_ordenada[-3:]
    
    return top_3_mais, top_3_menos
             
#Os 3 atores que mais aparecem e os 3 atores que menos aparecem no dataset.
def ranking_atores(lista_objetos):
    contagem_atores = {}

    for obj in lista_objetos:
        tipo = getattr(obj, "_type", None)
        
        if tipo == "movie":
            atores = getattr(obj, "_actors", "") or ""

            if atores.strip(): #verificando se a string possui valor preenchido, para ignorar algum espa√ßo em branco
                lista_atores = atores.split(",") #separando o filme que possuir mais de um idioma
                
                for item in lista_atores:
                    if item in contagem_atores:
                        contagem_atores[item] += 1
                    else:
                        contagem_atores[item] = 1
    
    #converter o dictionary em lista dict
    lista = [{"Ator": i, "quantidade": q} for i, q in contagem_atores.items()]

    # ordena a lista por quantidade (decrescente)
    lista_ordenada = sorted(lista, key=lambda x: x["quantidade"], reverse=True)

    # top 3 mais atores
    top_3_mais = lista_ordenada[:3]

    # top 3 menos atores
    top_3_menos = lista_ordenada[-3:]
    
    return top_3_mais, top_3_menos

#O diretor com mais filmes no dataset.
def ranking_diretores(lista_objetos):
    contagem_diretor = {}

    for obj in lista_objetos:
        tipo = getattr(obj, "_type", None)
        
        if tipo == "movie":
            diretores = getattr(obj, "_director", "") or ""

            if diretores.strip(): #verificando se a string possui valor preenchido, para ignorar algum espa√ßo em branco
                lista_diretores = diretores.split(",") #separando o filme que possuir mais de um idioma
                
                for item in lista_diretores:
                    item = item.strip()
                    contagem_diretor[item] = contagem_diretor.get(item, 0) + 1
    
    # encontra o diretor com mais filmes
    diretor_mais = max(contagem_diretor.items(), key=lambda x: x[1])

    resultado = {
        "diretor": diretor_mais[0],
        "quantidade": diretor_mais[1]
    }

    return resultado

#O diretor com o filme mais popular no IMDB (considerando a maior nota IMDB).
def melhor_diretor_imdb(lista_objetos):
    melhor_diretor = {}

    for obj in lista_objetos:
        tipo = getattr(obj, "_type", None)
        
        if tipo == "movie":
            nota = getattr(obj, "_imdb_rating", "")
            diretores = getattr(obj, "_director", "") or ""

            try:
                if nota and diretores.strip():
                    rating = float(nota)
                    if not melhor_diretor or rating > melhor_diretor["Nota"]:
                        melhor_diretor = {"Diretor": diretores, "Nota": rating}
            except ValueError:
               # ignora valores n√£o num√©ricos
               continue

    return melhor_diretor
   
#O diretor com o filme mais popular no Metascore (considerando a maior nota Metascore).
def melhor_diretor_metascore(lista_objetos):
    melhor_diretor = {}

    for obj in lista_objetos:
        tipo = getattr(obj, "_type", None)
        
        if tipo == "movie":
            nota = getattr(obj, "_metascore", "")
            diretores = getattr(obj, "_director", "") or ""

            try:
                if nota and diretores.strip():
                    rating = float(nota)
                    if not melhor_diretor or rating > melhor_diretor["Nota"]:
                        melhor_diretor = {"Diretor": diretores, "Nota": rating}
            except ValueError:
               # ignora valores n√£o num√©ricos
               continue
            
    return melhor_diretor

#O ano em que mais filmes foram lan√ßados.
def ranking_lancamento_ano(lista_objetos):
    contagem_lancamento_filme = {}

    for obj in lista_objetos:
        tipo = getattr(obj, "_type", None)
        
        if tipo == "movie":
            anos = getattr(obj, "_year", "") or ""

            if anos.strip(): #verificando se a string possui valor preenchido, para ignorar algum espa√ßo em branco
                lista_ano = anos.split(",") #separando o filme que possuir mais de um idioma
                
                for item in lista_ano:
                    item = item.strip()
                    contagem_lancamento_filme[item] = contagem_lancamento_filme.get(item, 0) + 1
    
    # encontra o ano com mais lan√ßamentos
    ano_lancamento = max(contagem_lancamento_filme.items(), key=lambda x: x[1])

    resultado = {
        "ano": ano_lancamento[0],
        "quantidade": ano_lancamento[1]
    }

    return resultado

#A pior s√©rie segundo a nota IMDB e a pior s√©rie segundo a nota Metascore.
def ranking_serie_imdb_metascore(lista_objetos):
    contagem_serie_imdb = {}
    contagem_serie_meta = {}

    for obj in lista_objetos:
        tipo = getattr(obj, "_type", None)
        
        if tipo == "series":
            nota_imdb = getattr(obj, "_imdb_rating", "") or ""
            nota_metascore = getattr(obj, "_metascore", "") or ""
            titulo = getattr(obj, "_title", "") or ""
            
            #contagem IMDB
            try:
                if nota_imdb:
                    rating = float(nota_imdb)
                    contagem_serie_imdb[titulo] = rating
            except ValueError:
               # ignora valores n√£o num√©ricos
              continue
            
            #contagem metascore
            try:
                if nota_metascore:
                    rating = float(nota_metascore)
                    contagem_serie_meta[titulo] = rating
            except ValueError:
               # ignora valores n√£o num√©ricos
              continue
    
    # Tratamento para evitar erro se estiver vazio
    resultado_imdb = {"serie": None, "nota": 0.0}
    resultado_meta = {"serie": None, "nota": 0.0}   

    # encontra a pior s√©rie segundo o imdb
    if contagem_serie_imdb:
        pior_serie_imdb = min(contagem_serie_imdb.items(), key=lambda x: x[1])

        resultado_imdb = {
            "serie": pior_serie_imdb[0],
            "nota": pior_serie_imdb[1]
        }

    # encontra a pior s√©rie segundo o metascore
    if contagem_serie_meta:
        pior_serie_meta = min(contagem_serie_meta.items(), key=lambda x: x[1])

        resultado_meta = {
            "serie": pior_serie_meta[0],
            "nota": pior_serie_meta[1]
        }
    
    return resultado_imdb, resultado_meta

#Uma lista de filmes que possuem mais de um lan√ßamento (considerados "remakes" ou diferentes vers√µes no dataset, identificados por t√≠tulos iguais mas anos de lan√ßamento diferentes).
def lista_de_remakes(lista_objetos):
    filmes = {}
   
    for obj in lista_objetos:
        tipo = getattr(obj, "_type", None)
        
        if tipo == "movie":
            titulo = getattr(obj, "_title", "") or ""
            ano = getattr(obj, "_year", "") or ""

            # ignora se n√£o houver t√≠tulo ou ano
            if not titulo or not ano:
                continue

            # agrupa por t√≠tulo
            if titulo not in filmes:
                filmes[titulo] = []

            filmes[titulo].append(ano)

    remakes = []
    for titulo, anos in filmes.items():
        anos_unicos = sorted(set(anos))
        if len(anos_unicos) > 1:
            remakes.append({
                "Titulo": titulo,
                "Anos": anos_unicos
            })

    # Ordena alfabeticamente pelo t√≠tulo
    remakes.sort(key=lambda x: x["Titulo"].lower())

    return remakes

#M√©todos Principais

#definindo fun√ß√£o para leitura do arquivo
def abrir_filmes_disney():
    global arquivo_entrada
    lista_objetos = [] # lista que ser√° adicionado os objetos de filme e series
    try:
        # Tenta abrir o arquivo de entrada
        with open(arquivo_entrada, 'r', encoding='utf-8') as arquivo:
            linhas = arquivo.readlines()  # ‚úÖ transforma em lista

            for linha in linhas[1:]: #ignorando o cabe√ßalho
                linha = linha.strip()

                if not linha:
                    continue  # ignora linhas vazias
                
                campos = []
                campo_atual = ''
                dentro_aspas = False

                for char in linha:
                    if char == '"':
                        dentro_aspas = not dentro_aspas  # alterna entre dentro e fora das aspas
                    elif char == ',' and not dentro_aspas:
                        campos.append(campo_atual.strip().strip('"'))
                        campo_atual = ''
                    else:
                        campo_atual += char

                # adiciona o √∫ltimo campo
                campos.append(campo_atual.strip().strip('"'))
                
                tipo = campos[3].lower() if len(campos) > 3 else "" #pegando terceira coluna da linha 

                #criando novo objeto de acordo com o tipo
                if tipo == "movie":
                    obj = Filmes()   
                elif tipo == "series":
                    obj = Series()
                else:
                    continue

                obj.salvar_dados(campos) #salvando os campos no objeto
                lista_objetos.append(obj)  # adiciona o novo objeto a lista
             
    except FileNotFoundError:
        print(f"‚ùå Arquivo n√£o encontrado.")
    except Exception as e:
        print(f"‚ö†Ô∏è Erro inesperado: {e}")

    return lista_objetos


def gerar_relatorio(lista_objetos):
    relatorio = []

    relatorio.append("=============================================\n")
    relatorio.append("        üé¨ RELAT√ìRIO DE FILMES E S√âRIES       \n")
    relatorio.append("=============================================\n\n")

    # Se√ß√£o 1 ‚Äî Estat√≠sticas Gerais
    relatorio.append("üìä ESTAT√çSTICAS GERAIS\n")
    relatorio.append("---------------------------------------------\n")

    valor_media_imdb = media_imdb_filmes(lista_objetos)
    valor_media_metascore = media_metascore_filmes(lista_objetos)
    media_numero_votos = media_numero_votos_filmes(lista_objetos)

    relatorio.append(f"M√©dia de nota (IMDB): {valor_media_imdb:.2f}\n")
    relatorio.append(f"M√©dia de nota (Metascore): {valor_media_metascore:.2f}\n")
    relatorio.append(f"M√©dia de n√∫mero de votos: {media_numero_votos:.0f}\n\n")

    # Se√ß√£o 2 ‚Äî Idiomas
    relatorio.append("üåé IDIOMAS MAIS E MENOS USADOS\n")
    relatorio.append("---------------------------------------------\n")
    top_idiomas, menos_idiomas = ranking_idiomas(lista_objetos)
    relatorio.append("Mais usados:\n")
    for idioma in top_idiomas:
        relatorio.append(f"  - {idioma['Idioma']}: {idioma['quantidade']} filmes\n")
    relatorio.append("Menos usados:\n")
    for idioma in menos_idiomas:
        relatorio.append(f"  - {idioma['Idioma']}: {idioma['quantidade']} filmes\n")
    relatorio.append("\n")

    # Se√ß√£o 3 ‚Äî Atores e Diretores
    relatorio.append("üé≠ ATORES E DIRETORES\n")
    relatorio.append("---------------------------------------------\n")

    top_atores, pior_atores = ranking_atores(lista_objetos)
    relatorio.append("Ator/Atriz mais frequente:\n")
    for ator in top_atores:
        relatorio.append(f"  - {ator['Ator']}: {ator['quantidade']} apari√ß√µes\n")
    relatorio.append("\nAtor/Atriz menos frequente:\n")
    for ator in pior_atores:
        relatorio.append(f"  - {ator['Ator']}: {ator['quantidade']} apari√ß√µes\n")

    diretor_mais = ranking_diretores(lista_objetos)
    melhor_dir_imdb = melhor_diretor_imdb(lista_objetos)
    melhor_dir_metascore = melhor_diretor_metascore(lista_objetos)
        
    relatorio.append(f"\nDiretor com mais filmes: {diretor_mais['diretor']} ({diretor_mais['quantidade']} filmes)\n")
    relatorio.append(f"Melhor diretor (IMDB): {melhor_dir_imdb['Diretor']} (nota {melhor_dir_imdb['Nota']:.2f})\n")
    relatorio.append(f"Melhor diretor (Metascore): {melhor_dir_metascore['Diretor']} (nota {melhor_dir_metascore['Nota']:.2f})\n\n")

    # Se√ß√£o 4 ‚Äî Lan√ßamentos
    ranking_ano = ranking_lancamento_ano(lista_objetos)
    relatorio.append("üìÖ RANKING DE LAN√áAMENTOS POR ANO\n")
    relatorio.append("---------------------------------------------\n")
    relatorio.append(f"  {ranking_ano['ano']}: {ranking_ano['quantidade']} lan√ßamentos\n")
    relatorio.append("\n")

    # Se√ß√£o 5 ‚Äî S√©ries com melhor IMDB / Metascore
    relatorio.append("üì∫ MELHORES S√âRIES\n")
    relatorio.append("---------------------------------------------\n")
    serie_imdb, serie_meta = ranking_serie_imdb_metascore(lista_objetos)
    relatorio.append("Pior s√©rie no IMDB:\n")
    relatorio.append(f"  - {serie_imdb['serie']}: Nota {serie_imdb['nota']:.2f}\n")
    relatorio.append("Pior s√©rie no MetaScore:\n")
    relatorio.append(f"  - {serie_meta['serie']}: Nota {serie_meta['nota']}\n")
    relatorio.append("\n")

    # Se√ß√£o 6 ‚Äî Remakes
    relatorio.append("‚ôªÔ∏è FILMES COM MAIS DE UMA VERS√ÉO (REMAKES)\n")
    relatorio.append("---------------------------------------------\n")
    remakes = lista_de_remakes(lista_objetos)
    for remake in remakes:
        relatorio.append(f"  {remake['Titulo']} ‚Äî vers√µes em {', '.join(remake['Anos'])}\n")
    relatorio.append(f"\nTotal de remakes identificados: {len(remakes)}\n")

    relatorio.append("\n=============================================\n")
    
    # Salvar relat√≥rio no arquivo
    try:
        with open(arquivo_saida, "w", encoding="utf-8") as saida:
            saida.writelines(relatorio)
        print(f"üìÅ Relat√≥rio salvo em: {arquivo_saida}")
    except Exception as e:
        print(f"‚ö†Ô∏è Erro ao salvar o arquivo de sa√≠da: {e}")


#definindo m√©todo para gerar o rel√°torio
#def gerar_relatorio_old(lista_objetos):
#    relatorio = []

    # Obtendo os dados para montar o relat√≥rio
#    valor_media_imdb = media_imdb_filmes(lista_objetos)
#    valor_media_metascore = media_metascore_filmes(lista_objetos) 
#    media_numero_votos = media_numero_votos_filmes(lista_objetos) 
#    idiomas = ranking_idiomas(lista_objetos)
#    atores = ranking_atores(lista_objetos)
#    maior_diretor = ranking_diretores(lista_objetos)
#    top_diretor_imdb = melhor_diretor_imdb(lista_objetos)
#    top_diretor_metascore = melhor_diretor_metascore(lista_objetos)
#    ranking_ano = ranking_lancamento_ano(lista_objetos)
#    ranking_serie = ranking_serie_imdb_metascore(lista_objetos)
#    remakes = lista_de_remakes(lista_objetos)

    #montando estrutura do relat√≥rio
#    relatorio.append("******* Relat√≥rio Filmes e S√©ries *******\n")
#    relatorio.append(f"M√©dia nota dos Filmes no IMDB: {valor_media_imdb}\n")
#    relatorio.append(f"M√©dia nota dos Filmes no MetaScore: {valor_media_metascore}\n")
#    relatorio.append(f"M√©dia n√∫mero de votos: {media_numero_votos}\n")
    #relatorio.append(f"M√©dia nota dos Filmes no MetaScore: {valor_media_metascore}\n")

#    try:
#        with open(arquivo_saida, "w", encoding="utf-8") as saida:
#            saida.writelines(relatorio)
#        print(f"Processamento conclu√≠do. Resultado salvo em '{arquivo_saida}'.")
#    except Exception as e:
#        print(f"Erro ao salvar o arquivo de sa√≠da: {e}")

gerar_relatorio(abrir_filmes_disney())

üìÅ Relat√≥rio salvo em: relatorio-disney_teste.txt
