In [2]:
# Bibliotecas
import pandas as pd
from IPython.display import Image, display
caminho_parquet = "D:/GitHub/MiraiboGO/breed/breed.parquet"
caminho_csv = "D:/GitHub/MiraiboGO/album/miraibos.csv"

## Quantidade de Breeds não catalogados

In [17]:
def contar_nao_catalogado(caminho_parquet):
    # Lê o arquivo Parquet existente
    try:
        df = pd.read_parquet(caminho_parquet)
    except FileNotFoundError:
        print(f"O arquivo {caminho_parquet} não foi encontrado.")
        return
    
    # Filtra as linhas onde id_resultado ou nome_resultado são "não catalogado"
    resultados_nao_catalogado = df[(df['id_resultado'] == 'não catalogado') | (df['nome_resultado'] == 'não catalogado')]
    
    # Contagem de linhas e colunas
    num_linhas, num_colunas = resultados_nao_catalogado.shape
    
    print(f"Número de breeds não catalogados: {num_linhas}")

contar_nao_catalogado(caminho_parquet)

Número de breeds não catalogados: 11546


## Quantidade de Breeds catalogados

In [16]:
def contar_catalogado(caminho_parquet):
    # Lê o arquivo Parquet existente
    try:
        df = pd.read_parquet(caminho_parquet)
    except FileNotFoundError:
        print(f"O arquivo {caminho_parquet} não foi encontrado.")
        return
    
    # Filtra as linhas onde id_resultado ou nome_resultado são diferentes de "não catalogado"
    resultados_diferentes = df[(df['id_resultado'] != 'não catalogado') & (df['nome_resultado'] != 'não catalogado')]
    
    # Contagem de linhas e colunas
    num_linhas, num_colunas = resultados_diferentes.shape
    
    print(f"Número de breeds catalogados: {num_linhas}")

contar_catalogado(caminho_parquet)

Número de breeds catalogados: 118


## Todos os Breeds catalogados

In [None]:
def mostrar_resultados_filtrados(caminho_parquet):
    # Lê o arquivo Parquet existente
    try:
        df = pd.read_parquet(caminho_parquet)
    except FileNotFoundError:
        print(f"O arquivo {caminho_parquet} não foi encontrado.")
        return
    
    # Filtra as linhas onde id_resultado ou nome_resultado são diferentes de "não catalogado"
    resultados_filtrados = df[(df['id_resultado'] != 'não catalogado') | (df['nome_resultado'] != 'não catalogado')]

    # Ordena os resultados em ordem crescente pela coluna id_resultado
    resultados_filtrados = resultados_filtrados.sort_values(by='id_resultado')

    # Configura as opções de exibição para mostrar o DataFrame completo
    pd.set_option('display.max_rows', None)     # Exibir todas as linhas
    pd.set_option('display.max_columns', None)  # Exibir todas as colunas
    
    # Verifica se existem resultados filtrados
    if resultados_filtrados.empty:
        print("Não há resultados catalogados.")
    else:
        print("Resultados encontrados:")
        display(resultados_filtrados)

display(mostrar_resultados_filtrados(caminho_parquet))

## Pesquisar Breed por ID

In [4]:
def pesquisar_breed_por_id(caminho_arquivo, id_resultado):

    try:
        # Carregar o DataFrame a partir do arquivo Parquet
        df = pd.read_parquet(caminho_arquivo)

        # Filtrar as linhas onde a coluna 'breed' corresponde ao id_resultado
        resultado = df[df['id_resultado'] == id_resultado]

        if not resultado.empty:
            # Ordenar pelo 'id_resultado'
            resultado = resultado.sort_values(by='id_resultado', ascending=True)
            return resultado
        else:
            print(f"Nenhum breed encontrado para o ID: {id_resultado}")
            return pd.DataFrame()  # Retorna um DataFrame vazio se não encontrar resultados
    
    except Exception as e:
        print(f"Ocorreu um erro: {e}")
        return pd.DataFrame()  # Retorna um DataFrame vazio em caso de erro

pesquisar_breed_por_id(caminho_parquet, '54')

Unnamed: 0,id_1,nome_1,id_2,nome_2,id_resultado,nome_resultado
2023,19,Caracol,82,Golem,54,Lobofulgor
5995,54,Lobofulgor,54,Lobofulgor,54,Lobofulgor
8204,78,Safira,106B,Safira,54,Lobofulgor
8550,82,Golem,19,Caracol,54,Lobofulgor
11307,106B,Safira,78,Safira,54,Lobofulgor


## Pesquisar Breed por Nome

In [None]:
def pesquisar_breed_por_nome(caminho_arquivo, nome_resultado):

    try:
        # Carregar o DataFrame a partir do arquivo Parquet
        df = pd.read_parquet(caminho_arquivo)

        # Filtrar as linhas onde a coluna 'breed' corresponde ao id_resultado
        resultado = df[df['nome_resultado'] == nome_resultado]

        if not resultado.empty:
            # Ordenar pelo 'id_resultado'
            resultado = resultado.sort_values(by='id_resultado', ascending=True)
            return resultado
        else:
            print(f"Nenhum breed encontrado para o ID: {nome_resultado}")
            return pd.DataFrame()  # Retorna um DataFrame vazio se não encontrar resultados
    
    except Exception as e:
        print(f"Ocorreu um erro: {e}")
        return pd.DataFrame()  # Retorna um DataFrame vazio em caso de erro

pesquisar_breed_por_nome(caminho_parquet, 'Lobofulgor')

## Adicionar Breed por ID

In [None]:
def pesquisar_e_reescrever_por_id(caminho_parquet, caminho_csv):

    try:
        # Carregar o DataFrame a partir do arquivo Parquet
        df_parquet = pd.read_parquet(caminho_parquet)

        # Solicitar o id_1 e id_2
        id_1 = input("Digite o id_1: ")
        id_2 = input("Digite o id_2: ")

        # Filtrar as linhas onde id_1 e id_2 correspondem ou estão invertidos
        resultado = df_parquet[((df_parquet['id_1'] == id_1) & (df_parquet['id_2'] == id_2)) | 
                                ((df_parquet['id_1'] == id_2) & (df_parquet['id_2'] == id_1))]

        if not resultado.empty:
            # Exibir todos os resultados encontrados
            print("Resultados encontrados:")
            print(resultado)  # Mostra todas as colunas da linha

            # Solicitar id_resultado para pesquisa no CSV
            id_resultado = input("Digite o id_resultado para buscar o nome: ")

            # Carregar o DataFrame a partir do arquivo CSV
            df_csv = pd.read_csv(caminho_csv)

            # Pesquisar o nome correspondente ao id_resultado no CSV
            personagem = df_csv[df_csv['id'] == id_resultado]

            if not personagem.empty:
                # Atribuir o nome encontrado ao nome_resultado
                nome_personagem = personagem['nome'].values[0]
                print(f"Nome correspondente encontrado: {nome_personagem}")
                nome_resultado = nome_personagem
            else:
                print(f"Nenhum personagem encontrado com o id_resultado: {id_resultado}")
                return  # Retorna sem fazer alterações se o personagem não for encontrado

            # Perguntar se deseja reescrever
            reescrever = input("Deseja reescrever os valores? (s/n): ").strip().lower()
            if reescrever == 's':
                novo_id_resultado = id_resultado
                
                # Atualizar os valores no DataFrame em ambas as linhas
                df_parquet.loc[((df_parquet['id_1'] == id_1) & (df_parquet['id_2'] == id_2)) | 
                                ((df_parquet['id_1'] == id_2) & (df_parquet['id_2'] == id_1)), 
                                ['id_resultado', 'nome_resultado']] = [novo_id_resultado, nome_resultado]

                # Salvar o DataFrame de volta no arquivo Parquet
                df_parquet.to_parquet(caminho_parquet)

                print("Valores atualizados com sucesso.")
            else:
                print("Nenhuma alteração foi feita.")
        else:
            print("Nenhum resultado encontrado para os IDs fornecidos.")
    
    except Exception as e:
        print(f"Ocorreu um erro: {e}")

pesquisar_e_reescrever_por_id(caminho_parquet, caminho_csv)

## Adicionar Breed por Nome

In [None]:
def buscar_personagem_por_nome(caminho_csv, nome):

    # Carregar o DataFrame a partir do arquivo CSV
    df_csv = pd.read_csv(caminho_csv)

    # Filtrar personagens pelo nome
    personagens = df_csv[df_csv['nome'].str.lower() == nome.lower()]

    if len(personagens) == 0:
        print(f"Nenhum personagem encontrado com o nome: {nome}")
        return None
    elif len(personagens) == 1:
        # Se há apenas um personagem, retorna a ID
        return personagens['id'].values[0]
    else:
        # Se há duplicatas, solicita ao usuário escolher uma
        print(f"Múltiplos personagens encontrados com o nome: {nome}")
        for i, row in personagens.iterrows():
            print(f"{i + 1}: ID: {row['id']}, Nome: {row['nome']}")
        
        escolha = int(input("Escolha a opção (1 ou 2): ")) - 1
        if escolha < 0 or escolha >= len(personagens):
            print("Opção inválida.")
            return None
        return personagens['id'].values[escolha]


def adicionar_por_nome(caminho_parquet, caminho_csv):

    try:
        # Carregar o DataFrame a partir do arquivo Parquet
        df_parquet = pd.read_parquet(caminho_parquet)

        # Solicitar nome_1 e nome_2
        nome_1 = input("Digite o nome_1: ")
        nome_2 = input("Digite o nome_2: ")

        # Buscar IDs correspondentes a nome_1 e nome_2
        id_1 = buscar_personagem_por_nome(caminho_csv, nome_1)
        id_2 = buscar_personagem_por_nome(caminho_csv, nome_2)

        # Verificar se ambos os IDs foram encontrados
        if id_1 is None or id_2 is None:
            print("IDs não encontrados. A operação será cancelada.")
            return

        # Pesquisar as linhas no arquivo Parquet usando os IDs
        resultado = df_parquet[((df_parquet['id_1'] == id_1) & (df_parquet['id_2'] == id_2)) | 
                                ((df_parquet['id_1'] == id_2) & (df_parquet['id_2'] == id_1))]

        if not resultado.empty:
            # Exibir todos os resultados encontrados
            print("Resultados encontrados:")
            print(resultado)  # Mostra todas as colunas da linha

            # Perguntar se deseja reescrever
            reescrever = input("Deseja reescrever os valores? (s/n): ").strip().lower()
            if reescrever == 's':
                # Solicitar o novo nome_resultado
                novo_nome_resultado = input("Digite o novo nome_resultado: ")
                
                # Pesquisar o ID correspondente ao novo nome_resultado
                id_personagem_resultado = buscar_personagem_por_nome(caminho_csv, novo_nome_resultado)
                
                if id_personagem_resultado is not None:
                    # Atualizar os valores no DataFrame em ambas as linhas
                    df_parquet.loc[((df_parquet['id_1'] == id_1) & (df_parquet['id_2'] == id_2)) | 
                                    ((df_parquet['id_1'] == id_2) & (df_parquet['id_2'] == id_1)), 
                                    ['id_resultado', 'nome_resultado']] = id_personagem_resultado, novo_nome_resultado
                    
                    # Salvar o DataFrame de volta no arquivo Parquet
                    df_parquet.to_parquet(caminho_parquet)

                    print("Valores atualizados com sucesso.")
                else:
                    print("Nenhum personagem encontrado com o novo nome_resultado.")
            else:
                print("Nenhuma alteração foi feita.")
        else:
            print("Nenhum resultado encontrado para os nomes fornecidos.")
    
    except Exception as e:
        print(f"Ocorreu um erro: {e}")


adicionar_por_nome(caminho_parquet, caminho_csv)