# Q1. Programar em Python com arquivos, sets e dicionários

### 1. Crie uma base de dados em formato de arquivo .csv, entitulada base.csv, que contenha os campos placa, marca, modelo, ano, cor e classificação, podendo ser novo, semi-novo e usado.

In [80]:
import pandas as pd
import json
import os

# base de dados de carros
dados = {
    'placa': ['UIA1234', 'FEF7678', 'GQW9101', 'JKL1213', 'BNO1415', 'ASR1617', 'STU1819', 'VCX2021', 'YIY2223', 'KPD2425'],
    'marca': ['Ford', 'Chevrolet', 'Toyota', 'Honda', 'BMW', 'Audi', 'Mercedes', 'Fiat', 'Volkswagen', 'Renault'],
    'modelo': ['Fiesta', 'Cruze', 'Corolla', 'Civic', 'X1', 'A3', 'C-Class', 'Palio', 'Golf', 'Duster'],
    'ano': [2018, 2019, 2020, 2017, 2021, 2020, 2018, 2019, 2021, 2020],
    'cor': ['Prata', 'Preto', 'Branco', 'Vermelho', 'Azul', 'Cinza', 'Verde', 'Amarelo', 'Marrom', 'Roxo'],
    'classificacao': ['usado', 'semi-novo', 'novo', 'usado', 'novo', 'semi-novo', 'usado', 'novo', 'semi-novo', 'usado']
}

# criação do dataframe a partir do dicionário dados, especificando a ordem das colunas.
df = pd.DataFrame(dados, columns=['placa', 'marca', 'modelo', 'ano', 'cor', 'classificacao'])

df.to_csv('base.csv', index=False) # salvando o dataframe em um arquivo csv

### 2. Crie uma função que receba como parâmetro o nome/caminho do arquivo e retorne um dataframe pandas.

In [81]:
def carregar_csv(arquivo):
    '''
    Carrega um arquivo csv e retorna um dataframe.

    argumento: o caminho do arquivo csv a ser carregado.

    retorno: dataframe contendo os dados do arquivo CSV.
    '''
    return pd.read_csv(arquivo)

### 3. Crie uma função que faça a busca por placa, recebendo como parâmetros de entrada o dataframe com o banco de dados e a placa do carro, e retorne um objeto do tipo .json com a seguinte estrutura:

In [82]:
def buscar_placa(df, placa):
    '''
    Busca um carro pelo número da placa e retorna os dados em JSON.

    argumentos:
    df: dataframe contendo os dados dos carros.
    placa: número da placa do carro a ser buscado.

    returno: JSON com os dados do carro.
    '''
    carro = df[df['placa'] == placa] # filtra o dataframe pra encontrar a linha onde a placa corresponde a placa fornecida

    # verifica se a busca encontrou algum resultado
    if carro.empty:
        return None

    # converte o resultado da busca para um dicionário com orientação de registros
    carro_json = carro.to_dict(orient='records')[0]
    return json.dumps(carro_json, indent=4) # converte o dicionário para uma string JSON formatada

df = carregar_csv('base.csv') # utilizando a função carregar_csv para carregar um arquivo CSV e exibir o dataframe resultante
print(buscar_placa(df, 'UIA1234'))

{
    "placa": "UIA1234",
    "marca": "Ford",
    "modelo": "Fiesta",
    "ano": 2018,
    "cor": "Prata",
    "classificacao": "usado"
}


### 4. Crie uma função que faça o salvamento dos dados de busca em um arquivo .json, recebendo como parâmetros de entrada um objeto .json chamado dado e o nome do arquivo a ser salvo.

In [83]:
def salvar_json(dado, arquivo):
    '''
    Salva os dados fornecidos em formato JSON em um arquivo especificado.

    argumentos:
    dado: uma string JSON que tem os dados a serem salvos.
    arquivo: o caminho do arquivo onde os dados serão salvos.
    '''
    with open(arquivo, 'w', encoding='utf-8') as f:
        json.dump(json.loads(dado), f, ensure_ascii=False, indent=4)

json_dado = buscar_placa(df, 'FEF7678')

salvar_json(json_dado, 'resultado_busca.json') # salvando os dados da busca em JSON

# Q2. Consumir dados em diferentes formatos utilizando a biblioteca Pandas

### 1. Crie uma função que receba como parâmetros de entrada um objeto .json com a mesma estrutura apresentada na questão 1C e o dataframe do banco de dados e faça a inclusão desse registro na base de dados. O retorno da função deve ser o dataframe atualizado com o novo registro.

In [84]:
from IPython.display import display

def incluir_registro_json(json_dado, df):
    '''
    Inclui um novo registro em JSON no dataframe existente.

    argumentos:
    json_dado: uma string JSON que tem os dados do novo registro.
    df: o dataframe existente onde o novo registro será incluído.

    retorno: o dataframe atualizado com o novo registro incluído.
    '''
    dado = json.loads(json_dado) # carrega os dados JSON em um dicionário
    novo_df = pd.DataFrame([dado]) # cria um novo dataframe a partir do dicionário
    df_atualizado = pd.concat([df, novo_df], ignore_index=True) # concatena o novo dataframe com o dataframe existente
    return df_atualizado

# cria um novo registro de carro em JSON
novo_carro = json.dumps({
    'placa': 'DEF4G90',
    'marca': 'Mercedes',
    'modelo': 'GLB',
    'ano': 2024,
    'cor': 'Azul',
    'classificacao': 'novo'
})
df_atualizado = incluir_registro_json(novo_carro, df) # utiliza a função incluir_registro_json para incluir o novo registro no dataframe existente
display(df_atualizado)

Unnamed: 0,placa,marca,modelo,ano,cor,classificacao
0,UIA1234,Ford,Fiesta,2018,Prata,usado
1,FEF7678,Chevrolet,Cruze,2019,Preto,semi-novo
2,GQW9101,Toyota,Corolla,2020,Branco,novo
3,JKL1213,Honda,Civic,2017,Vermelho,usado
4,BNO1415,BMW,X1,2021,Azul,novo
5,ASR1617,Audi,A3,2020,Cinza,semi-novo
6,STU1819,Mercedes,C-Class,2018,Verde,usado
7,VCX2021,Fiat,Palio,2019,Amarelo,novo
8,YIY2223,Volkswagen,Golf,2021,Marrom,semi-novo
9,KPD2425,Renault,Duster,2020,Roxo,usado


### 2. Crie uma função que receba como parâmetros de entrada o caminho/nome de um arquivo .csv e o dataframe do banco de dados e faça a inclusão desse registro na base de dados. O retorno da função deve ser o dataframe atualizado com o novo registro e a estrutura do arquivo de entrada deve ser a mesma apresentada na questão 1A.

In [85]:
def incluir_registro_csv(arquivo, df):
    '''
    Inclui registros de um arquivo csv no dataframe existente.

    argumentos:
    arquivo: o caminho do arquivo csv contendo os novos registros.
    df: o dataframe existente onde os novos registros serão incluídos.

    retorno:
    dataframe: o dataframe atualizado com os novos registros incluídos.
    '''
    novo_df = pd.read_csv(arquivo) # carrega os novos registros do arquivo csv
    df_atualizado = pd.concat([df, novo_df], ignore_index=True) # concatena o dataframe existente com o novo dataframe
    return df_atualizado

# dados do novo registro a ser incluído
dados_novo_registro = {
    'placa': ['DEF4G90'],
    'marca': ['Mercedes'],
    'modelo': ['GLB'],
    'ano': [2024],
    'cor': ['Azul'],
    'classificacao': ['novo']
}

# cria um dataframe com os novos dados e salva em um arquivo csv
novo_registro_df = pd.DataFrame(dados_novo_registro)
novo_registro_df.to_csv('novo_registro.csv', index=False)

df_atualizado = incluir_registro_csv('novo_registro.csv', df) # inclui os novos registros do arquivo csv no dataframe existente
display(df_atualizado)

Unnamed: 0,placa,marca,modelo,ano,cor,classificacao
0,UIA1234,Ford,Fiesta,2018,Prata,usado
1,FEF7678,Chevrolet,Cruze,2019,Preto,semi-novo
2,GQW9101,Toyota,Corolla,2020,Branco,novo
3,JKL1213,Honda,Civic,2017,Vermelho,usado
4,BNO1415,BMW,X1,2021,Azul,novo
5,ASR1617,Audi,A3,2020,Cinza,semi-novo
6,STU1819,Mercedes,C-Class,2018,Verde,usado
7,VCX2021,Fiat,Palio,2019,Amarelo,novo
8,YIY2223,Volkswagen,Golf,2021,Marrom,semi-novo
9,KPD2425,Renault,Duster,2020,Roxo,usado


### 3. Crie uma função que receba como parâmetros de entrada o caminho/nome de um arquivo .xls e o dataframe do banco de dados e faça a inclusão desse registro na base de dados. O retorno da função deve ser o dataframe atualizado com o novo registro e a estrutura do arquivo de entrada deve ser a mesma apresentada na questão 1A.

In [86]:
def incluir_registro_xls(arquivo, df):
    '''
    Inclui registros de um arquivo excel no dataframe existente.

    argumentos:
    arquivo: o caminho do arquivo excel contendo os novos registros.
    df: o dataframe existente onde os novos registros serão incluídos.

    retorno: o dataframe atualizado com os novos registros incluídos.
    '''
    novo_df = pd.read_excel(arquivo) # carrega os novos registros do excel
    df_atualizado = pd.concat([df, novo_df], ignore_index=True) # concatena o dataframe existente com o novo dataframe
    return df_atualizado

# dados do novo registro a ser incluído
dados_novo_registro = {
    'placa': ['DEF4G90'],
    'marca': ['Mercedes'],
    'modelo': ['GLB'],
    'ano': [2024],
    'cor': ['Azul'],
    'classificacao': ['novo']
}

# cria um dataframe com os novos dados e salva em xlsx
novo_registro_df = pd.DataFrame(dados_novo_registro)
novo_registro_df.to_excel('novo_registro.xlsx', index=False)

df_atualizado = incluir_registro_xls('novo_registro.xlsx', df) # inclui os novos registros do arquivo excel no dataframe existente
display(df_atualizado)

Unnamed: 0,placa,marca,modelo,ano,cor,classificacao
0,UIA1234,Ford,Fiesta,2018,Prata,usado
1,FEF7678,Chevrolet,Cruze,2019,Preto,semi-novo
2,GQW9101,Toyota,Corolla,2020,Branco,novo
3,JKL1213,Honda,Civic,2017,Vermelho,usado
4,BNO1415,BMW,X1,2021,Azul,novo
5,ASR1617,Audi,A3,2020,Cinza,semi-novo
6,STU1819,Mercedes,C-Class,2018,Verde,usado
7,VCX2021,Fiat,Palio,2019,Amarelo,novo
8,YIY2223,Volkswagen,Golf,2021,Marrom,semi-novo
9,KPD2425,Renault,Duster,2020,Roxo,usado


### 4. Crie uma função que faça a busca por todos os carros de uma dada classificação e faça o salvamento em um arquivo do tipo .xls. A função deve receber como parâmetro de entrada o tipo de classificação, podendo ser novo, semi-novo ou usado.

In [87]:
def busca_classificacao(df, classificacao, arquivo):
    '''
    Busca carros por classificação no dataframe e salva o resultado em um arquivo excel.

    argumentos:
    df: o dataframe contendo os dados dos carros.
    classificacao: a classificação dos carros a ser buscada ('semi-novo', 'novo', 'usado').
    arquivo: o caminho do arquivo excel onde os resultados serão salvos.
    '''
    carros_classificacao = df[df['classificacao'] == classificacao] # filtra os carros com a classificação especificada
    carros_classificacao.to_excel(arquivo, index=False) # salva o dataframe resultante em um excel

# busca carros classificados como 'novo' e salva o resultado em .xlsx
busca_classificacao(df_atualizado, 'novo', 'carros_novos.xlsx')

# Q3. Manipular dados tabulares provenientes de planilhas e banco de dados utilizando a biblioteca Pandas

### 1. Modifique a função desenvolvida na questão 1B de forma que ela detecte o tipo de arquivo que foi informado e faça o carregamento dos dados em um dataframepandas

In [88]:
def carregar_dados(arquivo):
    '''
    Carrega dados de um arquivo csv ou xlsx e retorna um dataframe.

    argumento: o caminho do arquivo a ser carregado. Pode ser um arquivo csv ou excel.

    retorno: um dataframe contendo os dados do arquivo carregado.
    '''
    _, ext = os.path.splitext(arquivo) # obtém a extensão do arquivo
    # carrega o arquivo conforme a extensão
    if ext == '.csv':
        return pd.read_csv(arquivo)
    elif ext in ['.xls', '.xlsx']:
        return pd.read_excel(arquivo)
    else:
        raise ValueError('Formato de arquivo não suportado')

display(carregar_dados('base.csv'))

Unnamed: 0,placa,marca,modelo,ano,cor,classificacao
0,UIA1234,Ford,Fiesta,2018,Prata,usado
1,FEF7678,Chevrolet,Cruze,2019,Preto,semi-novo
2,GQW9101,Toyota,Corolla,2020,Branco,novo
3,JKL1213,Honda,Civic,2017,Vermelho,usado
4,BNO1415,BMW,X1,2021,Azul,novo
5,ASR1617,Audi,A3,2020,Cinza,semi-novo
6,STU1819,Mercedes,C-Class,2018,Verde,usado
7,VCX2021,Fiat,Palio,2019,Amarelo,novo
8,YIY2223,Volkswagen,Golf,2021,Marrom,semi-novo
9,KPD2425,Renault,Duster,2020,Roxo,usado


### 2. Modifique a função criada na questão 1B de forma que ela crie uma base SQL, utilizando a biblioteca sqlite3, que armazene a base de dados a partir de um arquivo .csv como o proposto na questão 1A. O retorno da função deve ser um banco de dados SQL.

In [89]:
import sqlite3

def csv_sql(arquivo_csv, bd):
    '''
    Converte dados de um arquivo csv para uma tabela em um banco de dados SQLite.

    argumentos:
    arquivo_csv: o caminho do arquivo csv a ser carregado.
    bd: o caminho do banco de dados SQLite onde os dados serão armazenados.

    retorno: um dataframe contendo os dados do csv.
    '''
    df = pd.read_csv(arquivo_csv) # carrega os dados do csv em um dataframe
    conn = sqlite3.connect(bd) # conecta ao banco de dados
    df.to_sql('carros', conn, if_exists='replace', index=False) # escreve os dados do dataframe na tabela carros do banco de dados
    conn.close()
    return df

# converte dados do csv 'base.csv' para o banco de dados SQLite 'carros.db'
df_sql = csv_sql('base.csv', 'carros.db')

### 3. Crie uma função que receba um banco de dados SQL, gere e retorne um dataframe pandas, utilizando a biblioteca sqlalchemy.

In [90]:
from sqlalchemy import create_engine

def sql_dataframe(bd):
    '''
    Carrega dados da tabela carros de um banco de dados SQLite para um dataframe.

    argumentos:
    bd: O caminho do banco de dados SQLite de onde os dados serão carregados.

    retorno: um dataframe contendo os dados da tabela 'carros'.
    '''
    engine = create_engine(f'sqlite:///{bd}') # cria conexão com o banco de dados SQLite usando SQLAlchemy
    df = pd.read_sql('SELECT * FROM carros', engine) # carrega os dados da tabela carros para um dataframe
    return df

# carrega dados do banco de dados SQLite carros.db para um dataframe
df_sql = sql_dataframe('carros.db')
display(df_sql)

Unnamed: 0,placa,marca,modelo,ano,cor,classificacao
0,UIA1234,Ford,Fiesta,2018,Prata,usado
1,FEF7678,Chevrolet,Cruze,2019,Preto,semi-novo
2,GQW9101,Toyota,Corolla,2020,Branco,novo
3,JKL1213,Honda,Civic,2017,Vermelho,usado
4,BNO1415,BMW,X1,2021,Azul,novo
5,ASR1617,Audi,A3,2020,Cinza,semi-novo
6,STU1819,Mercedes,C-Class,2018,Verde,usado
7,VCX2021,Fiat,Palio,2019,Amarelo,novo
8,YIY2223,Volkswagen,Golf,2021,Marrom,semi-novo
9,KPD2425,Renault,Duster,2020,Roxo,usado


### 4. Crie uma função que crie uma base de dados SQL a partir de um dataframe pandas, utilizando a biblioteca sqlalchemy. Os parâmetros de entrada devem ser o dataframe com a base de dados e o nome da base de dados SQL que será gerada. A saída deve ser uma base de dados SQL.

In [91]:
def dataframe_sql(df, bd):
    '''
    Salva um dataframe em uma tabela 'carros' em um banco de dados SQLite.

    argumentos:
    df: o dataframe a ser salvo no banco de dados.
    bd: o caminho do banco de dados SQLite onde os dados serão armazenados.

    retorno: o dataframe que foi salvo no banco de dados.
    '''
    engine = create_engine(f'sqlite:///{bd}') # cria conexão com o banco de dados SQLite usando SQLAlchemy
    df.to_sql('carros', engine, if_exists='replace', index=False) # escreve os dados do dataframe na tabela carros do banco de dados
    return df

# salva o dataframe na tabela carros do banco de dados SQLite carros_novo.db
df_sql = dataframe_sql(df, 'carros_novo.db')

# Q4. Encontrar e tratar bugs (erros) em Python

### 1. Faça uma modificação na função desenvolvida na questão 1D, de forma que seja tratado erros na informação do caminho escolhido para o salvamento do arquivo. Caso o caminho esteja correto, a função salva o arquivo e retorna True. Em caso de erro, não salvar o arquivo e informar ao usuário que o arquivo não foi salvo e qual o motivo de não poder executar a operação e retornar False.

In [92]:
def salvar_json(dado, arquivo):
    try:
        with open(arquivo, 'w') as f:
            json.dump(dado, f, indent=4)
        return True
    except Exception as e:
        print(f'Erro ao salvar o arquivo: {e}') # em caso de erro, exibe a mensagem de erro e retorna false
        return False

resultado = buscar_placa(df, 'FEF7678')
if resultado:
    sucesso = salvar_json(json.loads(resultado), 'resultado_busca.json') # se resultado contém dados, esta linha tenta salvar esses dados em resultado_busca.json
    if sucesso:
        print('Arquivo salvo com sucesso.')
    else:
        print('Falha ao salvar o arquivo.')

Arquivo salvo com sucesso.


### 2. Faça uma modificação na função da questão 2C que permita avaliar se o carregamento do arquivo .xls foi realizado corretamente. Em caso positivo, a função deve retornar o dataframe atualizado e, em caso negativo, deve retornar False.

In [93]:
def incluir_registro_xls(arquivo, df):
    try:
        novo_df = pd.read_excel(arquivo)
        df_atualizado = pd.concat([df, novo_df], ignore_index=True)
        return df_atualizado
    except Exception as e:
        print(f'Erro ao carregar o arquivo: {e}') # em caso de erro, exibe a mensagem de erro e retorna false
        return False

df = carregar_csv('base.csv')
df_atualizado = incluir_registro_xls('novo_registro.xlsx', df)

# verifica se o dataframe foi atualizado com sucesso e exibe o dataframe atualizado
if df_atualizado is not False:
    display(df_atualizado)

Unnamed: 0,placa,marca,modelo,ano,cor,classificacao
0,UIA1234,Ford,Fiesta,2018,Prata,usado
1,FEF7678,Chevrolet,Cruze,2019,Preto,semi-novo
2,GQW9101,Toyota,Corolla,2020,Branco,novo
3,JKL1213,Honda,Civic,2017,Vermelho,usado
4,BNO1415,BMW,X1,2021,Azul,novo
5,ASR1617,Audi,A3,2020,Cinza,semi-novo
6,STU1819,Mercedes,C-Class,2018,Verde,usado
7,VCX2021,Fiat,Palio,2019,Amarelo,novo
8,YIY2223,Volkswagen,Golf,2021,Marrom,semi-novo
9,KPD2425,Renault,Duster,2020,Roxo,usado


### 3. Modifique a questão 3C de forma que seja possível garantir que a base de dados SQL foi corretamente carregada. Em caso positivo, o retorno deve ser a base de dados e, em caso negativo, deverá ser retornado o valor False.

In [94]:
def sql_dataframe(bd):
    try:
        engine = create_engine(f'sqlite:///{bd}')
        df = pd.read_sql('SELECT * FROM carros', engine)
        return df
    except Exception as e:
        print(f'Erro ao carregar o banco de dados: {e}') # em caso de erro, exibe a mensagem de erro e retorna false
        return False

df_sql = sql_dataframe('carros.db')

# verifica se o dataframe foi atualizado com sucesso e exibe o dataframe atualizado
if df_sql is not False:
    display(df_sql)

Unnamed: 0,placa,marca,modelo,ano,cor,classificacao
0,UIA1234,Ford,Fiesta,2018,Prata,usado
1,FEF7678,Chevrolet,Cruze,2019,Preto,semi-novo
2,GQW9101,Toyota,Corolla,2020,Branco,novo
3,JKL1213,Honda,Civic,2017,Vermelho,usado
4,BNO1415,BMW,X1,2021,Azul,novo
5,ASR1617,Audi,A3,2020,Cinza,semi-novo
6,STU1819,Mercedes,C-Class,2018,Verde,usado
7,VCX2021,Fiat,Palio,2019,Amarelo,novo
8,YIY2223,Volkswagen,Golf,2021,Marrom,semi-novo
9,KPD2425,Renault,Duster,2020,Roxo,usado
