## Configurando dotenv

In [59]:
from dotenv import load_dotenv
import os

load_dotenv()

DB_USER = os.getenv('DB_USER')
DB_PASS = os.getenv('DB_PASS')

**Realizando a conexão com o MongoDB**

In [None]:

from pymongo.mongo_client import MongoClient
from pymongo.server_api import ServerApi

uri = f"mongodb+srv://{DB_USER}:{DB_PASS}@cluster-alura.vse3v.mongodb.net/?retryWrites=true&w=majority&appName=Cluster-Alura"

# Create a new client and connect to the server
client = MongoClient(uri, server_api=ServerApi('1')) # Objeto de conexão com o mongo

# Send a ping to confirm a successful connection
try:
    client.admin.command('ping')
    print("Pinged your deployment. You successfully connected to MongoDB!")
except Exception as e:
    print(e)

## Lendo os dados no MongoDB

In [61]:
db = client['db_produtos']
collection = db['produtos']

In [None]:
for doc in collection.find():
    print(doc)

**Alterando os nomes dos campos de latitude e longitude**

In [None]:
collection.update_many({}, {"$rename": {"lat": "Latitude", "lon": "Longitude"}}) #altera o nome da coluna para todos os dados

In [None]:
collection.find_one()

## Aplicando transformações: filtrando registros da categoria livros

Agora, vamos executar uma consulta para obter apenas os dados relacionados à categoria de **livros**.

In [None]:
collection.distinct("Categoria do Produto")

In [66]:
query = {'Categoria do Produto': 'livros'}

lista_livros = []
for doc in collection.find(query):
    lista_livros.append(doc)


In [None]:
lista_livros

**Salvando os dados em um DataFrame**

In [None]:
import pandas as pd

df_livros = pd.DataFrame(lista_livros)
df_livros.head()

## Formatando as datas

Para adicionar dados do tipo DATE em um banco de dados MySQL, é necessário que a data esteja no formato **%Y-%m-%d (ano-mês-dia)**. Portanto, realizaremos uma transformação na coluna "Data de Compra" para ajustá-la a esse formato. Dessa forma, poderemos armazenar corretamente as datas no banco de dados MySQL, garantindo consistência e facilitando consultas baseadas em datas posteriormente.

In [None]:
df_livros.info()

In [None]:
df_livros['Data da Compra'] = pd.to_datetime(df_livros['Data da Compra'], format="%d/%m/%Y") #converte o tipo da coluna para datetime
df_livros.info()

In [None]:
df_livros['Data da Compra'] = df_livros['Data da Compra'].dt.strftime("%Y-%m-%d") #converte todos os valores para o format '%Y-%m-%d'
df_livros.head()

In [73]:
df_livros.to_csv('../data/tabela_livros.csv', index=False)

## Aplicando transformações: filtrando produtos vendidos a partir de 2021

Nesta etapa, faremos uma query para selecionar apenas os produtos vendidos a partir do ano de 2021. Utilizaremos um filtro na coluna de data de compra para obter os registros que atendam a essa condição.

In [74]:
query = {'Data da Compra': {"$regex": "/202[1-9]"}}

lista_vendas_2021_em_diante = []
for doc in collection.find(query):
    lista_vendas_2021_em_diante.append(doc)

df_vendas_a_partir_de_2021 = pd.DataFrame(lista_vendas_2021_em_diante)

df_vendas_a_partir_de_2021['Data da Compra'] = pd.to_datetime(df_vendas_a_partir_de_2021['Data da Compra'], format="%d/%m/%Y")
df_vendas_a_partir_de_2021['Data da Compra'] = df_vendas_a_partir_de_2021['Data da Compra'].dt.strftime("%Y-%m-%d")

df_vendas_a_partir_de_2021.to_csv('../data/vendas_a_partir_de_2021.csv', index=False)


In [None]:
client.close()

**Formatando as datas**