In [None]:
# install libraries
%pip install ipython-sql
%pip install sqlalchemy
%pip install great_expectations
%pip install psycopg2
%pip install pandas
%pip install ydata_profiling # Ok

In [None]:
# Import libraries
from ydata_profiling import ProfileReport
from sqlalchemy import create_engine, text as sql_text
import great_expectations as gx
import pandas as pd

In [None]:
# SQL CALL
%load_ext sql

In [None]:
# Getting data
df_listing = pd.read_csv('./dados/listings.csv', encoding='utf-8')
df_reviews = pd.read_csv('./dados/reviews.csv', encoding='utf-8')
df_calendar = pd.read_csv('./dados/calendar.csv', encoding='utf-8')


In [None]:
# Basic information of all dataframes
dataframes = {
    'dataframe1':{
        'dataframe': df_listing,
        'descricao': 'Cada registro representa uma listagem individual e inclui informações como o tipo de propriedade, preço, localização, número de quartos, comodidades oferecidas e muito mais.'
    },
    'dataframe2':{
        'dataframe': df_reviews,
        'descricao': 'Inclui dados como a data da avaliação, o identificador da propriedade, os comentários escritos pelos hóspedes, e outras informações.'
    },
    'dataframe3':{
        'dataframe': df_calendar,
        'descricao': 'Lista as datas em que as propriedades estão disponíveis para reserva, bem como os preços para cada data.'
    }
}

def print_basic_info(dataframes):
    for name, info in dataframes.items():
        df = info['dataframe']
        num_rows, num_columns = df.shape
        description = info['descricao']
        print(f'DataFrame: {name}\nNúmero de linhas: {num_rows}\nNúmero de colunas: {num_columns}\nDescrição: {description}\n')

print_basic_info(dataframes)

### **Broze transformation**

In [None]:
# Bronze Transformation
df_listing_bronze = df_listing.head(100).copy()
df_reviews_bronze = df_reviews.head(100).copy()
df_calendar_bronze = df_calendar.head(100).copy()

print(f'{df_calendar_bronze.shape, df_reviews_bronze.shape, df_listing_bronze.shape}')

In [None]:
%sql postgresql://postgres:1234@localhost/postgres

In [None]:
# saving dfs in the postgresql
engine = create_engine('postgresql://postgres:1234@localhost/postgres') 

In [None]:
# saving dfs in the postgresql

df_listing_bronze.to_sql('df_listing_bronze', engine, if_exists='replace', index=False)
df_reviews_bronze.to_sql('df_reviews_bronze', engine, if_exists='replace', index=False)
df_calendar_bronze.to_sql('df_calendar_bronze', engine, if_exists='replace', index=False)

### **Broze transformation** - ProfileReport

In [None]:
# Listing

profile = ProfileReport(df_listing_bronze, title='Profile df_listing_bronze')
profile.to_file('./reports/df_listing_bronze.html')

In [None]:
# Review

profile = ProfileReport(df_reviews_bronze, title='Profile df_reviews_bronze')
profile.to_file('./reports/df_reviews_bronze.html')

In [None]:
# Calendar

profile = ProfileReport(df_calendar_bronze, title='Profile df_calendar_bronze')
profile.to_file('./reports/df_calendar_bronze.html')