In [0]:
%sql
-- Verificar quantos registros existem em cada tabela
SELECT COUNT(*) FROM listing_silver;
SELECT COUNT(*) FROM calendar_silver;

-- Verificar se existem correspondências entre as colunas de relacionamento
SELECT COUNT(*) 
FROM listing_silver l
JOIN calendar_silver c
ON l.id = c.listing_id;



count(1)
5096500


In [0]:
%sql

-- Conta o numero total de cada registros para cada ID. Aquio é possivel verificar se todos os anúncios tem pelo menos 1 entrada no calendário.
SELECT l.id, COUNT(c.listing_id) AS total_registros
FROM listing_silver l
JOIN calendar_silver c
ON l.id = c.listing_id
GROUP BY l.id
ORDER BY total_registros DESC
LIMIT 10;



id,total_registros
13465199,366
52875017,366
5280679,366
53831834,366
9292855,366
676235,365
1078107,365
1280058,365
2811386,365
3079210,365


In [0]:
%sql
-- Por ID busca a taxa de ocupação com média de valores, número de avaliações e média de rating, agora incluindo cidade e bairro.
SELECT
    c.listing_id,
    ROUND(AVG(CASE WHEN c.available = 't' THEN 0 ELSE 1 END), 2) AS taxa_ocupacao,  -- Arredondando para 2 casas decimais
    ROUND(AVG(c.price), 2) AS preco_medio_noite,  -- Arredondando para 2 casas decimais
    COUNT(r.id) AS numero_de_avaliacoes,
    ROUND(AVG(l.review_scores_rating), 2) AS media_rating,  -- Arredondando para 2 casas decimais
    l.host_location AS cidade, 
    l.neighbourhood_cleansed AS bairro
FROM
    calendar_silver AS c
LEFT JOIN
    listing_silver AS l ON c.listing_id = l.id
LEFT JOIN
    reviews_silver AS r ON l.id = r.listing_id
GROUP BY
    c.listing_id, l.host_location, l.neighbourhood_cleansed 
ORDER BY
    taxa_ocupacao DESC, preco_medio_noite DESC;



listing_id,taxa_ocupacao,preco_medio_noite,numero_de_avaliacoes,media_rating,cidade,bairro
16112187.0,1.0,55000.0,10950,4.83,"Rio de Janeiro, Brazil",Leblon
50592933.0,1.0,5000.0,5110,4.71,"Rio de Janeiro, Brazil",Leme
11732702.0,1.0,2500.0,2555,4.86,"Rio de Janeiro, Brazil",Copacabana
41553536.0,1.0,2233.0,0,,"Rio de Janeiro, Brazil",Laranjeiras
2301864.0,1.0,2100.0,5475,4.93,"Rio de Janeiro, Brazil",Copacabana
9341350.0,1.0,1700.0,9125,4.72,"Rio de Janeiro, Brazil",Copacabana
53415930.0,1.0,1515.0,365,3.0,"Rio de Janeiro, Brazil",Leblon
28083613.0,1.0,1500.0,3285,4.89,"Rio de Janeiro, Brazil",Ipanema
13435640.0,1.0,1488.0,7300,4.7,"Rio de Janeiro, Brazil",Leblon
17329080.0,1.0,1360.0,2920,4.75,"Rio de Janeiro, Brazil",Recreio dos Bandeirantes


In [0]:
%sql
-- Analisando a taxa de ocupação, preço médio e média de avaliações por bairro
SELECT
    l.neighbourhood_cleansed AS bairro,  -- Agrupando por bairro
    ROUND(AVG(CASE WHEN c.available = 't' THEN 0 ELSE 1 END),2) AS taxa_ocupacao,  -- Calculando a taxa de ocupação
    ROUND(AVG(c.price),2) AS preco_medio_noite,  -- Calculando o preço médio por noite
    ROUND(AVG(l.review_scores_rating),2) AS media_rating  -- Calculando a média de avaliações
FROM
    calendar_silver AS c
LEFT JOIN
    listing_silver AS l ON c.listing_id = l.id  -- Associando as duas tabelas pelo listing_id
GROUP BY
    l.neighbourhood_cleansed  -- Agrupando por bairro
ORDER BY
    taxa_ocupacao DESC, preco_medio_noite DESC;  -- Ordenando pela maior taxa de ocupação e preço médio


bairro,taxa_ocupacao,preco_medio_noite,media_rating
Sampaio,0.95,349.0,4.74
Cacuia,0.8,134.0,4.96
Água Santa,0.76,500.0,
Maria da Graça,0.76,59.0,4.91
Tauá,0.71,161.25,4.97
Vila Militar,0.62,59.0,4.85
Pilares,0.57,402.5,4.61
Jardim Sulacap,0.54,200.0,4.96
Parque Anchieta,0.54,120.0,3.5
Grumari,0.52,345.0,4.67
