# Airbnb Rio de Janeiro - Análise exploratória

# 1. Introdução

Este estudo tem como objetivo realizar uma Análise Exploratória de Dados (EDA) do [anúncio de imóveis do Airbnb na cidade do Rio de Janeiro](https://insideairbnb.com/get-the-data/#:~:text=Rio%20de%20Janeiro%2C%20Rio%20de%20Janeiro%2C%20Brazil). Os dados correspondem à data de 27 de Junho de 2024, correspondente à coleta de dados mais recente disponível no momento da elaboração deste estudo. Através desta análise, buscamos identificar padrões, tendências e insights que possam ser úteis para ambos anfitriões e hóspedes.

## 1.1 Configurações e bibliotecas

In [1]:
import pandas as pd

## 1.2 Dados utilizados

Dos dados disponíveis no site, utilizaremos apenas *[listings.csv.gz](https://data.insideairbnb.com/brazil/rj/rio-de-janeiro/2024-06-27/data/listings.csv.gz)*. Esse arquivo contém informações detalhadas dos imóveis na cidade e período considerados.

## 1.3 Dicionário de dados

O dicionário de dados oficial em inglês pode ser encontrado nessa [planilha Google Sheets](https://docs.google.com/spreadsheets/d/1iWCNJcSutYqpULSQHlNyGInUvHg2BoUGoNRIGa6Szc4/edit?pli=1&gid=1322284596#gid=1322284596).

| Campo                                       | Tipo     | Descrição                                                                                          |
|---------------------------------------------|----------|----------------------------------------------------------------------------------------------------|
| accommodates                                | integer  | Número máximo de hóspedes                                                                          |
| amenities                                   | text     | Lista de amenidades oferecida                                                                      |
| availability_30                             | integer  | Número de dias disponíveis nos próximos 30 dias                                                    |
| availability_365                            | integer  | Número de dias disponíveis nos próximos 365 dias                                                   |
| availability_60                             | integer  | Número de dias disponíveis nos próximos 60 dias                                                    |
| availability_90                             | integer  | Número de dias disponíveis nos próximos 90 dias                                                    |
| bathrooms                                   | float    | Número de banheiros                                                                                |
| bathrooms_text                              | text     | Descrição dos banheiros                                                                            |
| bedrooms                                    | integer  | Número de quartos                                                                                  |
| beds                                        | integer  | Número de camas                                                                                    |
| calendar_last_scraped                       | datetime | Data da última coleta no período                                                                   |
| calendar_updated                            | text     | Data da última atualização no período                                                              |
| calculated_host_listings_count              | integer  | Número calculado de anúncios do anfitrião                                                          |
| calculated_host_listings_count_entire_homes | integer  | Número calculado de anúncios de casas inteiras do anfitrião                                        |
| calculated_host_listings_count_private_rooms| integer  | Número calculado de anúncios de quartos privados do anfitrião                                      |
| calculated_host_listings_count_shared_rooms | integer  | Número calculado de anúncios de quartos compartilhados do anfitrião                                |
| description                                 | text     | Descrição do anúncio                                                                               |
| first_review                                | datetime | Data da primeira avaliação                                                                         |
| has_availability                            | boolean  | Indica se o lugar tem disponibilidade                                                              |
| host_about                                  | text     | Descrição sobre o anfitrião                                                                        |
| host_acceptance_rate                        | text     | Taxa de aceitação da hospedagem                                                                    |
| host_has_profile_pic                        | boolean  | Indica se o anfitrião possui foto de perfil                                                        |
| host_id                                     | integer  | Identificador único do anfitrião                                                                   |
| host_identity_verified                      | boolean  | Indica se a identidade do anfitrião foi verificada                                                 |
| host_is_superhost                           | boolean  | Indica se o anfitrião é um superhost                                                               |
| host_listings_count                         | integer  | Número de anúncios do anfitrião                                                                    |
| host_location                               | text     | Localização do anfitrião                                                                           |
| host_name                                   | text     | Nome do anfitrião                                                                                  |
| host_neighbourhood                          | text     | Bairro do anfitrião                                                                                |
| host_picture_url                            | text     | URL da imagem do anfitrião                                                                         |
| host_response_rate                          | text     | Taxa de resposta do anfitrião                                                                      |
| host_response_time                          | text     | Tempo de resposta do anfitrião                                                                     |
| host_since                                  | datetime | Data de cadastro do anfitrião                                                                      |
| host_thumbnail_url                          | text     | URL da imagem em miniatura do anfitrião                                                            |
| host_total_listings_count                   | integer  | Número total de anúncios do anfitrião                                                              |
| host_url                                    | text     | URL do perfil do anfitrião                                                                         |
| host_verifications                          | text     | Verificações do anfitrião                                                                          |
| id                                          | integer  | Identificador único do anúncio                                                                     |
| instant_bookable                            | boolean  | Indica se a anúncio pode ser reservada instantaneamente                                            |
| last_review                                 | datetime | Data da última avaliação                                                                           |
| last_scraped                                | datetime | UTC. A data e hora em que este anúncio foi raspado                                                 |
| latitude                                    | float    | Latitude da localidade                                                                             |
| license                                     | text     | Número da licença ou permissão para operar                                                         |
| listing_url                                 | text     | URL do anúncio                                                                                     |
| longitude                                   | float    | Longitude da localidade                                                                            |
| maximum_maximum_nights                      | integer  | Valor máximo do número máximo de noites nos próximos 365 dias                                      |
| maximum_minimum_nights                      | integer  | Valor máximo do número mínimo de noites nos próximos 365 dias                                      |
| maximum_nights                              | integer  | Número máximo de noites para estadia                                                               |
| maximum_nights_avg_ntm                      | float    | Valor máximo da média de noites nos próximos 365 dias                                              |
| minimum_maximum_nights                      | integer  | Valor mínimo do número máximo de noites nos próximos 365 dias                                      |
| minimum_minimum_nights                      | integer  | Valor mínimo do número mínimo de noites nos próximos 365 dias                                      |
| minimum_nights                              | integer  | Número mínimo de noites para estadia                                                               |
| minimum_nights_avg_ntm                      | float    | Valor mínimo da média de noites nos próximos 365 dias                                              |
| name                                        | text     | Nome da anúncio                                                                                    |
| neighbourhood                               | text     | Bairro com base em dados do Airbnb                                                                 |
| neighbourhood_cleansed                      | text     | Bairro com base em dados públicos                                                                  |
| neighbourhood_group_cleansed                | text     | Grupo de bairros com bas em dados públicos                                                         |
| neighbourhood_overview                      | text     | Descrição do bairro pelo anfitrião                                                                 |
| number_of_reviews                           | integer  | Número de avaliações                                                                               |
| number_of_reviews_l30d                      | integer  | Número de avaliações nos últimos 30 dias                                                           |
| number_of_reviews_ltm                       | integer  | Número de avaliações nos últimos 12 meses                                                          |
| picture_url                                 | text     | URL da imagem principal da anúncio                                                                 |
| price                                       | currency | Preço diário em moeda local.                                                                       |
| property_type                               | text     | Tipo de propriedade                                                                                |
| review_scores_accuracy                      | float    | Pontuação de precisão das avaliações                                                               |
| review_scores_checkin                       | float    | Pontuação de check-in das avaliações                                                               |
| review_scores_cleanliness                   | float    | Pontuação de limpeza das avaliações                                                                |
| review_scores_communication                 | float    | Pontuação de comunicação das avaliações                                                            |
| review_scores_location                      | float    | Pontuação de localização das avaliações                                                            |
| review_scores_rating                        | float    | Pontuação média das avaliações                                                                     |
| review_scores_value                         | float    | Pontuação de valor das avaliações                                                                  |
| reviews_per_month                           | float    | Número médio de avaliações por mês                                                                 |
| room_type                                   | text     | [Tipo de quarto](https://www.airbnb.com/help/article/5)                                            |
| scrape_id                                   | bigint   | Identificador da raspagem dos dados                                                                |
| source                                      | text     | Encotnrado por uma raspagem anterior ou por busca regional                                         |

## 1.4 Sumarização