# Conjunto de dados de previsão de aluguel de casa - Canadá
Este conjunto de dados contém informações sobre mais de 6987 casas disponíveis para aluguel


O Canadá é um país localizado na América do Norte, com uma área de 9,98 milhões de km², sendo o segundo maior país do mundo em área territorial. O país é composto por dez províncias e três territórios, com uma população de aproximadamente 38 milhões de pessoas.
O Canadá é conhecido por suas paisagens naturais deslumbrantes, que incluem as Montanhas Rochosas, as Cataratas do Niágara, as praias do Atlântico e as vastas planícies das pradarias. O país também é famoso por suas cidades vibrantes, como Toronto, Vancouver e Montreal, que são centros de arte, cultura e negócios.

## Obtenção dos Dados

Uma das iniciativas do Airbnb é disponibilizar dados do site, para algumas das principais cidades do mundo. Por meio do portal [Inside Airbnb](http://insideairbnb.com/get-the-data.html), é possível baixar uma grande quantidade de dados para desenvolver projetos e soluções de Data Science.

Para esta análise exploratória inicial, será baixado apenas o seguinte arquivo:

* `canada.csv` - *Summary information and metrics for listings in Canadá (good for visualisations).*

In [8]:
#importando pacotes necessarios 
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

%matplotlib inline

In [10]:
# importar o arquivo canada.csv para um DataFrame
df = pd.read_csv('canada.csv')
display (df)

Unnamed: 0,id,name,host_id,host_name,neighbourhood_group,neighbourhood,latitude,longitude,room_type,price,minimum_nights,number_of_reviews,last_review,reviews_per_month,calculated_host_listings_count,availability_365,number_of_reviews_ltm,license
0,685591812209668709,Superbe Appartement Plateau Mont-Royal,214303569,Jean-Georges,,Le Plateau-Mont-Royal,45.536150,-73.583720,Entire home/apt,75,31,2,2022-11-11,0.33,9,240,2,
1,851313496658648587,XVIP #08 Indoor* Parking* RV,490357119,August,,Côte-des-Neiges-Notre-Dame-de-Grâce,45.463639,-73.615013,Entire home/apt,20,1,0,,,8,146,0,300481
2,588937618904116518,New refurbished 3-bedrooms with 5 star location,428842796,Jingwei,,Côte-des-Neiges-Notre-Dame-de-Grâce,45.495087,-73.626968,Entire home/apt,180,31,39,2022-11-02,3.24,3,118,39,
3,772688317959641780,6 shared room with mini-fridge,469927526,Salah,,Villeray-Saint-Michel-Parc-Extension,45.577300,-73.611240,Shared room,22,31,2,2023-02-24,0.63,6,265,2,000
4,51867183,My Cozy Home,420148695,Saima,,Le Sud-Ouest,45.478780,-73.554350,Entire home/apt,210,365,0,,,1,365,0,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
6982,53644973,*1BED Downtown MTL*All Included++,434416250,Angel,,Ville-Marie,45.496750,-73.572900,Entire home/apt,80,32,4,2023-03-05,0.28,6,31,2,
6983,21037355,"Beautiful cachet 2 bedrooms, kitchen,living room",25282125,Marlyn,,Le Sud-Ouest,45.471080,-73.589690,Entire home/apt,70,31,133,2022-01-02,2.34,1,47,0,
6984,671672662541642169,Panoramic Penthouse Skyline View - Free Parking,469650484,Mtl,,Ville-Marie,45.492290,-73.576030,Entire home/apt,159,3,22,2023-03-26,3.71,2,218,22,303068
6985,20978847,Nice apartment all equipped/2 min walk from Metro,150953961,Mestapha,,Le Sud-Ouest,45.450540,-73.590600,Entire home/apt,90,32,2,2019-10-03,0.03,1,0,0,


## Análise dos Dados

Esta etapa tem por objetivo criar uma consciência situacional inicial e permitir um entendimento de como os dados estão estruturados.



**Dicionário das variáveis**

* `id` - número de id gerado para identificar o imóvel
* `name` - nome da propriedade anunciada
* `host_id` - número de id do proprietário (anfitrião) da propriedade
* `host_name` - Nome do anfitrião
* `neighbourhood_group` - esta coluna não contém nenhum valor válido
* `neighbourhood` - nome do bairro
* `latitude` - coordenada da latitude da propriedade
* `longitude` - coordenada da longitude da propriedade
* `room_type` - informa o tipo de quarto que é oferecido
* `price` - preço para alugar o imóvel
* `minimum_nights` - quantidade mínima de noites para reservar
* `number_of_reviews` - número de reviews que a propriedade possui
* `last_review` - data do último review
* `reviews_per_month` - quantidade de reviews por mês
* `calculated_host_listings_count` - quantidade de imóveis do mesmo anfitrião
* `availability_365` - número de dias de disponibilidade dentro de 365 dias

Antes de iniciar qualquer análise, vamos verificar a cara do nosso *dataset*, analisando as 5 primeiras entradas.

In [13]:
# mostrar as 5 primeiras entradas
df.head()
df['neighbourhood'].unique()

array(['Le Plateau-Mont-Royal', 'Côte-des-Neiges-Notre-Dame-de-Grâce',
       'Villeray-Saint-Michel-Parc-Extension', 'Le Sud-Ouest',
       'Mercier-Hochelaga-Maisonneuve', 'Verdun', 'Ville-Marie',
       'Lachine', 'Rosemont-La Petite-Patrie',
       'Rivière-des-Prairies-Pointe-aux-Trembles', 'Saint-Laurent',
       'Ahuntsic-Cartierville', 'Pointe-Claire', 'Montréal-Ouest',
       'Anjou', 'LaSalle', 'Montréal-Est', 'Mont-Royal',
       'Pierrefonds-Roxboro', 'Montréal-Nord', 'Beaconsfield',
       'Dollard-des-Ormeaux', 'Côte-Saint-Luc', 'Saint-Léonard',
       'Hampstead', 'Sainte-Anne-de-Bellevue', "Baie-d'Urfé",
       "L'Île-Bizard-Sainte-Geneviève", 'Dorval', 'Westmount',
       'Outremont', 'Kirkland'], dtype=object)

**Q1. Quantos atributos (variáveis) e quantas entradas o nosso conjunto de dados possui? Quais os tipos das variáveis?**

Vamos prosseguir e identificar a quantidade de entradas que nosso conjunto de dados possui e ver os tipos de cada coluna.

Este *dataset* que baixamos é a versão "resumida" do Airbnb. Na mesma página que baixamos o arquivo `canada.csv`. Há uma versão mais completa (`canada.csv.gz`).

In [12]:
# identificar o volume de dados do DataFrame
print("Entradas:\t {}".format(df.shape[0]))
print("Variáveis:\t {}\n".format(df.shape[1]))

# verificar as 5 primeiras entradas do dataset
display(df.dtypes)

Entradas:	 6987
Variáveis:	 18



id                                  int64
name                               object
host_id                             int64
host_name                          object
neighbourhood_group               float64
neighbourhood                      object
latitude                          float64
longitude                         float64
room_type                          object
price                               int64
minimum_nights                      int64
number_of_reviews                   int64
last_review                        object
reviews_per_month                 float64
calculated_host_listings_count      int64
availability_365                    int64
number_of_reviews_ltm               int64
license                            object
dtype: object