<a href="https://colab.research.google.com/github/geovanemelo/Portfolios-Data-Science/blob/main/Analisando_os_Dados_do_Airbnb_(Rio_De_Janeiro).ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### **Data Science na Prática**
*by [Geovane Melo](https://www.linkedin.com/in/geovane-melo-da-silva-105040147/)*

---



# Análise dos Dados do Airbnb - Rio de Janeiro

O [Airbnb](https://www.airbnb.com.br/), fundado em 2008 em São Fransisco, na California vem inovando a forma de se hospedar de turistas do mundo inteiro, mesmo sem ter **nenhum hotel**.

Anfitriões oferecem seus imóveis de maneira prática na plataforma e se conectam com turistas que preferem ter o seu *"cantinho"* do que a um tradicional hotel no seu momento de relaxamento.

Com seu jeito peculiar e inovador, no final de 2018, a empresa americana já havia hospedado **mais de 300 milhões** de pessoas em todos os cantos do mundo, se tornando referência no ramo de ajolamento local.

A empresa tem como iniciativa, disponibilizar alguns dados de hospedagem das maiores cidades do mundo. Atráves do portal [Inside Airbnb](http://insideairbnb.com/get-the-data.html), é possivel ter acesso á uma quantidade de dados incriveis, onde se pode baixar e desenvolver projetos e soluções de *Data Science*.

<center><img alt="Analisando Airbnb" width="10%" src="https://www.area360.com.au/wp-content/uploads/2017/09/airbnb-logo.jpg"></center>

**Neste *notebook*, iremos analisar os dados referentes à cidade do Rio de Janeiro, e ver quais insights podem ser extraídos a partir de dados brutos.**



## Obtenção dos Dados

Os dados usados nesse estudos foram retirado do portal [Inside Airbnb](http://insideairbnb.com/get-the-data.html).

O inside AirBnB é um independente e não-comercial conjunto de ferramentas e dados. 
O portal permite que você explore a forma que o AirBnB trabalha e inova em todo planeta.

O portal [Inside Airbnb](http://insideairbnb.com/get-the-data.html) não é associado ao AirBnB ou qualquer outro concorrente. Para mais informações sobre o portal clique [aqui](http://insideairbnb.com/behind.html).

Com intuito de uma análise explorátoria inicial, apenas o seguinte arquivo será utilizado:

* `listings.csv` - *Summary information and metrics for listings in Rio de Janeiro (good for visualisations).*


In [1]:
# importando os pacotes necessários

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

%matplotlib inline

In [3]:
# importando o arquivo listings.csv para um DataFrame

df = pd.read_csv("http://data.insideairbnb.com/brazil/rj/rio-de-janeiro/2020-12-23/visualisations/listings.csv")

## Análise dos Dados

Etapa de entendimento inicial, com intuito de compreender a forma que os dados estão estruturados.

**Dicionário das variáveis**

*entenda o que representa cada coluna*

* `id` - Numero gerado automaticamente para identificação do imóvel
* `name` - Título do anuncio feito
* `host_id` - id do anfitrião da propriedade
* `host_name` - Primeiro nome do anfitrião
* `neighbourhood_group` - Está coluna não contém valores válidos
* `neighbourhood` - nome do bairro
* `latitude` - coordenada da latitude da propriedade
* `longitude` - coordenada da longitude da propriedade
* `room_type` - informa o tipo de quarto que é oferecido
* `price` - preço para alugar o imóvel
* `minimum_nights` - quantidade mínima de noites para reservar
* `number_of_reviews` - número de reviews que a propriedade possui
* `last_review` - data do último review
* `reviews_per_month` - quantidade de reviews por mês
* `calculated_host_listings_count` - quantidade de imóveis do mesmo anfitrião
* `availability_365` - número de dias de disponibilidade dentro de 365 dias

Começaremos verificando a "cara" do nosso *dataset*, analisando as 5 primeiras entradas.



In [5]:
# mostrar as 5 primeiras entradas
df.head()

Unnamed: 0,id,name,host_id,host_name,neighbourhood_group,neighbourhood,latitude,longitude,room_type,price,minimum_nights,number_of_reviews,last_review,reviews_per_month,calculated_host_listings_count,availability_365
0,17878,"Very Nice 2Br in Copacabana w. balcony, fast WiFi",68997,Matthias,,Copacabana,-22.96592,-43.17896,Entire home/apt,500,5,259,2020-12-26,2.03,1,0
1,25026,Beautiful Modern Decorated Studio in Copa,3746246,Ghizlane,,Copacabana,-22.97712,-43.19045,Entire home/apt,160,7,238,2020-02-15,1.85,11,335
2,35636,Cosy flat close to Ipanema beach,153232,Patricia,,Ipanema,-22.98816,-43.19359,Entire home/apt,259,2,181,2020-03-15,2.07,1,267
3,35764,COPACABANA SEA BREEZE - RIO - 20 X Superhost,153691,Patricia Miranda & Paulo,,Copacabana,-22.98127,-43.19046,Entire home/apt,157,3,346,2020-12-20,2.78,1,89
4,41198,"Modern 2bed,Top end of Copacabana",178975,Nicky,,Copacabana,-22.97962,-43.1923,Entire home/apt,1035,3,18,2016-02-09,0.19,2,365
