Esse projeto consiste em um Code Challenge elaborado pela Seazone para a vaga de Analista de Dados Jr. O desafio consiste em analisar os dados de ocupação e preço de anúncios no Airbnb, a fim de responder uma série de perguntas.
Autor: Gabriel Nascimento Silva
- processamento/limpeza de dados
- exploração de dados/estatística descritiva
- modelagem estatística
- redação de relatórios
- estatísticas inferenciais
- visualização de dados
- Python3
- Jupyter Notebook
pandas
,numpy
,Seaborn
,sweetviz
,pip
&conda
-
desafio_priceav.csv
- Contém dados de ocupação e preço de anúnciosairbnb_listing_id
: Identificador de um anúncioprice_string
: Preço ofertadoavailable
: Booleano de ocupação. 1 significa livre e 0 ocupado.date
: Data a ser alugadabooked_on
: Data quandodate
foi alugado.Null
caso ainda esteja available
-
desafio_details.csv
- Contém características de cada anúncioairbnb_listing_id
: Identificador de um anúnciosuburb
: Bairro do anúncioad_name
: Título do anúncionumber_of_bedrooms
: Número de quartos do anúncionumber_of_bathrooms
: Número de banheiros do anúnciostar_rating
: Nota 1-5 do anúnciois_superhost
: Booleano que indica se é superhost ou nãonumber_of_reviews
: Número de comentários do anúncio
- Aplicação de outros métodos de estatísticas inferenciais (e.g. One-way e Two-way ANOVA)
- Geração de modelos que maximizem o faturamento médio do anúncio
- Análise de sentimento do Título de cada Anúncio (
ad_name
)