Projeto de Ciência de Dados utilizando Python no formato notebook.
Objetivo: prever o preço de um imóvel, ou preço de uma diária, do Airbnb baseado nas características dele.
Base de dados retiradas do Kaggle: Rio de janeiro Airbnb open data
No Airbnb, qualquer indivíduo que possua um quarto ou propriedade de qualquer tipo (apartamento, casa, chalé, pousada, etc.) pode oferecê-lo para aluguel por diária.
Nesse sentido, a pessoa cria um perfil de host (quem disponibiliza a propriedade para aluguel) e elabora o anúncio do imóvel. Nele, o host descreve as características do local de maneira abrangente, auxiliando os locatários/viajantes na escolha do lugar ideal e tornando a propriedade mais atrativa.
O anúncio oferece diversas opções de personalização, que engloba desde a quantidade mínima de diárias, preço e número de quartos, até regras de cancelamento, taxa adicional para hóspedes extras, a necessidade de verificação de identidade do locatário, entre outras possibilidades.
Construir um modelo de previsão de preço que permita que um host possa saber quanto deve cobrar pela diária do seu imóvel ou que um locador possa saber se os preços estão atrativos (abaixo da média para imóveis com as mesma características) ou não para alugar.
- É usar os dados/ informações da empresa para extrair informações valiosas e ajudar na tomada de decisão
- De forma simples e o que é usado em muitas empresas: é resolver um desafio da empresa usando os dados diponíveis
- Outra definição: Ciência de Dados está preocupada em resolver os desafios do negócio e saber o que fazer no futuro, fazer alguma previsão que ajudará a tomar o rumo da empresa.
- Business Intelligence está em descrever como as coisas funcionam / funcionaram até aqui
- Machine Learning faz parte da Ciência de Dados, é um modelo disponível para ajudar a prever alguma coisa.
- Machine Learning é o famoso Aprendizado de Máquina.
- Basicamente, em qualquer empresa, afinal, todas as empresas tem dados disponíveis
- Na prática, podemos aplicar em todo lugar, uma vez que o objetivo é resolver um desafio do negócio usando dados.
São várias etapas importantes:
- Entendimento do Desafio que deseja-se resolver
- Entendimento da Área / Empresa
- Extração / Obtenção de Dados
- Ajustes de Dados (Limpeza de Dados)
- Análise Exploratória
- Modelagem + Algoritmo
- Interpretação dos Resultados
- Deploy / produção