Este repositório traz 4 desafios que envolvem assuntos como análise de dados, automação de processos, aprendizado de máquina, dentre outros assuntos relacionados a Ciência de Dados.
São problemas comuns a muitas empresas e que podem ser resolvidos através do estudo dos dados disponíveis dela. A partir dessa análise e utilizando alguma linguagem de programação a nosso favor é possível detectar padrões e obter insights para possíveis tomadas de decisões que ajudariam a empresa a solucionar o problema pelo qual está passando.
O primeiro desafio se trata de reunir informações sobre 25 Shoppings a partir de uma planilha em Excel com mais de 100.000 linhas e enviar o relatório de cada Shopping para o email de seu respectivo gerente.
Como todo esse processo se feito de forma manual seria extremamente repetitivo e cansativo, este desafio será resolvido com uma simples Automação de Processos.
Bibliotecas e pacotes utilizados: pandas, smtplib, email. Leia detalhadamente sobre esse desafio aqui.
O segundo desafio se trata de uma empresa de cartões de crédito que estão perdendo clientes progressivamente e gostaria de entender melhor o motivo que está levando tantos clientes a cancelarem seus cartões.
Portanto, farei uma Análise de Dados a partir de uma planilha com os dados de seus clientes para formar o perfil dos clientes que estão cancelando seus cartões, para que assim a empresa saiba exatamente onde pode focar para mudar esta situação.
Bibliotecas e pacotes utilizados: pandas, plotly. Leia detalhadamente sobre esse desafio aqui.
Este é um super desafio que envolve Machine Learning e Business Intelligence. O terceiro desafio se trata de criar uma ferramenta para auxiliar pessoas a saberem quanto elas devem cobrar pela diária do seu imóvel e também auxiliar aquele que está buscando uma estadia a saber se o preço dos imóveis buscados estão justos ou não.
Esse é um desafio que mostra como funciona na prática um projeto de Ciência de Dados. Ele envolve, basicamente, oito etapas:
- Entendimento do desafio
- Avaliação do projeto/área
- Extração e obtenção de dados
- Ajuste de dados (limpeza)
- Análise exploratória
- Modelagem e algoritmos
- Interpretação do resultado
- Conclusão
Bibliotecas e pacotes utilizados: pandas, pathlib, numpy, seaborn, matplotlib, plotly, sklearn. Leia detalhadamente sobre esse desafio aqui.
O quarto desafio se trata de uma empresa em expansão que precisa enviar, todos os dias, boletos de cobrança para seus clientes inadimplentes.
Como se trata de um processo bastante repetitivo, é favorável utilizar Automação de Processos, tornando tudo mais simples e automático. O mais interessante desse desafio é que é necessário automatizar um processo que é feito através do navegador e envolve algumas etapas intrigantes.
Bibliotecas e pacotes utilizados: pandas, time, selenium. Leia detalhadamente sobre esse desafio aqui.
MIT © Gabriel Reira