🐍 Introduction to Statistical Learning |
Ciências de dados |
Repositório com as respostas do livro An Introduction to Statistical Learning, tanto a resposta das questões teoricas, quanto os exercícios aplicados (Em construção) |
|
🚘 Venda de Carros Usados |
Previsão (regressão) & análise econométrica |
Realizei uma análise em um conjunto de dados de carros seminovos, composto por mais de 400.000 entradas. O objetivo principal foi antever os preços dos veículos e identificar as características que mais impactam no valor final. O dataset apresentava diversos valores discrepantes e informações ausentes, que demandaram procedimentos de tratamento. Conduzi tanto uma avaliação econométrica quanto uma análise de previsão. Concluindo o processo, efetuei a implantação do modelo no streamlit |
numpy, pandas, matplotlib, seaborn, statsmodels, sklearn, yellowbrick |
💳 Churn e Segmentação de Clientes - Cartão de Crédito |
Classificação & Clusterização |
Projeto de Previsão de Cancelamento de Cartão de Crédito em um cenário bancário fictício. O conjunto de dados conta com 10.000 clientes e classes desequilibradas, demandando a aplicação de métodos de reamostragem. Além das previsões, realizou-se a segmentação de clientes suscetíveis ao cancelamento do serviço. O resultado da análise foi divulgado em um texto no medium |
numpy, pandas, matplotlib, seaborn, sklearn |
🍅 Prevendo estoque - varejo |
Regressão |
Participei do Programa de Experiência Virtual em Inteligência Artificial promovido pelo Forage. Nesse programa, desenvolvi um projeto com o objetivo de otimizar o gerenciamento de estoque em um supermercado, aplicando técnicas de aprendizado de máquina para equilibrar a perecibilidade dos produtos, reduzir o desperdício e evitar problemas de falta de itens. Utilizando modelos de aprendizado de máquina e informações fornecidas pela Gala Groceries, consegui prever com precisão a porcentagem estimada de estoque para cada produto em momentos específicos. |
numpy, pandas, matplotlib, seaborn, sklearn, statsmodels |
🎶 7DaysOfCode_SpotifyML |
Classificação |
Particei do desafio de #7DaysOfCodeML promovido pela Alura. O projeto tinha como objetivo analisar os dados do Spotify e prever a popularidade de canções. Os dados são desbalanceados então foi necessário fazer um processo de reamostragem. Treinei minhas habilidades de manipulação, visualização e análise de dados utilizando Machine Learning. |
numpy, pandas, matplotlib, seaborn, sklearn |