Sou formado em Engenharia Civil, e atualmente estou estudando Ciência de Dados. Estou cursando o primeiro período de Ciência de Dados.
Há quase um ano, eu me tornei membro da Comunidade DS onde eu desenvolvi projetos pessoais práticos — regressão, clusterização e classificação —, nos quais adquiri experiência na coleta, limpeza e análise de dados, bem como na construção de modelos preditivos. Esses projetos permitiram uma compreensão mais aprofundada de técnicas estatísticas, algoritmos de machine learning e visualização de dados. Ademais, pude aprimorar minha habilidade em resolver problemas ao aplicar o método cíclico (CRISP).
Além disso, na comunidade, eu tenho a oportunidade de compartilhar conhecimentos e experiências com os membros da comunidade através de grupos de estudo, monitorias e hackdays.
Sou apaixonado por resolver problemas complexos e encontrar padrões ocultos nos dados. Com minhas habilidades analíticas consigo transformar dados em informações acionáveis (insights).
Ferramentas & Habilidades
- Visualização de Dados:
- Power BI
- Tableau
- Linguagens de Programação:
- Python para Dados
- Machine Learning: Scikit-Learn,
- Statisics: Scipy, Statsmodels
- Web Scraping: Beautiful Soup and Selenium
- Data Visualization: Matplitlib, Seaborn, Plotly.
- SQL para extração de dados
- Estatística e Machine Learning
- Estatística Descritiva e Inferêncial(localização, dispersão, assimetria, kurtosis, densidade, testes de hipótese, Teste A/B).
- Algoritmos de Regressão, classificação.
- Técnicas de seleção de atributos.
- Métricas de performance dos algoritmons (RMSE, MAE, MAPE, Confusion Matrix, Precisão, Recall, Curva ROC, Curva Lift, AUC).
Durante este projeto, desenvolvi e implementei um modelo de classificação destinado a ordenar os clientes com base em seu interesse potencial em adquirir um novo produto, especificamente, um seguro de veículos. Esta iniciativa foi crucial para otimizar a abordagem do time de vendas, permitindo que eles se concentrassem prioritariamente nos clientes mais propensos a realizar a compra. Com esse projeto espera-se atingir 2.66 vezes mais clientes interessados do que de forma aleatória, tendo uma receita esperada de $ 29.412.000,00. Os resultados do modelo foram acessíveis via Google Sheets para maior praticidade. Ferramentas: Python, sklearn, Machine Learning, Google Sheets, Git e Github, SQL.
Durante este projeto desafiador, implementei um modelo avançado de previsão de vendas para uma extensa rede de farmácias na Europa, utilizando a plataforma Render. Este modelo foi desenvolvido para antecipar vendas futuras (em valor monetário), para auxiliar o CFO na tarefa de alocação de recursos para reformar lojas. Os resultados do projeto não apenas aprimoraram significativamente a precisão das previsões de vendas, mas também transformaram a maneira como a equipe de gestão interagia com essas informações vitais. A integração com o Telegram proporcionou uma comunicação eficiente e em tempo real, tornando este projeto uma contribuição valiosa para a eficácia operacional da rede de farmácias. Ferramentas: Machine Learning, Python, Pandas, Matplotlib, Git e Github e scikit-learn.
Durante este projeto, conduzi uma análise de segmentação de clientes para a equipe de marketing. Utilizei algoritmos de clustering, incluindo k-means, Gaussian Mixture Model e Agglomerative Clustering, em um banco de dados contendo o histórico de compras dos clientes. Identifiquei 10 segmentos de clientes para auxiliar a equipe de marketing na criação de ofertas personalizadas para cada grupo e no desenvolvimento de um programa de fidelidade para o melhor grupo de clientes. Desenvolvi este projeto utilizando Python, pandas, scikit-learn e técnicas de redução de dimensionalidade.
Neste projeto, realizei um teste A/B com o objetivo de determinar a superioridade entre o formulário de pagamento atual e uma versão recém-desenvolvida. A iniciativa visava otimizar a experiência do usuário e, por consequência, maximizar a eficácia na conversão de transações.
Neste projeto eu criei um relatório no Power BI com 7 Dashboards interativos: Demonstração de Fluxo de Caixa (DFC), Demonstração de Resultado do Exercício (DRE), Análise de Fluxo de Caixa, Análise de Resultado, Despesas, Despesas com Pessoal e Despesas Administrativas. Esse relatório permitiu que os gerentes verificassem facilmente a situação financeira da empresa, e os ajudou a identificar áreas de alto custo e oportunidades de otimização.
Neste projeto, concebi e implementei uma aplicação web inovadora com o objetivo de ajudar potenciais compradores a identificar oportunidades de compra de imóveis abaixo do preço médio em uma região específica. A aplicação, desenvolvida usando Python e a biblioteca Streamlit, integra mapas interativos e tabelas para uma experiência visual e informativa.
Neste projeto, utilizei Python, Estatística e Algoritmos de Classificação para prever doenças cardíacas em estágios iniciais. O valor do diagnóstico fornecido pela empresa é baseado em sua precisão. Desenvolvi este projeto com o objetivo de aumentar os ganhos da empresa, auxiliando a equipe responsável pelos diagnósticos e, assim, elevando a precisão dos resultados. Em comparação com a situação atual, espera-se um aumento de 83,33% no lucro de cada diagnóstico ao implementar o modelo. As previsões do modelo podem ser acessadas via Google Sheets.