Projeto-AceleraDev-Data-Science

O objetivo deste projeto é constuir um sistema para fazer a recomendação de possíveis clientes ao usuário com base em sua lista atual de clientes.

Estrutura do projeto

O projeto é dividido em duas principais partes, o pré-processamento, que é independente ao usuário, e o sistema de recomendação em si.

Pré-processamento

No notebook "Analise dos dados.ipynb" é realizado o primeiro tratamento dos dados, nele as variáveis contidas na pasta "Raw_data" foram selecionadas e tratadas. Em "generate_dataset.py" os dados previamente tratados são convertidos para arquivos hdf5 e separados para o treinamento do autoencoder.

O script "main autoencoder.py" realiza o treino dos autoencoders, estes são redes neurais que utilizam dropout como forma de fazer uma aproximação bayesiana. Estes autoencoders tem dois objetivos, além de depois serem usados para fazer a redução de dimensionalidade eles devem fazer a regressão dos dados faltantes em sua saída, para isso foi adicionada uma variável booleana para cada variável que indica quando a regressão é necessária e para o treino das redes dados faltantes foram simulados.

O autoencoder que possuí o menor erro e maior compressão é selecionado manualmente para fazer a codificação em "encode.py", neste script todos os dados do mercado são processados pela primeira parte do autoencoder e são salvos na pasta "Data" com o código do autoencoder utilizado.

Sistema de recomendação ao usuário

Com base no portifólio do usuário, o notebook "Main.ipynb" utiliza o script "Deep_one_Class.py" para realizar o treino de redes neurais artificiais Deep One-Class, que também foi aplicado dropout como forma de fazer uma aproximação bayesiana, para fazer a recomendação. O objetivo da otimização deste tipo de rede é fazer uma transformação espacial nos dados de treino de forma que estes quando transformados se aproximem do centro de uma hiperesfera. Para escolher a melhor rede Deep One-Class foi utilizado o menor erro proporcional entre o Loss no conjunto de treino e de teste. O ranking dos clientes foi feito aplicando esta rede aos dados e organizá-los pela distância euclidiana do centro da esfera.

Para mais detalhes sobre a utilização do dropout como forma de fazer uma aproximação bayesiana e a rede Deep One-Class consulte na pasta "Referencias" os artigos "Time-series Extreme Event Forecasting with Neural Networks at Uber" de Nikolay Laptev, Jason Yosinski, Li Erran Li, Slawek Smyl (2017) e "Deep One-Class" de Ruff, L., Vandermeulen, R., Goernitz, N., Deecke, L., Siddiqui, S.A., Binder, A., Müller, E. & Kloft, M.. (2018), respectivamente.

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
.ipynb_checkpoints		.ipynb_checkpoints
.spyproject/config		.spyproject/config
Autoencoder		Autoencoder
Data		Data
Deep_One-Class		Deep_One-Class
Raw_data		Raw_data
Referencias		Referencias
__pycache__		__pycache__
functions		functions
Analise dos dados.ipynb		Analise dos dados.ipynb
Deep_one_Class.py		Deep_one_Class.py
Main.ipynb		Main.ipynb
README.md		README.md
encode.py		encode.py
generate_dataset.py		generate_dataset.py
main autoencoder.py		main autoencoder.py
pacotes utilizados.txt		pacotes utilizados.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Projeto-AceleraDev-Data-Science

Estrutura do projeto

Pré-processamento

Sistema de recomendação ao usuário

About

Releases

Packages

Languages

LucasYuki/Projeto-AceleraDev-Data-Science

Folders and files

Latest commit

History

Repository files navigation

Projeto-AceleraDev-Data-Science

Estrutura do projeto

Pré-processamento

Sistema de recomendação ao usuário

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages