Skip to content

filipetrinidad/insider-ml-test

Repository files navigation

insider-ml-test

O pipeline foi construído usando TensorFlow Extended (TFX), uma biblioteca open-source focada na criação e gerenciamento de pipelines de machine learning. O TFX faz parte do ecossistema TensorFlow e é focado em ambientes de produção.

O TFX possui integração com o Google Cloud Platform e com o Kubeflow Pipelines, de modo que o JSON exportado pode ser utilizado em ambos.

Para executar o pipeline, execute:

pip install -r requirements.txt

python main.py

Os elementos utilizados na criação do pipeline foram:

  • CSVExampleGen: recebe o CSV com os dados e transforma em TFRecords;
  • StatisticsGen: gera algumas estatísticas sobre o dataset;
  • SchemaGen: cria um "esquema" de valores, que é utilizado pelo Trainer;
  • Trainer: inicializa o treinamento no Vertex AI Training no Google Cloud Platform;
  • Pusher: faz upload do modelo no Vertex AI Prediction.

Pipeline de Treinamento

Processamento dos dados

A primeira etapa foi remover da planilha os usuários que não possuíam idade e renomear o campo de sexo para 1 = masculino e 0 = feminino. Em seguida, o componente CSVExampleGen recebe o CSV e o transforma em TFRecords. O StatisticsGen gera algumas estatísticas sobre o dataset.

O SchemaGen gera um esquema de dados que será utilizado pelo Trainer.

Modelagem e treinamento

Após a geração da base de dados, o componente Trainer recebe o modelo, parâmetros e configurações, por último o treinamento é feito no Vertex AI.

Pusher

O componente exporta o modelo no formato SavedModel e faz um deploy no Vertex Ai Prediction.

Para monitoramento do modelo, utilizei o TensorBoard que está integrado a aba de Experimentos do vertex ai.

Verifique o TensorBoard do treinamento.

O endpoint do modelo está publico e é possível fazer uma inferência executando:

python inference.py

INPUTS: 'pclass','age', 'parch', 'fare', 'sex' OUTPUTS: sobreviveu, nao-sobrevibeu

Configurações da máquida de uso: OS: Ubuntu 22.4LTS Processador: Inter Core I5

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages