Crédito da imagem e direitos autorais: Marcin Rosadziński
Veja também em nasa.gov
O objetivo deste trabalho é comparar os resultados das métricas de avaliação de diferentes modelos de aprendizagem, utilizando técnicas para o tratamento de dados e a melhoria no processo de treinamento.
Na astronomia, o esquema de classificação de galáxias, quasares e estrelas é um dos mais fundamentais. O dataset Stellar Classification Dataset - SDSS17 contém dados espectrais de diferentes corpos estelares visando classificar estrelas, galáxias e quasares com base nessas características.
Esse dataset consiste em 100.000 observações (linhas) do espaço feitas pelo SDSS (Sloan Digital Sky Survey), onde cada observação é descrita por 17 colunas (colunas) de recursos e 1 coluna (label) de classe que a identifica as observações como uma estrela, galáxia ou quasar.
É importante observar que o nosso problema envolve aprendizado supervisionado, mais especificamente, um problema de classificação. Com isso, o resultado que buscamos alcançar é a classificação em uma das três categorias (estrela, galáxia ou quasar) com base nos dados analisados.
