Skip to content

davicav/fsfs

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

fsfs

Feature Selection Using Feature Similarity

Este projeto é de uma cadeira do mestrado baseado no documento Unsupervised Feature Selection.pdf O objetivo é escolher um subconjunto de features para o aprendizado de máquina baseada em métricas de maneira não supervisionada. Isto é, não temos as classes para classificar as features. Após visto como se comportam as features em relação às outras de acordo com cada uma das 3 métricas abordadas no capítulo (correlação, erro quadrático e índice de informação máxima) e escolhido o subconjunto, é necessário análisar as escolhas feitas utilizando uma outra métrica, conhecida como entropia.

Este projeto apresenta dois códigos-fontes que leem arquivos CVS com uma matriz onde as linhas são as instâncias e as colunas as features

fsfs.py - onde é feito os cálculos das métricas e visualizada uma matrix de similaridades

entro.py - onde é feita a análise da escolha das features

Não é abordado aqui como fazer a escolha. Você analisa os dados e faz suas escolhas, podendo verificar a "pureza" dos dados a partir do índice de entropia.

About

Feature Selection Using Feature Similarity

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages