fsfs

Feature Selection Using Feature Similarity

Este projeto é de uma cadeira do mestrado baseado no documento Unsupervised Feature Selection.pdf O objetivo é escolher um subconjunto de features para o aprendizado de máquina baseada em métricas de maneira não supervisionada. Isto é, não temos as classes para classificar as features. Após visto como se comportam as features em relação às outras de acordo com cada uma das 3 métricas abordadas no capítulo (correlação, erro quadrático e índice de informação máxima) e escolhido o subconjunto, é necessário análisar as escolhas feitas utilizando uma outra métrica, conhecida como entropia.

Este projeto apresenta dois códigos-fontes que leem arquivos CVS com uma matriz onde as linhas são as instâncias e as colunas as features

fsfs.py - onde é feito os cálculos das métricas e visualizada uma matrix de similaridades

entro.py - onde é feita a análise da escolha das features

Não é abordado aqui como fazer a escolha. Você analisa os dados e faz suas escolhas, podendo verificar a "pureza" dos dados a partir do índice de entropia.

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
source		source
.gitignore		.gitignore
FSFS Notes		FSFS Notes
README.md		README.md
Unsupervised Feature Selection.pdf		Unsupervised Feature Selection.pdf

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

fsfs

About

Releases

Packages

Languages

davicav/fsfs

Folders and files

Latest commit

History

Repository files navigation

fsfs

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages