Skip to content

JoePortilla/IrisDataset-EDA

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

16 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Análisis Exploratorio de Datos (EDA) del dataset Iris

logo

El dataset Iris es un conjunto de datos de clasificación multiclase clásico y muy sencillo. Introducido por el estadístico y biólogo británico Ronald Fisher en su artículo de 1936 "The use of multiple measurements in taxonomic problems". El conjunto de datos de Iris contiene cuatro características (longitud y anchura de sépalos y pétalos) de 50 muestras de tres especies de flores Iris (Iris setosa, Iris virginica e Iris versicolor).

logo

El objetivo es construir un modelo que utilice las características para clasificar las flores con un máximo de precisión.

Para alcanzar este objetivo, vamos a realizar un análisis exploratorio de datos para comprender los datos y elegir las mejores características. Este notebook se centra en explorar y visualizar el conjunto de datos utilizando bibliotecas como Seaborn y Matplotlib. El procesamiento de datos se realiza con Pandas.

Paquetes utilizados:

  • Procesamiento de datos: Pandas.
  • Visualización de datos: Seaborn y Matplotlib.

Referencias:

Instructor:

Joseph Santiago Portilla - Ingeniero Electrónico.