# Análisis Exploratorio de Datos: Manejo de un Rodeo de Cría
El conjunto de datos de interés contiene información asociada a un manejo de un Rodeo de Cría desde el 2014 hasta la actualidad.
Un **Rodeo de Cría**, hace referencia al conjunto de animales dedicados a la reproducción, así como por sus productos inmediatos. Estos animales son vacas y vaquillonas y por productos inmediatos, los terneros.

El **Manejo del Rodeo de Cría**, el Ing. Agron. Jorge Carrillo lo define como _“el arte y la ciencia de conocer, planificar y dirigir el uso de los recursos con que se cuenta, a fin de optimizar la producción, manteniéndola o incrementándola a través del tiempo sin afectar los recursos naturales.”_
En función a lo anterior, podemos inferir que el Manejo de Rodeo de Cría es un proceso cíclico y complejo donde van sucediendo eventos y mediciones periódicas. Por lo cual, optimización y administración deben ser conceptos claves para su desarrollo.

En conclusion nuestros datos de interés son eventos y mediciones, que se le aplicaron y tomaron de las vacas, asociados a la reproduccion de las mismas.
**Cada fila del dataset corresponde a un proceso de reproducción aplicado a una vaca**

## Representación gráfica del ciclo
A continuacion se representa graficamente los principales eventos y medicicones asociadas a la preproduccion de las vacas y que representran nuestro conjunto de datos de interes
![](data/ciclo_reproductivo.png)

## Clasificación y división de las variables:
Por cada registro del dataset podemos identificar **tres grupos** al que puede pertenecer una variable:
- **Caso actual**: Abarca los datos asociados a la reproducción actual. Por ejemplo: fecha de inicio de la repducción y parto, tipo de reproducción utilizada.
- **Antecedente**: Conformado por datos recolectada de reproducciones previas del animal. Por ejemplo: cantidad de preproducciones previas exitosas y fallidas, cantidad de palpacion en servicio previas exitosas y fallidas. 
- **Identificación**: Datos del animal. Por ejemplo: numero de identidicación, edad de el mismo.

 ![](data/explain_data.png)

## Listado de variables y selección:
A continuacion se listan las variables del dataset, su contenido y definicion.
A su vez se indican si serán utilizada como variable de entrada, de salida o no será utilizada.

|Variable||Definición||Tipo de dato||Tipo de variable|
|---||---||---||---|
|flock_number||Numero que identificada de manera univoca del animal||Integer||Entrada|
|birth_year||Año en el que nació el animal||Integer||Entrada|
|palpation_before||Resultado de la palpación anterior a la ejecución del servicio||String (Preñada/Vacía)||No será utilizada|
|CUT_before||En funcion al resultado de la palpación, indica si el animal es descartado||String (CUT)||No será utilizada|
|body_development||Desarrollo corporal adquirido por el animal||Integer||Entrada|
|DIB_placement||Fecha en la que se colocó el dispositivo vaginal||Date||Entrada|
|DIB_extraction||Fecha en la que se extrajo el dispositivo vaginal||Date||Entrada|
|reproduction_type||Tipo de servicio elegido para ser aplicado sobre el animal||String (Inseminación/Natural)||Entrada|
|reproduction_execution||Fecha en la que se ejecutó el servicio||Date||Entrada|
|palpation_after||Resultado de la palpación posterior a la ejecución del servicio||String (Preñada/Vacía)||Entrada|
|CUT_after||En funcion al resultado de la palpación, indica si el animal es descartado||String (CUT)||No será utilizada|
|reproduction_released||Fecha en la que finalizó el servicio, unicamente se completa si el mismo finalizó con éxito||Date||Salida|
|brood_gender||Sexo de la cría del animal||String (M/H)||No será utilizada|

#### Motivos por los cuales se descartan variables:
- **palpation_before**: Como mencionamos anteriormente, cada fila de nuestro dataset es una reproduccion aplicada a una vaca. Por lo que, palpation_before siempre adquiere el valor _"vacío"_. Ya que en el caso de no estarlo, no se inica el proceso de reproduccion.  
- **CUT_before y CUT_after**: No es un evento del proceso de reproduccion.  
- **brood_gender**: El sexo del animal está asociado con nuesrta variable de Salida. Por lo que solo va a completarse en el caso que la reproduccion haya sido exitosa.
- **DIB_extraction**: Tenemos dos variables `DIB_placement` y `DIB_extraction`, la primera para indicar cuando se colocó el dispositivo y la segunda cuando se extrajo. Cómo solo nos interesa saber si se colocó o no el dispositivo, nos quedamos con una sola de estas dos variables.

#### Transformaciones:

|Variable||Transformacion||Key|
|---||---||---|
|birth_year||Se reemplazará el año de nacimiento por la edad del animal en cada reproducción en la que participó|||
|DIB_placement||No es necesario tener la fecha asociada a éste evento, sino tener registro si se colocó o no||0= No se colocó / 1= Se colocó|
|reproduction_type||||0=Inseminación / 1=Natural|
|palpation_after|||| 0= Vacía / 1= Preñada|
|reproduction_released||No es necesario tener la fecha asociada a éste evento, sino tener registro si fue con exito o no||0= Sin exito / 1= Con exito|
|reproduction_released||Se redondean los valores|||

#### Nuevas variables generadas:

La decision de inciar un proceso de reproduccion, y a su vez el tipo de reproducción elegida, depende mucho del antecedente reproductorio del animal. De acuerdo afirmación obtenida por charlas con el dueño del rodeo. Se generaron las siguientes variables.


|Variable||Definición||Tipo de dato||Tipo de variable|
|---||---||---||---|
|DIB_placement_count||Cantidad de veces, previas, que se le colocó el dispositivo vaginal||Integer||Entrada|
|success_insemination_count||Cantidad de veces, previas, que tuvo inseminaciones con exitos||Integer||Entrada|
|fail_insemination_count||Cantidad de veces, previas, que tuvo inseminaciones sin exitos||Integer||Entrada|
|success_natural_count||Cantidad de veces, previas, que tuvo montas naturales con exitos||Integer||Entrada|
|fail_natural_count||Cantidad de veces, previas, que tuvo montas naturales sin exitos||Integer||Entrada|
|pregnant_after_insemination_count||Cantidad de veces que la palpitacion posterior a la inseminacion indicó que el animal estaba preñado||Integer||Entrada|
|empty_after_insemination_count||Cantidad de veces que la palpitacion posterior a la inseminacion indicó que el animal estaba vacío||Integer||Entrada|
|pregnant_after_natural_count||Cantidad de veces que la palpitacion posterior a la monta natural indicó que el animal estaba preñado||Integer||Entrada|
|empty_after_natural_count||Cantidad de veces que la palpitacion posterior a la monta natural indicó que el animal estaba vacío||Integer||Entrada|
|season||Estación del año en el que se inició la reproducción||String||Entrada|

In [1]:
%matplotlib inline
import pandas as pd

In [3]:
full = pd.read_csv('data/reproductions.csv')
full.head() 

Unnamed: 0,ID,flock_number,birth_year,palpation_before,body_development,CUT_before,DIB_placement,DIB_extraction,reproduction_type,reproduction_execution,...,DIB_placement_count,DIB_extraction_count,success_insemination_count,fail_insemination_count,success_natural_count,fail_natural_count,pregnant_after_insemination_count,empty_after_insemination_count,pregnant_after_natural_count,empty_after_natural_count
0,1,5,2010,Vacia,,,,,Natural,01/09/2014,...,0,0,0,0,0,0,0,0,0,0
1,2,9,2010,Vacia,,,11/12/2014,18/12/2014,Inseminacion,20/12/2014,...,0,0,0,0,0,0,0,0,0,0
2,3,35,2010,Vacia,,,,,Natural,01/09/2014,...,0,0,0,0,0,0,0,0,0,0
3,4,38,2010,Vacia,,,11/12/2014,18/12/2014,Inseminacion,20/12/2014,...,0,0,0,0,0,0,0,0,0,0
4,5,49,2010,Vacia,,,11/12/2014,18/12/2014,Inseminacion,20/12/2014,...,0,0,0,0,0,0,0,0,0,0
