<a href="https://colab.research.google.com/github/rpizarrog/probabilidad-y-estad-stica/blob/master/2024/caso_prueba_de_atributos_de_mascotas_perros.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Objetivo

Simular y describir un conjunto de datos de características de mascotas perros



# Descripción

El contexto de los datos es de un hospital veterinario que controla o atiende la salud de pacientes perros que sus dueños llevan a revisión y atención.

* Se declaran nombres de perros comumes
* La edad de los perros es entre 1 y 15 años
* El sexo del perror es Macho o Hembra
* Se declaran nombres enfermedades para perros de un cuadro básico, en donde cada variable tiene valores de 0 para NO tiene y 1 SI tiene enfermedad respectivamente
* El estado de salud es Enfermo o Saludable
* Se simula una población de 250 o 500 perros


# Desarrollo



## Se cargan librerías necesarias


In [1]:
import random as rnd
import pandas as pd

## Inicializar variables

Se crean arreglos de nombres de perros, vacuna y enfermedades


In [2]:

# Lista de nombres de perros
nombres_perros = ["Buddy", "Max", "Bella", "Lucy", "Charlie", "Bailey", "Sadie", "Daisy", "Molly", "Rocky"]

# Lista de enfermedades comunes
enfermedades_comunes = ["Parvovirosis", "Leptospirosis", "Moquillo", "Rabia", "Tos de las perreras"]




## Se crea un data.frame de los N perros

In [3]:
# Generar datos simulados para cada perro
datos_perros = []
N = 250
for _ in range(N):
    nombre_perro = rnd.choice(nombres_perros)
    edad = rnd.randint(1, 15)
    sexo = rnd.choice(["Macho", "Hembra"])

    enfermedades = rnd.sample(enfermedades_comunes, rnd.randint(0, len(enfermedades_comunes)))
    estado_salud = rnd.choice(["Saludable", "Enfermo"])

    datos_perro = {'Nombre': nombre_perro, 'Edad': edad, 'Sexo': sexo, 'Estado de salud': estado_salud}
    for enfermedad in enfermedades_comunes:
        datos_perro[enfermedad] = 1 if enfermedad in enfermedades else 0

    datos_perros.append(datos_perro)

# Crear DataFrame
df_perros = pd.DataFrame(datos_perros)

# Mostrar DataFrame
print(df_perros)

      Nombre  Edad    Sexo Estado de salud  Parvovirosis  Leptospirosis  \
0    Charlie     4   Macho       Saludable             1              0   
1      Sadie     3   Macho       Saludable             0              0   
2      Bella    12   Macho         Enfermo             1              1   
3      Bella    15   Macho         Enfermo             1              1   
4      Sadie     8   Macho         Enfermo             1              1   
..       ...   ...     ...             ...           ...            ...   
245    Rocky    12  Hembra         Enfermo             0              0   
246   Bailey     2   Macho       Saludable             1              0   
247   Bailey     2   Macho       Saludable             1              1   
248  Charlie    11  Hembra         Enfermo             1              0   
249  Charlie    14   Macho       Saludable             1              1   

     Moquillo  Rabia  Tos de las perreras  
0           1      0                    0  
1          

## Estadísticos de los datos


In [4]:
# Mostrar los estadísticos más importantes
print(df_perros.describe())

             Edad  Parvovirosis  Leptospirosis    Moquillo       Rabia  \
count  250.000000    250.000000     250.000000  250.000000  250.000000   
mean     8.356000      0.524000       0.496000    0.456000    0.516000   
std      4.293133      0.500426       0.500987    0.499059    0.500746   
min      1.000000      0.000000       0.000000    0.000000    0.000000   
25%      5.000000      0.000000       0.000000    0.000000    0.000000   
50%      9.000000      1.000000       0.000000    0.000000    1.000000   
75%     12.000000      1.000000       1.000000    1.000000    1.000000   
max     15.000000      1.000000       1.000000    1.000000    1.000000   

       Tos de las perreras  
count           250.000000  
mean              0.544000  
std               0.499059  
min               0.000000  
25%               0.000000  
50%               1.000000  
75%               1.000000  
max               1.000000  


## El nombre más común



In [5]:
# Encontrar el nombre más común
nombre_mas_comun = df_perros['Nombre'].mode()[0]

print("El nombre más común es:", nombre_mas_comun)


El nombre más común es: Bella


## La media aritmética de la edad de los perros


In [6]:
# Calcular la media aritmética de la edad
media = df_perros['Edad'].mean()

print("La media aritmética de la edad de los perros", media)

La media aritmética de la edad de los perros 8.356


## ¿Qué perros se atienden más, machos o hembras?


In [7]:
# Contar el número de registros para cada sexo
conteo_sexo = df_perros['Sexo'].value_counts()

# Mostrar el resultado
print("Número de perros atendidos por sexo:")
print(conteo_sexo)

Número de perros atendidos por sexo:
Macho     135
Hembra    115
Name: Sexo, dtype: int64


## ¿Qué enfermedad es la más común?

In [8]:
# Crear una Serie con todas las enfermedades
enfermedades = df_perros[enfermedades_comunes].sum()

# Encontrar la enfermedad más común
enfermedad_mas_comun = enfermedades.idxmax()

# Mostrar el resultado
print("La enfermedad más común es:", enfermedad_mas_comun)

La enfermedad más común es: Tos de las perreras


## Saludables o Enfermos


In [9]:
# Contar el número de registros para cada estado de salud
conteo_estado_salud = df_perros['Estado de salud'].value_counts()

# Mostrar el resultado
print("Número de perros por estado de salud:")
print(conteo_estado_salud)


Número de perros por estado de salud:
Enfermo      130
Saludable    120
Name: Estado de salud, dtype: int64


# Interpretación

* ¿Cuál es el nombre más comun o que más se repite?, la moda
* ¿Cuál es la media aritmética de la edad de los perros ?
* ¿Qué perros se atienden más, machos o hembras?
* ¿Qué enfermedad es la más común?
* ¿Que hay más mascotas perros enfermos o saludables?

Pendiente ...

