##🐾❤️ Huellas que Encuentran Hogar: Sistema de Adopción Responsable


En México, el abandono de mascotas sigue siendo una problemática alarmante. Se estima que cada año alrededor de 500 mil animales son abandonados, y que cerca de 27 millones viven en situación de calle, lo que genera una presión constante sobre los albergues y refugios, muchos de los cuales enfrentan sobrepoblación y la devolución de mascotas previamente adoptadas.

El programa busca romper este ciclo mediante la creación de un sistema que:

Facilite la adopción consciente y disminuya las devoluciones y el abandono, reduciendo la vulnerabilidad de los animales.

Apoye a los albergues en la gestión de la información, permitiéndoles identificar tendencias y mejorar el control de su población.

De esta manera, la iniciativa pretende no solo mejorar los procesos de adopción, sino también contribuir a una adopación más responsable.

**Objetivos**:

*   Explorar y organizar la base de datos de mascotas disponibles para adopción (edad, peso, raza, color, género), con el fin de contar con información clara y accesible.

*  Apoyar la gestión de los albergues, brindando herramientas que les permitan conocer mejor la composición y dinámica de su población canina.

*   Identificar tendencias y patrones sobre las mascotas más vulnerables (por ejemplo, cuáles son más devueltas o permanecen más tiempo en adopción).

*   Reducir los índices de devolución y abandono, promoviendo la adopción consciente y de largo plazo.











# Carga de datos

In [10]:
import pandas as pd

In [15]:
df = pd.read_csv('/content/drive/MyDrive/bases de bedu/dogs_dataset.csv') #dog_dataset

In [17]:
print(df.info)

<bound method DataFrame.info of                      Breed  Age (Years)  Weight (kg)    Color  Gender
0         Airedale Terrier           13           35    White    Male
1     Jack Russell Terrier           10           43      Tan  Female
2           Dogo Argentino            2           16  Spotted  Female
3       Labrador Retriever            9           57  Bicolor    Male
4           French Bulldog           12           39  Spotted    Male
...                    ...          ...          ...      ...     ...
2995        Siberian Husky            5           25      Tan  Female
2996                Vizsla           11           34     Blue  Female
2997             Pekingese            4           49  Bicolor    Male
2998               Samoyed           13            7     Blue  Female
2999  Pembroke Welsh Corgi            7           19    White  Female

[3000 rows x 5 columns]>


# Exploración de datos

In [16]:
df.drop_duplicates()

Unnamed: 0,Breed,Age (Years),Weight (kg),Color,Gender
0,Airedale Terrier,13,35,White,Male
1,Jack Russell Terrier,10,43,Tan,Female
2,Dogo Argentino,2,16,Spotted,Female
3,Labrador Retriever,9,57,Bicolor,Male
4,French Bulldog,12,39,Spotted,Male
...,...,...,...,...,...
2995,Siberian Husky,5,25,Tan,Female
2996,Vizsla,11,34,Blue,Female
2997,Pekingese,4,49,Bicolor,Male
2998,Samoyed,13,7,Blue,Female


In [14]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [18]:

print(df.dtypes)


Breed          object
Age (Years)     int64
Weight (kg)     int64
Color          object
Gender         object
dtype: object


In [19]:
df["Breed"] = df["Breed"].astype("category")
df["Color"] = df["Color"].astype("category")
df["Gender"] = df["Gender"].astype("category")

In [20]:
Age = df['Age (Years)']

In [21]:
media = Age.mean()
mediana = Age.median()

print(f"La media de edad es: {media} años")
print(f"La mediana de edad es: {mediana} años")

La media de edad es: 7.499 años
La mediana de edad es: 8.0 años


In [22]:
Weight = df['Weight (kg)']

In [23]:
media_weight= Weight.mean()
mediana_weight = Weight.median()

print(f"La media del peso es: {media} kg")
print(f"La mediana del peso es: {mediana} kg")

La media del peso es: 7.499 kg
La mediana del peso es: 8.0 kg


In [24]:
#Filtrar a perros de razas pequeñas
raza_pequeña = df.loc[df['Weight (kg)'] <= 15]
raza_pequeña

Unnamed: 0,Breed,Age (Years),Weight (kg),Color,Gender
5,French Bulldog,9,8,Black and Tan,Female
8,Cocker Spaniel,13,5,Brindle,Male
9,Shetland Sheepdog,1,11,Cream,Female
17,German Shepherd,6,8,Gray,Female
32,Chinese Shar-Pei,10,14,Tan,Female
...,...,...,...,...,...
2983,Weimaraner,12,9,Bicolor,Male
2986,Irish Setter,1,9,Black and Tan,Female
2989,Pekingese,12,12,Black and White,Female
2990,Chihuahua,8,7,Spotted,Female


In [25]:
#Filtrar a perros de raza mediana
raza_mediana = df.loc[(df['Weight (kg)'] > 15) & (df['Weight (kg)'] <= 25)  ]
raza_mediana

Unnamed: 0,Breed,Age (Years),Weight (kg),Color,Gender
2,Dogo Argentino,2,16,Spotted,Female
13,Beagle,3,19,Black and Tan,Female
25,Bernese Mountain Dog,12,18,Gray,Male
35,Jack Russell Terrier,7,22,Tricolor,Female
40,Rottweiler,1,25,Spotted,Male
...,...,...,...,...,...
2971,Great Dane,2,17,Cream,Female
2979,Papillon,14,16,Cream,Female
2985,Boxer,4,22,Bicolor,Female
2995,Siberian Husky,5,25,Tan,Female


In [26]:
#Filtrar a perros de raza grande
raza_grande = df.loc[df['Weight (kg)'] > 25  ]

raza_grande

Unnamed: 0,Breed,Age (Years),Weight (kg),Color,Gender
0,Airedale Terrier,13,35,White,Male
1,Jack Russell Terrier,10,43,Tan,Female
3,Labrador Retriever,9,57,Bicolor,Male
4,French Bulldog,12,39,Spotted,Male
6,Bull Terrier,7,54,Red,Female
...,...,...,...,...,...
2992,Shih Tzu,2,39,Brown,Male
2993,Boxer,7,38,Bicolor,Female
2994,Irish Setter,13,48,Spotted,Female
2996,Vizsla,11,34,Blue,Female


In [27]:
# Perros de más de 10 años y que pesen menos de 15 kg (Peso ligero) ideales para personas mayores que buscan compañía tranquila
perros_senior= df[
    (df['Age (Years)'] > 10) &
    (df['Weight (kg)'] < 15)
]
perros_senior

Unnamed: 0,Breed,Age (Years),Weight (kg),Color,Gender
8,Cocker Spaniel,13,5,Brindle,Male
49,Boxer,11,12,Merle,Male
50,Shiba Inu,13,14,Brown,Female
51,Schnauzer,14,11,Cream,Female
64,Poodle,12,13,Tricolor,Female
...,...,...,...,...,...
2942,Dogo Argentino,12,7,Blue,Male
2973,Chihuahua,14,7,Tan,Female
2983,Weimaraner,12,9,Bicolor,Male
2989,Pekingese,12,12,Black and White,Female


In [28]:
# Cachorros
cachorros= df[df['Age (Years)'] <= 2]
cachorros

Unnamed: 0,Breed,Age (Years),Weight (kg),Color,Gender
2,Dogo Argentino,2,16,Spotted,Female
7,Boxer,1,47,Black,Female
9,Shetland Sheepdog,1,11,Cream,Female
14,Maltese,2,57,Spotted,Male
19,Bull Terrier,2,35,Blue,Male
...,...,...,...,...,...
2971,Great Dane,2,17,Cream,Female
2975,Irish Setter,2,28,Merle,Female
2982,Miniature Schnauzer,1,58,Brown,Female
2986,Irish Setter,1,9,Black and Tan,Female


# Limpieza

In [29]:
from google.colab import files
uploaded = files.upload()

Saving dogs_dataset.csv to dogs_dataset.csv


In [30]:
# Cargar el CSV que subiste
import pandas as pd
df = pd.read_csv("dogs_dataset.csv")

# Verificar que se cargó bien
print("Tamaño de la base:", df.shape)
display(df.head())

Tamaño de la base: (3000, 5)


Unnamed: 0,Breed,Age (Years),Weight (kg),Color,Gender
0,Airedale Terrier,13,35,White,Male
1,Jack Russell Terrier,10,43,Tan,Female
2,Dogo Argentino,2,16,Spotted,Female
3,Labrador Retriever,9,57,Bicolor,Male
4,French Bulldog,12,39,Spotted,Male


In [31]:
# Contar cuántas filas duplicadas hay
print("Duplicados encontrados:", df.duplicated().sum())

Duplicados encontrados: 5


In [32]:
# Eliminar duplicados
df = df.drop_duplicates()
print("Tamaño después de eliminar duplicados:", df.shape)

Tamaño después de eliminar duplicados: (2995, 5)


In [33]:
# Revisar valores faltantes
print("\nValores faltantes por columna:")
print(df.isnull().sum())


Valores faltantes por columna:
Breed          0
Age (Years)    0
Weight (kg)    0
Color          0
Gender         0
dtype: int64


In [34]:
# Eliminar filas con valores nulos
df = df.dropna()
print("Tamaño después de eliminar nulos:", df.shape)


Tamaño después de eliminar nulos: (2995, 5)


In [35]:
# Verificar tipos de datos de cada columna
print("\nTipos de datos:")
print(df.dtypes)


Tipos de datos:
Breed          object
Age (Years)     int64
Weight (kg)     int64
Color          object
Gender         object
dtype: object


In [36]:
# Limpiar texto en columnas categóricas
df['Gender'] = df['Gender'].str.strip().str.capitalize()
df['Color'] = df['Color'].str.strip().str.capitalize()
df['Breed'] = df['Breed'].str.strip().str.title()

In [37]:
df = df[(df['Age (Years)'] > 0) & (df['Age (Years)'] < 25)]
df = df[(df['Weight (kg)'] > 0) & (df['Weight (kg)'] < 120)]

In [38]:
df['Age (Years)'] = df['Age (Years)'].astype(int)
df['Weight (kg)'] = df['Weight (kg)'].astype(int)
df['Gender'] = df['Gender'].astype('category')
df['Color'] = df['Color'].astype('category')
df['Breed'] = df['Breed'].astype('category')

In [39]:
!pip install numpy



## Transformación de datos

In [40]:
# Identificación de etapa de vida canina
df['Age_Group'] = pd.cut(df['Age (Years)'],
                         bins=[0, 2, 7, 25],
                         labels=['Cachorro', 'Adulto', 'Senior'])
print(df[['Breed','Age (Years)','Age_Group']].head(10))
print("Distribución por etapa de vida:")
print(df['Age_Group'].value_counts())

                  Breed  Age (Years) Age_Group
0      Airedale Terrier           13    Senior
1  Jack Russell Terrier           10    Senior
2        Dogo Argentino            2  Cachorro
3    Labrador Retriever            9    Senior
4        French Bulldog           12    Senior
5        French Bulldog            9    Senior
6          Bull Terrier            7    Adulto
7                 Boxer            1  Cachorro
8        Cocker Spaniel           13    Senior
9     Shetland Sheepdog            1  Cachorro
Distribución por etapa de vida:
Age_Group
Senior      1498
Adulto      1067
Cachorro     430
Name: count, dtype: int64


In [41]:
# Tamaño
df['Size'] = pd.cut(df['Weight (kg)'],
                    bins=[0, 15, 25, 120],
                    labels=['Pequeño', 'Mediano', 'Grande'])
print(df[['Breed','Weight (kg)','Size']].head(10))
print("\nDistribución por tamaño:")
print(df['Size'].value_counts())

                  Breed  Weight (kg)     Size
0      Airedale Terrier           35   Grande
1  Jack Russell Terrier           43   Grande
2        Dogo Argentino           16  Mediano
3    Labrador Retriever           57   Grande
4        French Bulldog           39   Grande
5        French Bulldog            8  Pequeño
6          Bull Terrier           54   Grande
7                 Boxer           47   Grande
8        Cocker Spaniel            5  Pequeño
9     Shetland Sheepdog           11  Pequeño

Distribución por tamaño:
Size
Grande     1891
Pequeño     587
Mediano     517
Name: count, dtype: int64


In [42]:

# Riesgo de salud
braquicefalicos = {
    'Bulldog Inglés','Bulldog Francés','Pug','Shih Tzu',
    'Boston Terrier','Pekinés','Boxer'
}
razas_grandes_articulares = {
    'Pastor Alemán','San Bernardo','Mastín','Rottweiler',
    'Labrador Retriever','Golden Retriever','Gran Danés'
}

def infer_health_risk(breed):
    if pd.isna(breed):
        return 'General'
    b = str(breed).strip().title()
    if b in braquicefalicos:
        return 'Respiratorio'
    if b in razas_grandes_articulares:
        return 'Articular'
    return 'General'

if 'Health_Risk' not in df.columns:
    df['Health_Risk'] = df['Breed'].apply(infer_health_risk)
print(df['Health_Risk'].value_counts())


Health_Risk
General         2560
Respiratorio     222
Articular        213
Name: count, dtype: int64


In [43]:
# Requiere cuidados especiales
def needs_special_care(row):
    if row['Age_Group'] == 'Senior':
        return 'Sí'
    if str(row['Health_Risk']) in ['Respiratorio','Articular']:
        return 'Sí'
    return 'No'

df['Special_Care'] = df.apply(needs_special_care, axis=1)

print(df[['Breed','Age_Group','Size','Health_Risk','Special_Care']].head())

                  Breed Age_Group     Size Health_Risk Special_Care
0      Airedale Terrier    Senior   Grande     General           Sí
1  Jack Russell Terrier    Senior   Grande     General           Sí
2        Dogo Argentino  Cachorro  Mediano     General           No
3    Labrador Retriever    Senior   Grande   Articular           Sí
4        French Bulldog    Senior   Grande     General           Sí


In [44]:
# Índice de Adoptabilidad
def low_adoptability_score(row):
    score = 0

    # Edad: los cachorros son más adoptables, los seniors menos
    if row['Age_Group'] == 'Senior':
        score += 2
    elif row['Age_Group'] == 'Adulto':
        score += 1
    # Cachorro no suma porque son los más adoptables

    # Tamaño: perros grandes suelen ser más difíciles de adoptar
    if row['Size'] == 'Grande':
        score += 2
    elif row['Size'] == 'Mediano':
        score += 1
    # Pequeños no suman

    # Riesgo de salud: respiratorio/articular suelen desalentar adopciones
    if str(row['Health_Risk']) == 'Respiratorio':
        score += 2
    elif str(row['Health_Risk']) == 'Articular':
        score += 1

    return score

# Aplicar el índice
df['Adoptability_Score'] = df.apply(low_adoptability_score, axis=1)

# Clasificación en tres categorías
def score_to_level(s):
    if s >= 5:
        return 'Baja Adoptabilidad'   # difícil de adoptar
    elif s >= 3:
        return 'Media Adoptabilidad'  # nivel intermedio / normal
    else:
        return 'Alta Adoptabilidad'   # más fáciles de adoptar

df['Adoptability'] = df['Adoptability_Score'].apply(score_to_level)

# Imprimir resumen
print("Distribución por nivel de adoptabilidad:")
print(df['Adoptability'].value_counts())

# Ver algunos ejemplos
print("\nEjemplo de perros con índice de adoptabilidad:")
print(df[['Breed','Age_Group','Size','Health_Risk','Adoptability']].head(10))

Distribución por nivel de adoptabilidad:
Adoptability
Media Adoptabilidad    1817
Alta Adoptabilidad      979
Baja Adoptabilidad      199
Name: count, dtype: int64

Ejemplo de perros con índice de adoptabilidad:
                  Breed Age_Group     Size   Health_Risk         Adoptability
0      Airedale Terrier    Senior   Grande       General  Media Adoptabilidad
1  Jack Russell Terrier    Senior   Grande       General  Media Adoptabilidad
2        Dogo Argentino  Cachorro  Mediano       General   Alta Adoptabilidad
3    Labrador Retriever    Senior   Grande     Articular   Baja Adoptabilidad
4        French Bulldog    Senior   Grande       General  Media Adoptabilidad
5        French Bulldog    Senior  Pequeño       General   Alta Adoptabilidad
6          Bull Terrier    Adulto   Grande       General  Media Adoptabilidad
7                 Boxer  Cachorro   Grande  Respiratorio  Media Adoptabilidad
8        Cocker Spaniel    Senior  Pequeño       General   Alta Adoptabilidad
9     Sh

# Orden de datos

In [45]:
# Primero definimos el orden personalizado
adopt_order = {'Baja': 0, 'Media': 1, 'Alta': 2}
age_order = {'Senior': 0, 'Adulto': 1, 'Cachorro': 2}
size_order = {'Grande': 0, 'Mediano': 1, 'Pequeño': 2}
health_order = {'Respiratorio': 0, 'Articular': 1, 'General': 2}

# Creamos columnas auxiliares con esos órdenes
df['Adopt_Order'] = df['Adoptability_Score'].map(adopt_order)
df['Age_Order'] = df['Age_Group'].map(age_order)
df['Size_Order'] = df['Size'].map(size_order)
df['Health_Order'] = df['Health_Risk'].map(health_order)

# Ordenamos según los 4 criterios

df_sorted = df.sort_values(
    by=['Adopt_Order', 'Age_Order', 'Size_Order', 'Health_Order'],
    ascending=[True, True, True, True]
)

# Eliminamos las columnas auxiliares si no las quieres ver

df_sorted = df_sorted.drop(
    columns=['Adopt_Order', 'Age_Order', 'Size_Order', 'Health_Order']
)

# Imprimir primeras filas del dataset ordenado
print("\n Primeros 15 perros ordenados por riesgo de no ser adoptados ")
print(df_sorted[['Breed','Age (Years)','Age_Group','Size','Health_Risk','Adoptability_Score']].head(15))

# Cruce múltiple: Edad x Tamaño x Riesgo de Salud vs Adaptabilidad
cross_table = pd.crosstab(
    [df['Age_Group'], df['Size'], df['Health_Risk']],
    df['Adoptability'],
    rownames=['Edad', 'Tamaño', 'Riesgo de Salud'],
    colnames=['Nivel de Adoptabilidad'],
    margins=True
)

print(cross_table)





 Primeros 15 perros ordenados por riesgo de no ser adoptados 
                   Breed  Age (Years) Age_Group     Size   Health_Risk  \
622             Shih Tzu            1  Cachorro  Pequeño  Respiratorio   
882       Boston Terrier            2  Cachorro  Pequeño  Respiratorio   
1039                 Pug            1  Cachorro  Pequeño  Respiratorio   
1595                 Pug            1  Cachorro  Pequeño  Respiratorio   
1599                 Pug            1  Cachorro  Pequeño  Respiratorio   
2798                 Pug            2  Cachorro  Pequeño  Respiratorio   
382           Rottweiler            2  Cachorro  Pequeño     Articular   
580           Rottweiler            1  Cachorro  Pequeño     Articular   
739           Rottweiler            1  Cachorro  Pequeño     Articular   
975   Labrador Retriever            2  Cachorro  Pequeño     Articular   
1123          Rottweiler            1  Cachorro  Pequeño     Articular   
2225    Golden Retriever            2  Cachorro  

In [86]:
#Distirbución final

print("Distribución final")
print("-"*50)

# Se cuentan grupos por edad
conteo_edad = df['Age_Group'].value_counts()
total = len(df)

print("Porcerntaje por edad:")
for grupo in conteo_edad.index:
    cantidad = conteo_edad[grupo]
    porcentaje = (cantidad / total * 100)
    print(f"   {grupo}: {porcentaje}%")

# Se cuentan total de perror por tamaño
conteo_tamaño = df['Size'].value_counts()

print("Porcentaje por tamaño:")
for tamaño in conteo_tamaño.index:
    cantidad = conteo_tamaño[tamaño]
    porcentaje = (cantidad / total * 100)
    print(f"   {tamaño}: {porcentaje}%")

# Conteo de perros dependiendo de su estado de salud
conteo_salud = df['Health_Risk'].value_counts()

print("Porcentaje de salud:")
for riesgo in conteo_salud.index:
    cantidad = conteo_salud[riesgo]
    porcentaje = (cantidad / total * 100)
    print(f"   {riesgo}: {porcentaje}%")

# Adoptabilidad

print("Resultados adoptabilidad")
print("-"*50)

conteo_adoptabilidad = df['Adoptability'].value_counts()

print("Porcentajes del nivel de adoptabilidad:")
for nivel in conteo_adoptabilidad.index:
    cantidad = conteo_adoptabilidad[nivel]
    porcentaje = (cantidad / total * 100).round(1)
    print(f"   {nivel}: {cantidad} perros ({porcentaje}%)")

# Casos críticos

print("Casos críticos")
print("-"*60)

# Filtro para perros con Baja Adoptabilidad
perros_criticos = df[df['Adoptability'] == 'Baja Adoptabilidad']

print(f" Total de casos críticos: {len(perros_criticos)}\n")

# Senior, Size Grande y problemas articulares
s1 = perros_criticos[
    (perros_criticos['Age_Group'] == 'Senior') &
    (perros_criticos['Size'] == 'Grande') &
    (perros_criticos['Health_Risk'] == 'Articular')
]
print(f" Seniors grandes con problemas articulares: {len(s1)} casos")

#Senior, size grande y problemas respiratorios
s2 = perros_criticos[
    (perros_criticos['Age_Group'] == 'Senior') &
    (perros_criticos['Size'] == 'Grande') &
    (perros_criticos['Health_Risk'] == 'Respiratorio')
]
print(f"Seniors grandes con problemas respiratorios: {len(s2)} casos")

# Adulto, Grande y con problemas articulares
s3 = perros_criticos[
    (perros_criticos['Age_Group'] == 'Adulto') &
    (perros_criticos['Size'] == 'Grande') &
    (perros_criticos['Health_Risk'] == 'Articular')
]
print(f" Adultos grandes con problemas articulares: {len(s3)} casos")

# Algunos perros en riesgo
print("Algunos perros con baja adoptabilidad:")
ejemplos = perros_criticos[['Breed', 'Age_Group', 'Size', 'Health_Risk', 'Adoptability']].head(10)
print(ejemplos.to_string(index=False))



#hipótesis 1
seniors = df[df['Age_Group'] == 'Senior']
total_seniors = len(seniors)


seniors_media = seniors[seniors['Adoptability'] == 'Media Adoptabilidad']
seniors_baja = seniors[seniors['Adoptability'] == 'Baja Adoptabilidad']

seniors_media_baja = len(seniors_media) + len(seniors_baja)

# Cálculo el porcentaje
porcentaje_seniors = (seniors_media_baja / total_seniors) * 100

print(f"Porcentaje de senior en media o alta adoptabilidad {porcentaje_seniors}")



cachorros_pequenos = df[
    (df['Age_Group'] == 'Cachorro') &
    (df['Size'] == 'Pequeño')
]
cachorros_alta = cachorros_pequenos[
    cachorros_pequenos['Adoptability'] == 'Alta Adoptabilidad'
]
porcentaje_h3 = len(cachorros_alta) / len(cachorros_pequenos) * 100
porcentaje_h3 = round(porcentaje_h3, 1)

print(f" {porcentaje_h3}% de cachorros pequeños en alta adoptabilidad")


print( "-"*50)
print("Resumen")


print(f"Total de perros analizados: {total}")
print(f"Perros en situación crítica: {len(perros_criticos)} ({(len(perros_criticos)/total*100)}%)")
print(f"Perros con buenas posibilidades: {total - len(perros_criticos)} ({((total-len(perros_criticos))/total*100)}%)")




Distribución final
--------------------------------------------------
Porcerntaje por edad:
   Senior: 50.016694490818026%
   Adulto: 35.62604340567613%
   Cachorro: 14.357262103505844%
Porcentaje por tamaño:
   Grande: 63.138564273789655%
   Pequeño: 19.59933222036728%
   Mediano: 17.262103505843072%
Porcentaje de salud:
   General: 85.47579298831386%
   Respiratorio: 7.412353923205342%
   Articular: 7.111853088480801%
Resultados adoptabilidad
--------------------------------------------------
Porcentajes del nivel de adoptabilidad:
   Media Adoptabilidad: 1817 perros (60.7%)
   Alta Adoptabilidad: 979 perros (32.7%)
   Baja Adoptabilidad: 199 perros (6.6%)
Casos críticos
------------------------------------------------------------
 Total de casos críticos: 199

 Seniors grandes con problemas articulares: 61 casos
Seniors grandes con problemas respiratorios: 74 casos
 Adultos grandes con problemas articulares: 0 casos
Algunos perros con baja adoptabilidad:
             Breed Age_Group