# 🐾 Análisis de Datos del Refugio de Animales de Austin

Este notebook tiene como objetivo explorar y analizar un conjunto de datos reales del **Austin Animal Center**, el refugio de animales más grande de los Estados Unidos con política *no-kill*. Este centro recibe más de 18.000 animales por año y participa en iniciativas para la protección y el cuidado de animales abandonados, en riesgo o entregados.

Los datos proporcionados por la **Iniciativa de Datos Abiertos de la Ciudad de Austin** incluyen información sobre los resultados (adopciones, traslados, liberaciones, pérdidas, etc.) de animales desde octubre de 2013 hasta la actualidad.

En este análisis trabajaremos con la biblioteca **pandas** para limpiar, transformar y visualizar la información con fines exploratorios.

📁 Dataset: `aac_shelter_cat_outcome_eng.csv`


In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Cargar datos
df = pd.read_csv("aac_shelter_cat_outcome_eng.csv")
df.head()

## 🔍 Exploración inicial del dataset

In [None]:
df.info()

In [None]:
df.describe(include='all')

## ❓ Revisión de valores faltantes

In [None]:
df.isna().sum().sort_values(ascending=False)

## 🧼 Limpieza básica de datos

In [None]:
# Eliminar columnas poco informativas si las hubiera
df = df.drop(columns=["Unnamed: 0"], errors="ignore")

# Renombrar columnas para mayor claridad
df = df.rename(columns={
    "animal_id": "ID",
    "name": "Nombre",
    "date_of_birth": "FechaNacimiento",
    "outcome_type": "TipoResultado",
    "outcome_subtype": "SubtipoResultado",
    "animal_type": "TipoAnimal",
    "sex_upon_outcome": "Sexo",
    "age_upon_outcome": "Edad",
    "breed": "Raza",
    "color": "Color"
})

df.head()

## 📊 Distribución de resultados de los animales

In [None]:
plt.figure(figsize=(10,5))
sns.countplot(data=df, x='TipoResultado', order=df['TipoResultado'].value_counts().index, palette='viridis')
plt.title("Distribución de resultados")
plt.ylabel("Cantidad")
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

## 🐱🐶 ¿Qué tipo de animales se registran con más frecuencia?

In [None]:
sns.countplot(data=df, x='TipoAnimal', palette='Set2')
plt.title("Distribución por tipo de animal")
plt.ylabel("Cantidad")
plt.tight_layout()
plt.show()

## ⚥ Relación entre el sexo y el resultado del animal

In [None]:
pd.crosstab(df['Sexo'], df['TipoResultado'], normalize='index').plot(kind='barh', stacked=True, colormap='Accent')
plt.title("Proporción de resultados por sexo")
plt.xlabel("Proporción")
plt.tight_layout()
plt.show()

## ⌛ ¿Qué edades tienen los animales al momento del resultado?

In [None]:
df['Edad'].value_counts().head(10).plot(kind='bar', color='coral')
plt.title("Edades más comunes al momento del resultado")
plt.ylabel("Cantidad")
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

## 🧪 Actividades prácticas y desafíos

A continuación se presentan algunos ejercicios para que pongas en práctica lo aprendido y explores más a fondo el dataset:

1. **Filtrar por especie:** Mostrá sólo los registros correspondientes a gatos (`Cat`). ¿Cuántos hay en total?

2. **Top razas:** ¿Cuáles son las 5 razas más comunes en el dataset? Representalo en un gráfico de barras.

3. **Animales con nombre:** ¿Qué proporción de animales tiene nombre? Representalo con un gráfico de torta.

4. **Resultados por raza dominante:** Analizá si hay razas que tienen mayores tasas de adopción. Filtrá las 10 razas más frecuentes y compará los resultados.

5. **Edad más común:** ¿Cuál es la edad al momento del resultado más frecuente para los animales adoptados?

6. **Nombres más comunes:** ¿Cuáles son los 10 nombres de animales más comunes en el dataset?

7. **Cruza o no cruza:** Agregá una nueva columna que indique si el animal es de raza pura o mestizo, en base a la columna de raza (`Raza`).

8. **Tendencia de adopciones:** Convertí la columna de fecha de nacimiento a datetime y tratá de analizar si hay alguna relación entre el año de nacimiento y la probabilidad de adopción.

9. **Relación entre edad y resultado:** Explorá si existe una diferencia en el tipo de resultado según la edad del animal.

10. **Exportar datos filtrados:** Filtrá los animales que fueron adoptados y guardalos en un nuevo archivo CSV llamado `adoptados.csv`.

---

> 💡 ¡Podés utilizar todas las herramientas de pandas que practicamos: filtros, agrupaciones, gráficos, funciones lambda, creación de columnas nuevas y más!
