<a href="https://colab.research.google.com/github/DDGUZMANO/proyecto_mascotas/blob/Machine-Learning/datos_ficticios_para_proyecto_mascota.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Para generar los datos ficticios vamos a utilizar la libreria faker, esta no esta contenida en colab, por lo que tenemos que instalarla

In [1]:
!pip install faker

Collecting faker
  Downloading faker-37.0.0-py3-none-any.whl.metadata (15 kB)
Downloading faker-37.0.0-py3-none-any.whl (1.9 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.9/1.9 MB[0m [31m10.7 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: faker
Successfully installed faker-37.0.0


In [7]:
# Importar las bibliotecas necesarias para generar y manipular los datos

"""
Las librerias pandas y numpy son dos de las librerias de python más utilizadas
para la manipulación y análisis de datos. Con pandas se pueden convertir archivos
de datos, de distintos formatos en dataframe con filas y columnas para ser
manipulados, a su vez pandas tiene multiples metodos y funciones que pueden ser
aplicados a este dataframe para facilitar la escritura de codigo segun las
necesidades.
A su vez numpy es una libreria que se utiliza mas que todo para trabajar la
parte matematica de los datos, las ventajas que ofrece es que los objetos
convertidos a numpy son mas rapidos que los objetos de pandas, manejan mejor los
recursos de memoria y son mas eficientes.
"""
import pandas as pd
import numpy as np
# Faker es la biblioteca que genera datos ficticios
from faker import Faker
import random

# se crea un instacia fake de la clase importada Faker desde el modulo faker
# indicandole que trabajaremos con el idioma Español
fake = Faker('es_ES')

# de la instacia fake, con el metodo first_name() se generan 500 nombres al azar
nombres_mascotas = [fake.first_name() for _ in range(500)]

# se crea una lista con los tipos de mascotas
tipos_animales = ['Perro', 'Gato', 'Ave', 'Roedor']

# se crean listas con razas de los tipos de animales
razas_perro = ['Labrador', 'Bulldog', 'Pastor Alemán', 'Golden Retriever', 'Poodle']
razas_gato = ['Persa', 'Siamés', 'Maine Coon', 'Ragdoll', 'Bengalí']
razas_ave = ['Canario', 'Periquito', 'Cacatúa', 'Loro Gris Africano', 'Pinzón']
razas_roedor = ['Hámster', 'Cobaya', 'Conejo', 'Rata', 'Jerbo']

# luego se crean rangos de edad acordes a las edades de los tipos de animales
rangos_edad = {
    'Perro': (1, 18),
    'Gato': (1, 20),
    'Ave': (1, 15),
    'Roedor': (0.1, 2)
}

# creamos una lista con los nombres de los barrios de sevilla para emparejar
# por barrios también

barrios_sevilla = [
    'Centro', 'Triana', 'Los Remedios', 'Macarena', 'Nervión', 'San Pablo-Santa Justa',
    'Este-Alcosa-Torreblanca', 'Sur', 'Bellavista-La Palmera', 'Cerro-Amate',
    'Polígono San Pablo', 'San Jerónimo', 'Pino Montano', 'Amate', 'Bami',
    'El Plantinar', 'Huerta del Rey', 'La Cartuja', 'Padre Pío-Palmete'
]

# se crea un diccionario con los datos de las mascotas, para cada clave se
# crearan 1500 valores
datos_mascotas = {
    'nombre': random.choices(nombres_mascotas, k=1500),
    'tipo_animal': random.choices(tipos_animales, k=1500),
    'raza': [],  # Inicializamos una lista vacía para las razas
    'tamanio': random.choices(['Pequeño', 'Mediano', 'Grande'], k=1500),
    'temperamento': random.choices(['Tranquilo', 'Activo', 'Sociable', 'Nervioso'], k=1500),
    'edad': [], # inicializamos lista vacía
    'tipo_alimentacion': random.choices(['Seco', 'Húmedo', 'Mixto'], k=1500),
    'observaciones': [fake.sentence() for _ in range(1500)],
    'ubicacion': random.choices(barrios_sevilla, k=1500),'necesidades_especiales': [fake.boolean(chance_of_getting_true=25) for _ in range(1500)],
    'nivel_actividad': random.choices(['Bajo', 'Medio', 'Alto'], k=1500),
    'socializacion': random.choices(['Sociable con otros animales', 'Sociable con personas', 'No sociable'], k=1500),
    'historial_medico': [fake.sentence() for _ in range(1500)],
    'fotos': [fake.image_url() for _ in range(1500)]
}

# se crea un bucle para llenar las listas que habiamos creado vacias en el
# diccionario datos_mascotas, usamos la lista con las razas y el diccionario
# con las edades que habiamos creado antes
for animal in datos_mascotas['tipo_animal']:
    if animal == 'Perro':
        datos_mascotas['raza'].append(random.choice(razas_perro))
        datos_mascotas['edad'].append(np.random.randint(*rangos_edad['Perro']))
    elif animal == 'Gato':
        datos_mascotas['raza'].append(random.choice(razas_gato))
        datos_mascotas['edad'].append(np.random.randint(*rangos_edad['Gato']))
    elif animal == 'Ave':
        datos_mascotas['raza'].append(random.choice(razas_ave))
        datos_mascotas['edad'].append(np.random.randint(*rangos_edad['Ave']))
    elif animal == 'Roedor':
        datos_mascotas['raza'].append(random.choice(razas_roedor))
        datos_mascotas['edad'].append(round(random.uniform(*rangos_edad['Roedor']),1)) #permite numeros decimales, y redondea a un decimal.

# ya con el diccionario datos_mascotas completo, lo convertimos en un dataframe
# de pandas y creamos un json con estos datos

df_mascotas = pd.DataFrame(datos_mascotas)
df_mascotas.to_json('mascotas_1500.json', orient='records')

print("Se han generado 1500 registros de mascotas en mascotas_1500.json")


# se crea un diccionario con los datos y/o caracteristicas de los
# cuidadores
datos_cuidadores = {
    'nombre': [fake.name() for _ in range(300)],
    'experiencia': np.random.randint(1, 10, 300),
    'tipos_mascotas_aceptadas': [random.sample(
        ['Perro', 'Gato', 'Ave', 'Roedor'], k=random.randint(1, 4)) for _ in range(300)],
    'tarifas': [round(random.uniform(10, 30), 2) for _ in range(300)],
    'ubicacion': random.choices(barrios_sevilla, k=300),
    'descripcion': [fake.text(max_nb_chars=200) for _ in range(300)],
    'tamaño_mascota_aceptada': [random.choice(['Pequeño', 'Grande', 'Cualquiera']) for _ in range(300)] # Se agrega el tamaño de mascota aceptada
}

# se hace lo mismo que con las mascotas, se convierte a dataframe de pandas
# y luego a json
df_cuidadores = pd.DataFrame(datos_cuidadores)
df_cuidadores.to_json('cuidadores_300.json', orient='records')

print("Se han generado 300 registros de cuidadores en cuidadores_300.json")

Se han generado 1500 registros de mascotas en mascotas_1500.json
Se han generado 300 registros de cuidadores en cuidadores_300.json


In [8]:
df_cuidadores

Unnamed: 0,nombre,experiencia,tipos_mascotas_aceptadas,tarifas,ubicacion,descripcion,tamaño_mascota_aceptada
0,Pastora Nebot Fabra,9,[Ave],22.06,Padre Pío-Palmete,Occaecati porro incidunt dolore omnis. Volupta...,Cualquiera
1,Leonel Arias,2,"[Roedor, Ave, Perro, Gato]",26.39,Huerta del Rey,Voluptate aliquam minima debitis harum commodi...,Cualquiera
2,Benito Che Llobet Cadenas,1,"[Roedor, Ave, Perro, Gato]",18.52,Bellavista-La Palmera,Numquam ipsa facilis non. Modi ex sunt alias n...,Grande
3,Yolanda Moles Gómez,8,"[Roedor, Gato, Ave, Perro]",25.00,San Pablo-Santa Justa,Accusamus deserunt deserunt error. Velit modi ...,Grande
4,Alejandra Casado,7,"[Perro, Gato, Roedor]",24.07,Macarena,Voluptas ex laudantium iste voluptatem accusam...,Pequeño
...,...,...,...,...,...,...,...
295,Ruth Casal Jurado,9,[Gato],23.76,El Plantinar,Provident vel minima exercitationem qui iste. ...,Grande
296,María Teresa Murillo Casares,9,"[Perro, Gato, Ave]",11.07,Padre Pío-Palmete,Odit enim omnis. Qui necessitatibus animi ipsu...,Pequeño
297,Conrado Heriberto Villaverde Corominas,9,"[Roedor, Perro, Gato]",23.92,Huerta del Rey,Omnis nulla exercitationem voluptas culpa elig...,Cualquiera
298,Almudena Palmira Llopis Moreno,1,"[Roedor, Ave, Perro]",22.12,El Plantinar,Quod omnis sunt atque maxime sunt quaerat. Del...,Cualquiera


In [9]:
df_mascotas

Unnamed: 0,nombre,tipo_animal,raza,tamanio,temperamento,edad,tipo_alimentacion,observaciones,ubicacion,necesidades_especiales,nivel_actividad,socializacion,historial_medico,fotos
0,Estefanía,Gato,Persa,Pequeño,Tranquilo,10.0,Mixto,Atque voluptatum aliquam vero.,Amate,True,Medio,Sociable con otros animales,Laboriosam ea ipsa saepe quaerat voluptatum quo.,https://picsum.photos/446/315
1,Alejo,Perro,Bulldog,Grande,Sociable,16.0,Húmedo,Et rerum similique.,La Cartuja,True,Medio,Sociable con personas,Deserunt adipisci repellendus voluptates eveni...,https://dummyimage.com/911x489
2,Prudencia,Ave,Pinzón,Pequeño,Tranquilo,7.0,Húmedo,Repellendus eius ut quod.,Centro,False,Medio,No sociable,Consequuntur maiores similique incidunt officiis.,https://dummyimage.com/622x996
3,Fortunata,Gato,Ragdoll,Grande,Sociable,3.0,Mixto,Saepe ratione possimus.,Este-Alcosa-Torreblanca,False,Medio,Sociable con otros animales,Minima nobis nemo officiis maxime tempore haru...,https://picsum.photos/5/68
4,Domitila,Ave,Canario,Grande,Tranquilo,4.0,Seco,Consequuntur suscipit labore nostrum.,Nervión,False,Medio,Sociable con otros animales,Necessitatibus porro odio voluptas reprehender...,https://picsum.photos/627/480
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1495,Humberto,Roedor,Conejo,Pequeño,Tranquilo,0.1,Mixto,Pariatur porro ut rerum delectus assumenda.,Sur,False,Bajo,No sociable,Magnam eos ex velit quas necessitatibus repudi...,https://picsum.photos/417/258
1496,Antonio,Ave,Canario,Mediano,Activo,10.0,Húmedo,Reiciendis maxime ea earum reprehenderit quia.,La Cartuja,False,Bajo,Sociable con otros animales,Officia voluptate fugiat quaerat.,https://picsum.photos/863/431
1497,Eusebio,Roedor,Conejo,Pequeño,Tranquilo,1.6,Húmedo,Numquam tempore beatae quidem.,Bellavista-La Palmera,True,Alto,No sociable,Amet quae minus officiis.,https://placekitten.com/354/991
1498,Gabriela,Gato,Siamés,Pequeño,Sociable,9.0,Húmedo,Corrupti illo saepe eaque.,Amate,False,Bajo,No sociable,Autem reiciendis tenetur voluptatem.,https://picsum.photos/433/655


In [10]:
# descargar datos en formato json

from google.colab import files

files.download('mascotas_1500.json')
files.download('cuidadores_300.json')

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>