In [None]:
!pip install faker

Collecting faker
  Downloading Faker-33.1.0-py3-none-any.whl.metadata (15 kB)
Downloading Faker-33.1.0-py3-none-any.whl (1.9 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.9/1.9 MB[0m [31m14.8 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: faker
Successfully installed faker-33.1.0


In [None]:
import pandas as pd
import random
from faker import Faker
from datetime import datetime, timedelta, date

# Inicializar Faker
faker = Faker()

# Definir semilla para reproducibilidad
random.seed(42)

class DentalDataGenerator:
    def __init__(self, num_records=1000):
        self.num_records = num_records
        self.sedes_data = self._create_sedes_data()
        self.tratamientos_info = self._create_tratamientos_info()

        # Initialize other attributes
        self.antecedentes_lista = [
            "Diabetes Mellitus",
            "Hipertension arterial",
            "Asma",
            "Epilepsia",
            "Enfermedad cardiovascular",
            "Artritis reumatoide",
            "Problemas de tiroides",
            "Trastornos de coagulacion",
            "Hepatitis B o C",
            "VIH/SIDA",
            "Alergia a la penicilina",
            "Alergia a anestesicos locales",
            "Alergia al latex",
            "Alergia a medicamentos antiinflamatorios",
            "Alergia a alimentos o productos quimicos comunes"
        ]

        self.observaciones_por_tratamiento = {
            1: "Paciente presento sensibilidad durante el procedimiento.",
            2: "Se detecto caries profunda, tratada con exito.",
            3: "Tratamiento de conducto realizado sin complicaciones.",
            4: "Remocion de muelas del juicio completada.",
            5: "Revision general, sin hallazgos significativos.",
            6: "Blanqueamiento dental exitoso.",
            7: "Colocacion de implante completada.",
            8: "Control ortodontico realizado.",
            9: "Aplicacion de resina para sellado de fisuras.",
            10: "Tratamiento periodontal avanzado.",
            11: "Extraccion dental compleja realizada.",
            12: "Profilaxis completada, buen estado general.",
            13: "Reparacion de fractura dental.",
            14: "Diagnostico inicial de problema mandibular.",
            15: "Control postoperatorio sin complicaciones."
        }

        self.prescripciones_por_tratamiento = {
            101: "Antibiotico 500mg tomar cada 8 horas por 7 dias",
            201: "Control periodico cada 6 meses",
            301: "Enjuague bucal especial post-tratamiento",
            401: "Analgesico para dolor post-ortodoncia",
            501: "Antiinflamatorio y analgesico por 5 dias",
            601: "Kit de mantenimiento de blanqueamiento",
            701: "Antibiotico preventivo y analgesico",
            801: "Kit de cuidado ortodontico especial",
            901: "Enjuague bucal especial para encias",
            111: "Antibiotico de amplio espectro",
            121: "Kit de reconstruccion dental",
            131: "Antiseptico bucal especial",
            141: "Relajante muscular nocturno",
            151: "Enjuague periodontal especializado"
        }

    def _create_sedes_data(self):
        sedes_data = {
              "Sonrisalud Ciudad Jardin Cali": {
                "ID_Sede": 1,
                "Departamento": "Valle del Cauca",
                "Ciudad": "Cali",
                "Direccion": "Carrera 100 #16-24",
                "Telefono": "+57 602 4855997"
            },
            "Sonrisalud Av 1 Cucuta": {
                "ID_Sede": 2,
                "Departamento": "Norte de Santander",
                "Ciudad": "Cucuta",
                "Direccion": "Avenida 1 #14-56",
                "Telefono": "+57 324 412 1825"
            },
            "Sonrisalud El Cable Manizales": {
                "ID_Sede": 3,
                "Departamento": "Caldas",
                "Ciudad": "Manizales",
                "Direccion": "Carrera 23 #63-19",
                "Telefono": "+57 606 8918317"
            },
            "Sonrisalud Cra. 12 Armenia": {
                "ID_Sede": 3,
                "Departamento": "Quindio",
                "Ciudad": "Armenia",
                "Direccion": "Carrera 12 #1AN-20",
                "Telefono": "+57 606 7357309"
            },
            "Sonrisalud Carrera 5 Ibague": {
                "ID_Sede": 4,
                "Departamento": "Tolima",
                "Ciudad": "Ibague",
                "Direccion": "Carrera 5 #38-97",
                "Telefono": "+57 608 2772067"
            },
            "Sonrisalud Calle 127 frente a UNICENTRO": {
                "ID_Sede": 5,
                "Departamento": "Cundinamarca",
                "Ciudad": "Bogota",
                "Direccion": "Calle 127 #14A-44",
                "Telefono": "+57 601 7569021"
            },
            "Sonrisalud Santa Marta": {
                "ID_Sede": 6,
                "Departamento": "Magdalena",
                "Ciudad": "Santa Marta",
                "Direccion": "Carrera 32 #26B-15",
                "Telefono": "+57 605 4368211"
            },
            "Sonrisalud Castellana Monteria": {
                "ID_Sede": 7,
                "Departamento": "Cordoba",
                "Ciudad": "Monteria",
                "Direccion": "Carrera 7 #12-64",
                "Telefono": "+57 3017121040"
            },
            "Sonrisalud CC Gran Estacion Esfera": {
                "ID_Sede": 8,
                "Departamento": "Cundinamarca",
                "Ciudad": "Bogota",
                "Direccion": "Calle 26 #62-47",
                "Telefono": "+57 601 3902246"
            },
            "Sonrisalud Plaza de Narino - Pasto": {
                "ID_Sede": 9,
                "Departamento": "Narino",
                "Ciudad": "Pasto",
                "Direccion": "Calle 19 #25-47",
                "Telefono": "+57 602 73821"
            },
            "Sonrisalud Valledupar": {
                "ID_Sede": 10,
                "Departamento": "Cesar",
                "Ciudad": "Valledupar",
                "Direccion": "Calle 13A #13C-30",
                "Telefono": "+57 605 5898789"
            },
            "Sonrisalud CC Canaveral": {
                "ID_Sede": 11,
                "Departamento": "Santander",
                "Ciudad": "Floridablanca",
                "Direccion": "Calle 30 #25-71",
                "Telefono": "+57 607 6186813"
            },
            "Sonrisalud Av Circunvalar Pereira": {
                "ID_Sede": 12,
                "Departamento": "Risaralda",
                "Ciudad": "Pereira",
                "Direccion": "Carrera 15 #4-50",
                "Telefono": "+57 606 3402753"
            },
            "Sonrisalud CC. Santa Fe": {
                "ID_Sede": 13,
                "Departamento": "Cundinamarca",
                "Ciudad": "Bogota",
                "Direccion": "Calle 185 #45-03",
                "Telefono": "+57 601 7447524"
            },
            "Sonrisalud CC Diverplaza": {
                "ID_Sede": 14,
                "Departamento": "Cundinamarca",
                "Ciudad": "Bogota",
                "Direccion": "Transversal 99 · 70 A -89",
                "Telefono": "+57 601 7466802"
            },
            "Sonrisalud Cedritos": {
                "ID_Sede": 15,
                "Departamento": "Cundinamarca",
                "Ciudad": "Bogota",
                "Direccion": "Calle 140 #9-70",
                "Telefono": "+57 601 7433364"
            },
            "Sonrisalud C.C. Plaza de las Americas": {
                "ID_Sede": 16,
                "Departamento": "Cundinamarca",
                "Ciudad": "Bogota",
                "Direccion": "Carrea 71d #6-94",
                "Telefono": "+57 601 3905368"
            },
            "Sonrisalud CC Chipichape": {
                "ID_Sede": 17,
                "Departamento": "Valle del Cauca",
                "Ciudad": "Cali",
                "Direccion": "Calle 38N #6N-35",
                "Telefono": "+57 602 4863648"
            },
            "Sonrisalud Colina Cll 138": {
                "ID_Sede": 18,
                "Departamento": "Cundinamarca",
                "Ciudad": "Bogota",
                "Direccion": "Calle 138#57-83",
                "Telefono": "+57 601 7435768"
            },
            "Sonrisalud Villavicencio": {
                "ID_Sede": 19,
                "Departamento": "Meta",
                "Ciudad": "Villavicencio",
                "Direccion": "Carrera 38 #26C-32",
                "Telefono": "+57 3017121040"
            },
            "Sonrisalud CC Centro Chia": {
                "ID_Sede": 20,
                "Departamento": "Cundinamarca",
                "Ciudad": "Chia",
                "Direccion": "117-al -128 Av. Pradilla # 9- Este",
                "Telefono": "+57 601 7454387"
            },
            "Sonrisalud CC Plaza Imperial": {
                "ID_Sede": 21,
                "Departamento": "Cundinamarca",
                "Ciudad": "Bogota",
                "Direccion": "Carrera 104 #148-07",
                "Telefono": "+57 601 7455061"
            },
            "Sonrisalud Popayan": {
                "ID_Sede": 22,
                "Departamento": "Cauca",
                "Ciudad": "Popayan",
                "Direccion": "Carrera 10 #15-59",
                "Telefono": "+57 602 8368142"
            },
            "Sonrisalud Galerias Cr 24": {
                "ID_Sede": 23,
                "Departamento": "Cundinamarca",
                "Ciudad": "Bogota",
                "Direccion": "Carrera 24 #53-38",
                "Telefono": "+57 601 7436946"
            },
            "Sonrisalud CC Portal del Prado": {
                "ID_Sede": 24,
                "Departamento": "Atlantico",
                "Ciudad": "Barranquilla",
                "Direccion": "Calle 53 #46-192",
                "Telefono": "+57 605 3861191"
            },
            "Sonrisalud Fontibon Cra 1": {
                "ID_Sede": 25,
                "Departamento": "Cundinamarca",
                "Ciudad": "Bogota",
                "Direccion": "Carrera 100 #19-95",
                "Telefono": "+57 601 7457016"
            },
            "Sonrisalud CC Hayuelos": {
                "ID_Sede": 26,
                "Departamento": "Cundinamarca",
                "Ciudad": "Bogota",
                "Direccion": "Calle 20 #82-52",
                "Telefono": "+57 601 7458503"
            },
            "Sonrisalud Venecia": {
                "ID_Sede": 27,
                "Departamento": "Cundinamarca",
                "Ciudad": "Bogota",
                "Direccion": "Calle 20 #82-52",
                "Telefono": "+57 601 7467785"
            },
            "Sonrisalud Cartagena": {
                "ID_Sede": 28,
                "Departamento": "Bolivar",
                "Ciudad": "Cartagena",
                "Direccion": "Cra. 14 #35-32",
                "Telefono": "+57 324 426 0030"
            },
            "Sonrisalud Fabricato": {
                "ID_Sede": 29,
                "Departamento": "Antioquia",
                "Ciudad": "Bello",
                "Direccion": "Carrera 50 #38A-185",
                "Telefono": "+57 604 7892906"
            },
            "Sonrisalud CC Viva Tunja": {
                "ID_Sede": 30,
                "Departamento": "Boyaca",
                "Ciudad": "Tunja",
                "Direccion": "Avenida Universitaria 50-21",
                "Telefono": "+57 608 6833531"
            },
            "Sonrisalud Av. La Toma Neiva": {
                "ID_Sede": 31,
                "Departamento": "Huila",
                "Ciudad": "Neiva",
                "Direccion": "Carrera 7 #13-43",
                "Telefono": "+57 608 8632460"
            }
          }

        return sedes_data

    def _create_tratamientos_info(self):
        return [
        {"ID": 101, "Nombre": "Limpieza basica", "Descripcion": "Eliminacion de placa y sarro para prevenir caries.", "Costo": 80000},
        {"ID": 201, "Nombre": "Chequeo odontologico", "Descripcion": "Examen completo para evaluar la salud bucal.", "Costo": 60000},
        {"ID": 301, "Nombre": "Empaste dental", "Descripcion": "Relleno dental para tratar caries en estado temprano.", "Costo": 150000},
        {"ID": 401, "Nombre": "Ortodoncia correctiva", "Descripcion": "Alineacion de dientes mediante brackets o alineadores.", "Costo": 3000000},
        {"ID": 501, "Nombre": "Extraccion de cordales", "Descripcion": "Extraccion quirurgica de muelas del juicio.", "Costo": 250000},
        {"ID": 601, "Nombre": "Blanqueamiento profesional", "Descripcion": "Tratamiento cosmetico para blanquear los dientes.", "Costo": 500000},
        {"ID": 701, "Nombre": "Implante dental", "Descripcion": "Colocacion de implantes para reemplazar dientes perdidos.", "Costo": 4500000},
        {"ID": 801, "Nombre": "Tratamiento para mordida cruzada", "Descripcion": "Correccion de problemas de mordida con tecnicas especializadas.", "Costo": 2000000},
        {"ID": 901, "Nombre": "Terapia de encias", "Descripcion": "Limpieza profunda y control de enfermedades periodontales.", "Costo": 180000},
        {"ID": 101, "Nombre": "Desensibilizacion dental", "Descripcion": "Tratamiento para reducir la sensibilidad dental en zonas afectadas.", "Costo": 120000},
        {"ID": 111, "Nombre": "Endodoncia avanzada", "Descripcion": "Procedimiento avanzado para eliminar infecciones en el nervio dental.", "Costo": 350000},
        {"ID": 121, "Nombre": "Reconstruccion dental", "Descripcion": "Reparacion de fracturas dentales con materiales compuestos.", "Costo": 400000},
        {"ID": 131, "Nombre": "Colocacion de coronas", "Descripcion": "Colocacion de coronas para restaurar dientes estropeados.", "Costo": 700000},
        {"ID": 141, "Nombre": "Ferula para bruxismo", "Descripcion": "Creacion de ferulas para evitar rechinar los dientes durante el sueno.", "Costo": 250000},
        {"ID": 151, "Nombre": "Profilaxis periodontal", "Descripcion": "Limpieza y cuidado especializado para pacientes con periodontitis.", "Costo": 220000}
    ]


    def generate_sedes(self):
        sedes = []
        for nombre, info in self.sedes_data.items():
          sedes.append({
            "ID_Sede": info["ID_Sede"],  # Usar el ID definido en el diccionario
            "Nombre_Sede": nombre,
            "Direccion_Sede": info["Direccion"],
            "Telefono_Sede": info["Telefono"],
            "Correo_Sede": f"sede{info['ID_Sede']}@sonrisalud.com",  # Generar correo basado en el ID
            "Departamento": info["Departamento"],
            "Ciudad": info["Ciudad"]
          })
        return pd.DataFrame(sedes)

    def generate_odontologos(self, sedes_df):
        odontologos = []
        for i in range(1, self.num_records + 1):
            nombre = faker.name()
            correo = f"{nombre.lower().replace(' ', '.').replace('ñ', 'n')}@sonrisalud.com"

            odontologos.append({
                "ID_Odontologo": i,
                "Nombre_Odontologo": nombre,
                "Especialidad": random.choice(["Ortodoncia", "Endodoncia", "Periodoncia", "Odontologia General"]),
                "Telefono": f"3{random.randint(10, 99)}{random.randint(10000, 9999999)}",
                "Correo_Electronico": correo,
                "ID_Sede": random.choice(sedes_df['ID_Sede'].tolist())
            })
        return pd.DataFrame(odontologos)

    def generate_pacientes(self):
        pacientes = []
        for i in range(1, self.num_records + 1):
            birth_date = faker.date_of_birth(minimum_age=1, maximum_age=90)
            age = self._calculate_age(birth_date)
            category = self._categorize_age(age)
            nombre_paciente_faker = faker.name()
            correo_paciente_faker = f"{nombre_paciente_faker.lower().replace(' ', '.').replace('ñ', 'n')}@gmail.com"

            pacientes.append({
                "ID_Paciente": i,
                "Nombre_Paciente": nombre_paciente_faker,
                "Sexo_Paciente": random.choice(["Masculino", "Femenino"]),
                "Edad": age,
                "Categoria_Edad": category,
                "Direccion": f"Cra {random.randint(1, 100)} #{random.randint(1, 50)}-{random.randint(1, 100)}",
                "Estrato": random.randint(1, 6),
                "Telefono": f"3{random.randint(10, 99)}{random.randint(10000, 9999999)}",
                "Correo_Electronico": correo_paciente_faker,
                "Fecha_Nacimiento": birth_date,
                "ID_Historial_Medico": i
            })
        return pd.DataFrame(pacientes)

    def generate_citas(self, pacientes_df, odontologos_df):
        citas = []
        for i in range(1, self.num_records + 1):
            paciente = pacientes_df.iloc[random.randint(0, len(pacientes_df) - 1)]
            odontologo = odontologos_df.iloc[random.randint(0, len(odontologos_df) - 1)]

            citas.append({
                "ID_Cita": i,
                "Fecha_Cita": faker.date_time_this_year(),
                "Motivo_Cita": random.choice(["Limpieza dental", "Chequeo general", "Dolor de muelas", "Tratamiento de caries"]),
                "Estado_Cita": random.choice(["Programada", "Cancelada", "Completada"]),
                "ID_Paciente": paciente['ID_Paciente'],
                "ID_Odontologo": odontologo['ID_Odontologo']
            })
        return pd.DataFrame(citas)

    def generate_tratamientos(self, citas_df):
        tratamientos = []
        for i, cita in citas_df.iterrows():
            tratamiento = random.choice(self.tratamientos_info)
            tratamientos.append({
                "ID_Tratamiento": f"{tratamiento['ID']}_{i+1}",
                "Nombre_Tratamiento": tratamiento["Nombre"],
                "Descripcion_Tratamiento": tratamiento["Descripcion"],
                "Costo": tratamiento["Costo"],
                "ID_Cita": cita['ID_Cita']
            })
        return pd.DataFrame(tratamientos)

    def generate_facturacion(self, pacientes_df, citas_df, tratamientos_df, sedes_df):
        facturas = []
        for i in range(1, self.num_records + 1):
            cita = citas_df.iloc[i-1]
            paciente = pacientes_df[pacientes_df['ID_Paciente'] == cita['ID_Paciente']].iloc[0]
            tratamiento = tratamientos_df[tratamientos_df['ID_Cita'] == cita['ID_Cita']].iloc[0]

            # Seleccionar una sede aleatoria
            sede = sedes_df.iloc[random.randint(0, len(sedes_df) - 1)]

            facturas.append({
                "ID_Factura": i,
                "Fecha_Factura": (datetime.today() - timedelta(days=random.randint(1, 365))).strftime('%Y-%m-%d'),
                "Total": (tratamiento['Costo'] * (tratamiento['Costo']*0.19)),
                "Estado_Pago": random.choice(["Pagada", "Pendiente", "Cancelada"]),
                "ID_Paciente": paciente['ID_Paciente'],
                "ID_Cita": cita['ID_Cita'],
                "ID_Sede": sede['ID_Sede']  # Usar el ID_Sede de la sede seleccionada
            })
        return pd.DataFrame(facturas)

    def generate_historial_medico(self, pacientes_df, citas_df, tratamientos_df):
        historial = []
        for i, paciente in pacientes_df.iterrows():
            # Seleccionar una cita relacionada con este paciente
            cita_paciente = citas_df[citas_df['ID_Paciente'] == paciente['ID_Paciente']]

            if len(cita_paciente) > 0:
                cita = cita_paciente.iloc[0]
                tratamiento = tratamientos_df[tratamientos_df['ID_Cita'] == cita['ID_Cita']].iloc[0]

                # Seleccion de antecedentes
                num_antecedentes = random.randint(0, 1)
                antecedentes = random.sample(self.antecedentes_lista, num_antecedentes)

                # Obtener observacion basada en el tratamiento
                tratamiento_id = int(str(tratamiento['ID_Tratamiento']).split('_')[0])
                observacion = self.observaciones_por_tratamiento.get(tratamiento_id, "Sin observaciones adicionales.")

                historial.append({
                    "ID_Historial": i + 1,
                    "Tipo_Sangre": random.choice(["A+", "A-", "B+", "B-", "AB+", "AB-", "O+", "O-"]),
                    "Observaciones": observacion,
                    "Antecedentes_Enfermedades_Alergias": antecedentes,
                    "Estado": random.choice(["Activo", "Inactivo"]),
                    "ID_Paciente": paciente['ID_Paciente'],
                    "ID_Cita": cita['ID_Cita'],
                    "ID_Tratamiento": tratamiento['ID_Tratamiento']
                })
        return pd.DataFrame(historial)

    def generate_prescripciones(self, tratamientos_df):
        prescripciones = []
        for i, tratamiento in tratamientos_df.iterrows():
            # Extraer el ID del tratamiento original
            tratamiento_id = int(str(tratamiento['ID_Tratamiento']).split('_')[0])

            # Obtener prescripcion basada en el tratamiento
            detalle_prescripcion = self.prescripciones_por_tratamiento.get(tratamiento_id, "Prescripcion generica")

            # Calcular costo de prescripcion como porcentaje del tratamiento
            costo_prescripcion = int(tratamiento['Costo'] *(0.19))

            prescripciones.append({
                "ID_Prescripcion": i+1,
                "Fecha_Prescripcion": faker.date_between(start_date="-2y", end_date="today"),
                "Detalle_Prescripcion": detalle_prescripcion,
                "Costo_Prescripcion": costo_prescripcion,
                "ID_Tratamiento": tratamiento['ID_Tratamiento']

            })
        return pd.DataFrame(prescripciones)

    def _calculate_age(self, birth_date):
        today = date.today()
        return today.year - birth_date.year - ((today.month, today.day) < (birth_date.month, birth_date.day))

    def _categorize_age(self, age):
        if 0 <= age <= 5:
            return "Primera Infancia"
        elif 6 <= age <= 12:
            return "Infancia"
        elif 13 <= age <= 18:
            return "Adolescencia"
        elif 19 <= age <= 35:
            return "Adulto Joven"
        elif 36 <= age <= 59:
            return "Adulto Medio"
        else:
            return "Adulto Mayor"

    def generate_and_save_data(self, output_dir='./'):
        # Generar sedes primero
        sedes_df = self.generate_sedes()
        sedes_df.to_csv(f"{output_dir}sedes.csv", index=False, encoding='utf-8-sig')

        # Generar odontologos con referencias a sedes
        odontologos_df = self.generate_odontologos(sedes_df)
        odontologos_df.to_csv(f"{output_dir}odontologos.csv", index=False, encoding='utf-8-sig')

        # Generar pacientes
        pacientes_df = self.generate_pacientes()
        pacientes_df.to_csv(f"{output_dir}pacientes.csv", index=False, encoding='utf-8-sig')

        # Generar citas con referencias a pacientes y odontologos
        citas_df = self.generate_citas(pacientes_df, odontologos_df)
        citas_df.to_csv(f"{output_dir}citas.csv", index=False, encoding='utf-8-sig')

        # Generar tratamientos con referencias a citas
        tratamientos_df = self.generate_tratamientos(citas_df)
        tratamientos_df.to_csv(f"{output_dir}tratamientos.csv", index=False, encoding='utf-8-sig')

        # Generar facturacion con referencias a pacientes, citas y tratamientos
        facturacion_df = self.generate_facturacion(pacientes_df, citas_df, tratamientos_df, sedes_df)
        facturacion_df.to_csv(f"{output_dir}facturacion.csv", index=False, encoding='utf-8-sig')

        # Generar historial medico con referencias a pacientes, citas y tratamientos
        historial_medico_df = self.generate_historial_medico(pacientes_df, citas_df, tratamientos_df)
        historial_medico_df.to_csv(f"{output_dir}historial_medico.csv", index=False, encoding='utf-8-sig')

        # Generar prescripciones con referencias a tratamientos
        prescripciones_df = self.generate_prescripciones(tratamientos_df)
        prescripciones_df.to_csv(f"{output_dir}prescripciones.csv", index=False, encoding='utf-8-sig')

        print("Todos los archivos CSV generados exitosamente.")

# Uso del generador
if __name__ == "__main__":
    generator = DentalDataGenerator(num_records=1000)
    generator.generate_and_save_data()

Todos los archivos CSV generados exitosamente.
