In [None]:
import pandas as pd
import numpy as np
import psycopg2 as ps

In [None]:
df_cursos = pd.read_csv('../data_clean/cursos_final.csv', sep=';')
df_leads = pd.read_csv('../data_clean/leads_final.csv', sep=';')
df_contacto = pd.read_csv('../data_clean/primer_contacto_final.csv', sep=';')
df_seguimiento = pd.read_csv('../data_clean/seguimiento_final.csv', sep=';')
df_tecnologias = pd.read_csv('../data_clean/tecnologias_final.csv', sep=';')


In [None]:
conn = ps.connect(
    dbname="Leads",
    user="my_user",
    password="admin",
    host="localhost",
    port="5432"
)

In [None]:
cur = conn.cursor()

In [None]:
cur.execute("SELECT version();")
cur.fetchone()

In [None]:
d_insert_tecnologias = []

In [None]:
for i, row in df_tecnologias.iterrows():
    tecnologia_id = int(row['tecnologia_id'])
    nombre = row['nombre']

    d_insert_tecnologias.append((tecnologia_id,nombre))


In [None]:
query_tecnologias = """
    INSERT INTO tecnologias (tecnologia_id,nombre)
    VALUES (%s, %s)
"""

In [None]:
cur.executemany(query_tecnologias, d_insert_tecnologias)
conn.commit()

In [None]:
cur.execute("SELECT setval('tecnologias_tecnologia_id_seq', (SELECT MAX(tecnologia_id) FROM tecnologias));")
conn.commit()

In [None]:
d_insert_cursos = []

In [None]:
for i, row in df_cursos.iterrows():
    curso_id = (row['curso_id'])
    nombre = row['nombre']
    modalidad = row['modalidad'] if pd.notna(row['modalidad']) else None
    duracion_meses = int(row['duracion_meses']) if pd.notna(row['duracion_meses']) else None
    horas_totales = int(row['horas_totales']) if pd.notna(row['horas_totales']) else None
    precio_base = float(row['precio_base']) if pd.notna(row['precio_base']) else None
    precio_descuento = float(row['precio_descuento']) if pd.notna(row['precio_descuento']) else None
    nivel = row['nivel'] if pd.notna(row['nivel']) else None
    requisitos_previos = row['requisitos_previos'] if pd.notna(row['requisitos_previos']) else None
    fecha_inicio_proxima = pd.to_datetime(row['fecha_inicio_proxima']).date() if pd.notna(row['fecha_inicio_proxima']) else None
    plazas_disponibles = int(row['plazas_disponibles']) if pd.notna(row['plazas_disponibles']) else None
    rating = float(row['rating']) if pd.notna(row['rating']) else None
    empleabilidad = float(row['empleabilidad']) if pd.notna(row['empleabilidad']) else None
    url_dossier = row['url_dossier'] if pd.notna(row['url_dossier']) else None
    descripcion = row['descripcion'] if pd.notna(row['descripcion']) else None
    certificacion_oficial = bool(row['certificacion_oficial']) if pd.notna(row['certificacion_oficial']) else False

    d_insert_cursos.append((
        curso_id, nombre, modalidad, duracion_meses, horas_totales, precio_base, 
        precio_descuento, nivel, requisitos_previos, fecha_inicio_proxima, 
        plazas_disponibles, rating, empleabilidad, url_dossier, descripcion, 
        certificacion_oficial
    ))

In [None]:
query_cursos= """
INSERT INTO cursos (curso_id, nombre, modalidad, duracion_meses, horas_totales,
precio_base, precio_descuento, nivel, requisitos_previos,
fecha_inicio_proxima, plazas_disponibles, rating, empleabilidad,
url_dossier, descripcion, certificacion_oficial)
VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s)
"""

In [None]:
cur.executemany(query_cursos, d_insert_cursos)
conn.commit()

In [None]:
d_insert_leads = []

for i, row in df_leads.iterrows():
    lead_id = int(row['lead_id']) if pd.notna(row['lead_id']) else None
    curso_interes_id = int(row['curso_interes_id']) if pd.notna(row['curso_interes_id']) else None
    curso_interes_nombre = row['curso_interes_nombre'] if pd.notna(row['curso_interes_nombre']) else None
    fecha_registro = pd.to_datetime(row['fecha_registro']).date() if pd.notna(row['fecha_registro']) else None
    fuente = row['fuente'] if pd.notna(row['fuente']) else None
    campana = row['campana'] if pd.notna(row['campana']) else None
    nombre = row['nombre'] if pd.notna(row['nombre']) else None
    apellidos = row['apellidos'] if pd.notna(row['apellidos']) else None
    email = row['email'] if pd.notna(row['email']) else None
    telefono = row['telefono'] if pd.notna(row['telefono']) else None
    edad = int(row['edad']) if pd.notna(row['edad']) else None
    ciudad = row['ciudad'] if pd.notna(row['ciudad']) else None
    provincia = row['provincia'] if pd.notna(row['provincia']) else None
    nivel_estudios = row['nivel_estudios'] if pd.notna(row['nivel_estudios']) else None
    situacion_laboral = row['situacion_laboral'] if pd.notna(row['situacion_laboral']) else None
    objetivo_profesional = row['objetivo_profesional'] if pd.notna(row['objetivo_profesional']) else None
    presupuesto_estimado = float(row['presupuesto_estimado']) if pd.notna(row['presupuesto_estimado']) else None
    urgencia_formacion = row['urgencia_formacion'] if pd.notna(row['urgencia_formacion']) else None
    dispositivo_registro = row['dispositivo_registro'] if pd.notna(row['dispositivo_registro']) else None
    horario_preferido = row['horario_preferido'] if pd.notna(row['horario_preferido']) else None
    modalidad_preferida = row['modalidad_preferida'] if pd.notna(row['modalidad_preferida']) else None
    comercial_asignado = row['comercial_asignado'] if pd.notna(row['comercial_asignado']) else None
    lead_score = float(row['lead_score']) if pd.notna(row['lead_score']) else None

    d_insert_leads.append((
        lead_id, curso_interes_id, curso_interes_nombre, fecha_registro, fuente, campana,
        nombre, apellidos, email, telefono, edad, ciudad, provincia, nivel_estudios,
        situacion_laboral, objetivo_profesional, presupuesto_estimado, urgencia_formacion,
        dispositivo_registro, horario_preferido, modalidad_preferida, comercial_asignado, lead_score
    ))

query_leads = """
INSERT INTO leads (lead_id, curso_interes_id, curso_interes_nombre, fecha_registro, fuente, campana,
nombre, apellidos, email, telefono, edad, ciudad, provincia, nivel_estudios,
situacion_laboral, objetivo_profesional, presupuesto_estimado, urgencia_formacion,
dispositivo_registro, horario_preferido, modalidad_preferida, comercial_asignado, lead_score)
VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s)
ON CONFLICT (email) DO NOTHING

"""
cur.executemany(query_leads, d_insert_leads)
conn.commit()

In [None]:
d_insert_contactos = []

for i, row in df_contacto.iterrows():
    contacto_id = int(row['contacto_id']) if pd.notna(row['contacto_id']) else None
    lead_id = int(row['lead_id']) if pd.notna(row['lead_id']) else None
    fecha_contacto = pd.to_datetime(row['fecha_contacto']).date() if pd.notna(row['fecha_contacto']) else None
    hora_contacto = pd.to_datetime(row['hora_contacto']).time() if pd.notna(row['hora_contacto']) else None
    medio_contacto = row['medio_contacto'] if pd.notna(row['medio_contacto']) else None
    comercial = row['comercial'] if pd.notna(row['comercial']) else None
    estado_contacto = row['estado_contacto'] if pd.notna(row['estado_contacto']) else None
    duracion_contacto_min = int(row['duracion_contacto_min']) if pd.notna(row['duracion_contacto_min']) else None
    nivel_interes = row['nivel_interes'] if pd.notna(row['nivel_interes']) else None
    objeciones_principales = row['objeciones_principales'] if pd.notna(row['objeciones_principales']) else None
    notas_adicionales = row['notas_adicionales'] if pd.notna(row['notas_adicionales']) else None
    interes_otros_cursos = bool(row['interes_otros_cursos']) if pd.notna(row['interes_otros_cursos']) else False
    areas_interes_adicional = row['areas_interes_adicional'] if pd.notna(row['areas_interes_adicional']) else None
    presupuesto_confirmado = float(row['presupuesto_confirmado']) if pd.notna(row['presupuesto_confirmado']) else None
    preferencia_fecha_inicio = pd.to_datetime(row['preferencia_fecha_inicio']).date() if pd.notna(row['preferencia_fecha_inicio']) else None
    preferencia_financiacion = row['preferencia_financiacion'] if pd.notna(row['preferencia_financiacion']) else None
    disponibilidad_horaria_detallada = row['disponibilidad_horaria_detallada'] if pd.notna(row['disponibilidad_horaria_detallada']) else None
    conocimiento_competencia = row['conocimiento_competencia'] if pd.notna(row['conocimiento_competencia']) else None
    referenciado_por = row['referenciado_por'] if pd.notna(row['referenciado_por']) else None
    proxima_accion = row['proxima_accion'] if pd.notna(row['proxima_accion']) else None
    fecha_proxima_accion = pd.to_datetime(row['fecha_proxima_accion']).date() if pd.notna(row['fecha_proxima_accion']) else None

    d_insert_contactos.append((
        contacto_id, lead_id, fecha_contacto, hora_contacto, medio_contacto, comercial,
        estado_contacto, duracion_contacto_min, nivel_interes, objeciones_principales,
        notas_adicionales, interes_otros_cursos, areas_interes_adicional, presupuesto_confirmado,
        preferencia_fecha_inicio, preferencia_financiacion, disponibilidad_horaria_detallada,
        conocimiento_competencia, referenciado_por, proxima_accion, fecha_proxima_accion
    ))

query_contactos = """
INSERT INTO contactos (contacto_id, lead_id, fecha_contacto, hora_contacto, medio_contacto, comercial,
estado_contacto, duracion_contacto_min, nivel_interes, objeciones_principales,
notas_adicionales, interes_otros_cursos, areas_interes_adicional, presupuesto_confirmado,
preferencia_fecha_inicio, preferencia_financiacion, disponibilidad_horaria_detallada,
conocimiento_competencia, referenciado_por, proxima_accion, fecha_proxima_accion)
VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s)
"""

cur.executemany(query_contactos, d_insert_contactos)
conn.commit()

In [None]:
d_insert_seguimientos = []

for i, row in df_seguimiento.iterrows():
    seguimiento_id = int(row['seguimiento_id']) if pd.notna(row['seguimiento_id']) else None
    lead_id = int(row['lead_id']) if pd.notna(row['lead_id']) else None
    contacto_id = int(row['contacto_id']) if pd.notna(row['contacto_id']) else None
    curso_final_id = int(row['curso_final_id']) if pd.notna(row['curso_final_id']) else None
    curso_final_nombre = row['curso_final_nombre'] if pd.notna(row['curso_final_nombre']) else None
    comercial = row['comercial'] if pd.notna(row['comercial']) else None
    closer = row['closer'] if pd.notna(row['closer']) else None
    num_interacciones = int(row['num_interacciones']) if pd.notna(row['num_interacciones']) else None
    fecha_ultima_interaccion = pd.to_datetime(row['fecha_ultima_interaccion']).date() if pd.notna(row['fecha_ultima_interaccion']) else None
    tipo_ultima_interaccion = row['tipo_ultima_interaccion'] if pd.notna(row['tipo_ultima_interaccion']) else None
    duracion_proceso_dias = int(row['duracion_proceso_dias']) if pd.notna(row['duracion_proceso_dias']) else None
    estado_final = row['estado_final'] if pd.notna(row['estado_final']) else None
    conversion = bool(row['conversion']) if pd.notna(row['conversion']) else False
    cambio_curso = bool(row['cambio_curso']) if pd.notna(row['cambio_curso']) else False
    descuento_aplicado = float(row['descuento_aplicado']) if pd.notna(row['descuento_aplicado']) else None
    promocion_aplicada = row['promocion_aplicada'] if pd.notna(row['promocion_aplicada']) else None
    precio_final = float(row['precio_final']) if pd.notna(row['precio_final']) else None
    metodo_pago = row['metodo_pago'] if pd.notna(row['metodo_pago']) else None
    financiacion = row['financiacion'] if pd.notna(row['financiacion']) else None
    modalidad_final = row['modalidad_final'] if pd.notna(row['modalidad_final']) else None
    fecha_matricula = pd.to_datetime(row['fecha_matricula']).date() if pd.notna(row['fecha_matricula']) else None
    fecha_inicio_curso = pd.to_datetime(row['fecha_inicio_curso']).date() if pd.notna(row['fecha_inicio_curso']) else None
    motivo_no_conversion = row['motivo_no_conversion'] if pd.notna(row['motivo_no_conversion']) else None
    probabilidad_retorno = row['probabilidad_retorno'] if pd.notna(row['probabilidad_retorno']) else None
    valoracion_experiencia = int(row['valoracion_experiencia']) if pd.notna(row['valoracion_experiencia']) else None
    feedback_proceso = row['feedback_proceso'] if pd.notna(row['feedback_proceso']) else None

    d_insert_seguimientos.append((
        seguimiento_id, lead_id, contacto_id, curso_final_id, curso_final_nombre, comercial,
        closer, num_interacciones, fecha_ultima_interaccion, tipo_ultima_interaccion,
        duracion_proceso_dias, estado_final, conversion, cambio_curso, descuento_aplicado,
        promocion_aplicada, precio_final, metodo_pago, financiacion, modalidad_final,
        fecha_matricula, fecha_inicio_curso, motivo_no_conversion, probabilidad_retorno,
        valoracion_experiencia, feedback_proceso
    ))

query_seguimientos = """
INSERT INTO seguimientos (seguimiento_id, lead_id, contacto_id, curso_final_id, curso_final_nombre, comercial,
closer, num_interacciones, fecha_ultima_interaccion, tipo_ultima_interaccion,
duracion_proceso_dias, estado_final, conversion, cambio_curso, descuento_aplicado,
promocion_aplicada, precio_final, metodo_pago, financiacion, modalidad_final,
fecha_matricula, fecha_inicio_curso, motivo_no_conversion, probabilidad_retorno,
valoracion_experiencia, feedback_proceso)
VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s)
"""

cur.executemany(query_seguimientos, d_insert_seguimientos)
conn.commit()

In [None]:
cur.close()
conn.close()