## Procesamiento Datos Pandas

Para esta prueba deberá emplear los datos del archivo candidates.csv para lo cual deberá:

1. Almanecar los datos en una base de datos. (Asegurar el almacenamiento con el tipo de dato apropiado)
2. A partir de la lectura de los datos deberá generar un procesamiento reporte.
    
    (Cree el proceso que consideré más conveniente, realizarlo lo más complejo que le sea posible)
    
3. Realizar un código de envio de correos integrado en su solución.


El archivo candidates.csv contiene 50k filas de datos sobre candidatos. Los campos que estamos usando son:
- First Name
- Last Name
- Email
- Country
- Application Date
- Yoe (years of experience)
- Seniority
- Technology
- Code Challenge Score
- Technical Interview


Unnamed: 0,First Name,Last Name,Email,Application Date,Country,YOE,Seniority,Technology,Code Challenge Score,Technical Interview Score
0,Bernadette,Langworth,leonard91@yahoo.com,2021-02-26,Norway,2,Intern,Data Engineer,3,3
1,Camryn,Reynolds,zelda56@hotmail.com,2021-09-09,Panama,10,Intern,Data Engineer,2,10
2,Larue,Spinka,okey_schultz41@gmail.com,2020-04-14,Belarus,4,Mid-Level,Client Success,10,9
3,Arch,Spinka,elvera_kulas@yahoo.com,2020-10-01,Eritrea,25,Trainee,QA Manual,7,1
4,Larue,Altenwerth,minnie.gislason@gmail.com,2020-05-20,Myanmar,13,Mid-Level,Social Media Community Management,9,7


In [2]:
import sqlite3
import pandas as pd

# Cargar los datos desde candidates.csv en un DataFrame
df = pd.read_csv(r'C:\Users\Usuario\Pictures\phyton\PRÁCTICA 5 ENTREGAR\data\src/candidates.csv')

# Crear una conexión a la base de datos SQLite y almacenar los datos
conn = sqlite3.connect('candidates.db')
df.to_sql('candidates', conn, if_exists='replace', index=False)
conn.close()


In [8]:
print(df.head())


  First Name;Last Name;Email;Application Date;Country;YOE;Seniority;Technology;Code Challenge Score;Technical Interview Score
0  Bernadette;Langworth;leonard91@yahoo.com;2021-...                                                                         
1  Camryn;Reynolds;zelda56@hotmail.com;2021-09-09...                                                                         
2  Larue;Spinka;okey_schultz41@gmail.com;2020-04-...                                                                         
3  Arch;Spinka;elvera_kulas@yahoo.com;2020-10-01;...                                                                         
4  Larue;Altenwerth;minnie.gislason@gmail.com;202...                                                                         


In [10]:
print(df.columns)


Index(['First Name;Last Name;Email;Application Date;Country;YOE;Seniority;Technology;Code Challenge Score;Technical Interview Score'], dtype='object')


In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from fpdf import FPDF

# 1. Cargar los datos desde candidates.csv en un DataFrame
df = pd.read_csv(r'C:\Users\Usuario\Pictures\phyton\PRÁCTICA 5 ENTREGAR\data\src\candidates.csv')

# 2. Análisis Exploratorio de Datos (EDA)
# Calcular estadísticas descriptivas
statistics = df.describe()

# Gráfico de barras para Seniority
plt.figure(figsize=(10, 6))
df['Seniority'].value_counts().plot(kind='bar')
plt.title('Distribución de Seniority')
plt.xlabel('Seniority')
plt.ylabel('Cantidad')
plt.savefig('seniority_distribution.png')

# Gráfico de dispersión Years of Experience vs. Code Challenge Score
plt.figure(figsize=(10, 6))
plt.scatter(df['Yoe'], df['Code Challenge Score'], alpha=0.5)
plt.title('Years of Experience vs. Code Challenge Score')
plt.xlabel('Years of Experience')
plt.ylabel('Code Challenge Score')
plt.savefig('experience_vs_score.png')

# 3. Resumen Estadístico (opcional)
# Aquí puedes calcular estadísticas adicionales según tus requisitos.

# 4. Generación de un Informe en PDF
class PDF(FPDF):
    def header(self):
        self.set_font('Arial', 'B', 12)
        self.cell(0, 10, 'Informe de Candidatos', 0, 1, 'C')

    def chapter_title(self, title):
        self.set_font('Arial', 'B', 12)
        self.cell(0, 10, title, 0, 1, 'L')
        self.ln(10)

    def chapter_body(self, body):
        self.set_font('Arial', '', 12)
        self.multi_cell(0, 10, body)
        self.ln()

pdf = PDF()
pdf.add_page()

# Agregar resumen de estadísticas
pdf.chapter_title('Resumen de Estadísticas Descriptivas')
pdf.chapter_body(statistics.to_string())

# Agregar gráfico de Seniority
pdf.image('seniority_distribution.png', x=10, y=None, w=0, h=100)
pdf.ln(100)

# Agregar gráfico de dispersión
pdf.image('experience_vs_score.png', x=10, y=None, w=0, h=100)
pdf.ln(100)

# 5. Guardar el informe en PDF
pdf_file = 'Informe_Candidatos.pdf'
pdf.output(pdf_file)

# Opcionalmente, puedes enviar el informe por correo electrónico aquí.

print(f'Informe generado y guardado como {pdf_file}.')


In [None]:
import smtplib
from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart

# Configurar la información del correo electrónico
sender_email = 'tu_email@gmail.com'
receiver_email = 'destinatario@email.com'
password = 'tu_contraseña'

# Crear el mensaje
message = MIMEMultipart()
message['From'] = sender_email
message['To'] = receiver_email
message['Subject'] = 'Informe de Candidatos'

# Agregar el cuerpo del mensaje
body = 'Adjunto se encuentra el informe de procesamiento de candidatos.'
message.attach(MIMEText(body, 'plain'))

# Adjuntar el informe (reemplaza 'nombre_del_informe.pdf' con el nombre real)
filename = 'nombre_del_informe.pdf'
attachment = open(filename, 'rb')
part = MIMEBase('application', 'octet-stream')
part.set_payload((attachment).read())
encoders.encode_base64(part)
part.add_header('Content-Disposition', "attachment; filename= %s" % filename)
message.attach(part)

# Conectar al servidor SMTP y enviar el correo
server = smtplib.SMTP('smtp.gmail.com', 587)
server.starttls()
server.login(sender_email, password)
text = message.as_string()
server.sendmail(sender_email, receiver_email, text)
server.quit()
