# Análisis de Personas Registradas
Este notebook presenta un análisis visual de los datos proporcionados sobre personas registradas.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt


# Cargar datos
df = pd.read_excel("personas_registradas.xlsx")

# Extraer dominio de correo
df['Dominio_Correo'] = df['Correo'].str.extract(r'@([\w\.-]+)')
df['Tipo_Correo'] = df['Dominio_Correo'].apply(lambda x: 'Institucional' if 'edu' in str(x) else 'Personal')

df.head()

Unnamed: 0,#,Nombres,Apellidos,Celular,Correo,Institución,Dominio_Correo,Tipo_Correo
0,1,Jhon,Orellana,986462209,xavierpu120@gmail.com,Herlinda Toral,gmail.com,Personal
1,2,Jordy,Morocho,979242639,jordy@gmail.com,Herlinda Toral,gmail.com,Personal
2,3,Nathalia,Baculima,968070301,baculimanathalia@gmail.com,Octavio,gmail.com,Personal
3,4,Leslie,Urgilés,997552748,nf521651@gmail.com,Herlinda Toral,gmail.com,Personal
4,5,Dennise,Calle,992138232,calledenise034@gmail.com,Herlinda Toral,gmail.com,Personal


## Registros por Institución

In [None]:
instituciones = df['Institución'].value_counts()
instituciones.plot(kind='bar', figsize=(10,6), color='skyblue')
plt.title('Registros por Institución')
plt.xlabel('Institución')
plt.ylabel('Cantidad de Personas')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

## Distribución por Dominio de Correo

In [None]:
dominios = df['Dominio_Correo'].value_counts()
dominios.head(5).plot(kind='pie', autopct='%1.1f%%', figsize=(6,6), shadow=True)
plt.title('Distribución de Dominios de Correo (Top 5)')
plt.ylabel('')
plt.show()

## Top 10 Nombres más Comunes

In [None]:
nombres = df['Nombres'].value_counts().head(10)
nombres.plot(kind='barh', color='lightgreen')
plt.title('Top 10 Nombres más Comunes')
plt.xlabel('Frecuencia')
plt.gca().invert_yaxis()
plt.tight_layout()
plt.show()

## Comparación de Tipo de Correo por Institución

In [None]:
agrupado = df.groupby(['Institución', 'Tipo_Correo']).size().unstack().fillna(0)
agrupado.plot(kind='bar', stacked=False, figsize=(10,6))
plt.title('Tipo de Correo por Institución')
plt.ylabel('Cantidad')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()