#  An√°lisis de Encuesta ‚Äì Limpieza y Procesamiento Inicial

Este notebook realiza el tratamiento inicial de una base de datos de encuestas, donde se analizan variables tipo Likert y categ√≥ricas. El objetivo es preparar los datos para an√°lisis exploratorio y visualizaciones.

---

##  1. Carga de datos y librer√≠as


In [8]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt



df_original = pd.read_excel("Prueba Tecnica Analista de Datos.xlsx", header=1)

df_original.head(10)

Unnamed: 0,# participante,Estado de la participaci√≥n,Nivel general de satisfaccion,Eje 1- Organizacional,Orgullo por trabajar en la empresa,Recomendaci√≥n,Beneficios,Bienestar,Balance,La empresa demuestra sensibilidad con las particularidades de la vida personal de sus empleados,...,Depresi√≥n Alg√∫n amigo cercano?,"27. Los trastornos de ANSIEDAD son estados en los que se experimentan sentimientos de miedo, temor o inquietud que no desaparecen y van empeorando con el tiempo, de tal forma que interfieren con la vida cotidiana, en las relaciones interpersonales, el trabajo o en estudio. Sus s√≠ntomas son sensaci√≥n de peligro inminente, p√°nico o cat√°strofe, latidos card√≠acos fuertes o r√°pidos, mareos, respiraci√≥n acelerada, sudoraci√≥n, temblores, problemas para concentrarse o para pensar en algo diferente al tema de preocupaci√≥n, problemas gastrointestinales y problemas para conciliar el sue√±o. Teniendo en cuenta la descripci√≥n anterior, ¬øQu√© tan probable cree que est√© padeciendo ANSIEDAD",Ansiedad Usted?,Ansiedad Alg√∫n familiar cercano?,Ansiedad Alg√∫n amigo cercano?,28. Modalidad de trabajo,29. Antig√ºedad en la organizaci√≥n,30. Tipo de contrato,31. Ciudad / Regi√≥n donde labora,32. Area en la que labora
0,Participante 1,Participaci√≥n completa,9,,4,3,3,4,3,3,...,1.0,,3.0,1.0,1.0,Fuera de la casa (oficina o calle),Entre 1 y 5 a√±os,T√©rmino Indefinido,,Administrativo
1,Participante 2,Participaci√≥n completa,8,,4,3,2,4,3,3,...,3.0,,3.0,1.0,3.0,Fuera de la casa (oficina o calle),Entre 1 y 5 a√±os,T√©rmino Indefinido,,Sede externa
2,Participante 3,ha participado pero todav√≠a no ha conclu√≠do,9,,4,4,3,2,4,4,...,,,,,,,,,,
3,Participante 4,Participaci√≥n completa,10,,4,4,4,4,4,4,...,2.0,,1.0,1.0,1.0,Fuera de la casa (oficina o calle),Entre 6 y 10 a√±os,T√©rmino Indefinido,,Lideres
4,Participante 5,Participaci√≥n completa,10,,4,4,4,4,4,4,...,1.0,,1.0,1.0,1.0,Fuera de la casa (oficina o calle),Entre 6 y 10 a√±os,T√©rmino Indefinido,,Cartera
5,Participante 6,Participaci√≥n completa,8,,4,3,2,2,3,4,...,3.0,,4.0,2.0,2.0,Fuera de la casa (oficina o calle),Entre 1 y 5 a√±os,T√©rmino Indefinido,,Sede externa
6,Participante 7,ha participado pero todav√≠a no ha conclu√≠do,10,,4,4,4,4,3,4,...,3.0,,3.0,3.0,3.0,En casa,M√°s de 20 a√±os,T√©rmino Indefinido,,Financiero
7,Participante 8,Participaci√≥n completa,10,,4,4,4,3,4,4,...,2.0,,2.0,2.0,2.0,Fuera de la casa (oficina o calle),Entre 1 y 5 a√±os,T√©rmino Indefinido,,Proyectos
8,Participante 9,Participaci√≥n completa,8,,3,3,3,4,3,3,...,2.0,,2.0,3.0,2.0,Mixto (en casa y fuera de la casa),Entre 1 y 5 a√±os,T√©rmino Indefinido,,Coordinaci√≥n Administrativa
9,Participante 10,Participaci√≥n completa,10,,4,4,3,3,4,4,...,3.0,,2.0,2.0,2.0,Mixto (en casa y fuera de la casa),M√°s de 20 a√±os,T√©rmino Indefinido,,Administrativo


---

##  2. Limpieza inicial: columnas y filas

Se eliminan columnas vac√≠as, se renombran variables a formato limpio  y se filtran respuestas incompletas.


In [9]:
df = df_original.copy()

df.dropna(axis=1, how='all', inplace=True)

df.columns = (
    df.columns.astype(str)
    .str.strip()
    .str.lower()
    .str.replace(r"^\d+\._*", "", regex=True)  
    .str.replace(" ", "_")
    .str.replace("¬ø", "")
    .str.replace("?", "")
    .str.replace("/", "_")
    .str.replace("__", "_")
    .str.replace(r"^_", "", regex=True)  
)

df.drop(columns=["ciudad__regi√≥n_donde_labora"], inplace=True)

df.reset_index(drop=True, inplace=True)

df = df[df["estado_de_la_participaci√≥n"] != "ha participado pero todav√≠a no ha conclu√≠do"]


print("Tama√±o final del DataFrame:", df.shape)


Tama√±o final del DataFrame: (215, 55)


In [10]:
print("Columnas del DataFrame:")

for i, col in enumerate(df.columns):
    print(f"{i+1:>2}. {col}")

Columnas del DataFrame:
 1. #_participante
 2. estado_de_la_participaci√≥n
 3. nivel_general_de_satisfaccion
 4. orgullo_por_trabajar_en_la_empresa
 5. recomendaci√≥n
 6. beneficios
 7. bienestar
 8. balance
 9. la_empresa_demuestra_sensibilidad_con_las_particularidades_de_la_vida_personal_de_sus_empleados
10. recursos
11. informaci√≥n
12. cargo
13. formacion
14. entrenamiento_cargo
15. evaluacion
16. comunicacion_con_otras_√°reas
17. comunicaci√≥n_con_el_jefe
18. trabajo_en_equipo_con_otras_√°reas
19. trabajo_ene_quipo_con_mi_√°rea
20. lideres_que_inspiran
21. lideres_que_forman
22. g√©nero
23. estado_civil
24. a√±o_de_nacimiento
25. nivel_de_estudios
26. tipo_de_vivienda_donde_habita
27. cu√°ntos_hijos__hijas_tiene
28. indique_el_rango_de_edad_de_su_primer_hijo_a
29. indique_el_rango_de_edad_de_su_segundo_hijo_a
30. indique_el_rango_de_edad_de_su_tercer_hijo_a
31. indique_el_rango_de_edad_de_su_cuarto_hijo_a
32. indique_el_rango_de_edad_de_su_quinto_hijo_a
33. formaci√≥n_t√©cnica_tec

---

##  3. Tratamiento de variables tipo Likert (1 a 10)

Estas variables son respuestas ordinales (pero tratadas como num√©ricas) utilizadas para medir percepciones, satisfacci√≥n, emociones, etc.


In [11]:
df_numeric = df.copy()  # se crea una copia para evitar modificar el original
df_numeric_test = df_numeric.apply(pd.to_numeric, errors='coerce')

likely_likert_cols = []
for col in df_numeric_test.columns:
    col_vals = df_numeric_test[col].dropna().unique()
    if len(col_vals) > 0 and np.all((col_vals >= 1) & (col_vals <= 10)):
        likely_likert_cols.append(col)

df[likely_likert_cols] = df[likely_likert_cols].apply(pd.to_numeric, errors='coerce').astype("Int64")

print("Resumen estad√≠stico:")
df[likely_likert_cols].describe()


Resumen estad√≠stico:


Unnamed: 0,nivel_general_de_satisfaccion,orgullo_por_trabajar_en_la_empresa,recomendaci√≥n,beneficios,bienestar,balance,la_empresa_demuestra_sensibilidad_con_las_particularidades_de_la_vida_personal_de_sus_empleados,recursos,informaci√≥n,cargo,...,perro,p√°jaro,pez,otro,depresi√≥n_usted,depresi√≥n_alg√∫n_familiar_cercano,depresi√≥n_alg√∫n_amigo_cercano,ansiedad_usted,ansiedad_alg√∫n_familiar_cercano,ansiedad_alg√∫n_amigo_cercano
count,215.0,215.0,215.0,215.0,215.0,215.0,215.0,215.0,215.0,215.0,...,93.0,6.0,2.0,1.0,215.0,215.0,215.0,215.0,215.0,215.0
mean,9.213953,3.813953,3.725581,3.367442,3.32093,3.288372,3.646512,3.702326,3.525581,3.306977,...,1.0,1.0,1.0,1.0,1.906977,2.134884,2.186047,2.069767,2.055814,2.083721
std,1.164422,0.413319,0.467691,0.662663,0.738955,0.670196,0.534488,0.497418,0.586488,0.784605,...,0.0,0.0,0.0,,0.896878,0.929999,0.943641,0.94709,0.9103,0.958223
min,2.0,2.0,2.0,1.0,1.0,2.0,1.0,2.0,2.0,1.0,...,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0
25%,9.0,4.0,3.0,3.0,3.0,3.0,3.0,3.0,3.0,3.0,...,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0,1.0
50%,10.0,4.0,4.0,3.0,3.0,3.0,4.0,4.0,4.0,3.0,...,1.0,1.0,1.0,1.0,2.0,2.0,2.0,2.0,2.0,2.0
75%,10.0,4.0,4.0,4.0,4.0,4.0,4.0,4.0,4.0,4.0,...,1.0,1.0,1.0,1.0,3.0,3.0,3.0,3.0,3.0,3.0
max,10.0,4.0,4.0,4.0,4.0,4.0,4.0,4.0,4.0,4.0,...,1.0,1.0,1.0,1.0,4.0,4.0,4.0,4.0,4.0,4.0


---

##  4. Limpieza de variables categ√≥ricas

Se estandariza texto (min√∫sculas, sin espacios extra) y se identifican valores nulos. Las categor√≠as se dejan en texto para an√°lisis posterior o visualizaci√≥n.


In [12]:
categorical_cols = df.select_dtypes(include="object").columns.tolist()

df[categorical_cols] = df[categorical_cols].apply(lambda col: col.str.strip().str.lower())

categorical_summary = {col: df[col].value_counts(dropna=False) for col in categorical_cols}

categorical_nulls = df[categorical_cols].isnull().sum().sort_values(ascending=False)

pd.DataFrame({
    "columna": categorical_nulls.index,
    "valores_nulos": categorical_nulls.values
})

Unnamed: 0,columna,valores_nulos
0,indique_el_rango_de_edad_de_su_quinto_hijo_a,214
1,indique_el_rango_de_edad_de_su_cuarto_hijo_a,206
2,indique_el_rango_de_edad_de_su_tercer_hijo_a,191
3,indique_el_rango_de_edad_de_su_segundo_hijo_a,130
4,indique_el_rango_de_edad_de_su_primer_hijo_a,73
5,#_participante,0
6,g√©nero,0
7,estado_de_la_participaci√≥n,0
8,tipo_de_vivienda_donde_habita,0
9,nivel_de_estudios,0


---

##  5. Agrupaci√≥n de bloques tem√°ticos


Las variables fueron **agrupadas por bloques tem√°ticos**, lo que facilita futuros an√°lisis, tanto en Python como en Power BI:

- **Informaci√≥n personal**: edad, g√©nero, estado civil, n√∫mero de hijos
- **Inter√©s en formaci√≥n**: formaci√≥n t√©cnica, idiomas, desarrollo personal, etc.
- **Mascotas**: tipo de mascota (o ninguna)
- **Salud mental**: niveles de ansiedad y depresi√≥n (autoevaluaci√≥n, familia, amigos)
- **Datos laborales**: modalidad de trabajo, tipo de contrato, √°rea, antig√ºedad
- **Satisfacci√≥n general**: nivel general de satisfacci√≥n
- **Ejes de percepci√≥n**:
  - Eje 1: Organizacional (beneficios, orgullo, balance vida-trabajo‚Ä¶)
  - Eje 2: Cargo (recursos, formaci√≥n, evaluaci√≥n‚Ä¶)
  - Eje 3: Liderazgo (comunicaci√≥n, inspiraci√≥n, trabajo en equipo‚Ä¶)

Esta estructura tem√°tica permitir√° realizar an√°lisis comparativos, construir visualizaciones agrupadas y aplicar modelos m√°s f√°cilmente.

In [13]:
# 1. Informaci√≥n general del participante
cols_info_general = [
    "#_participante", "estado_de_la_participaci√≥n", "g√©nero", "estado_civil",
    "a√±o_de_nacimiento", "nivel_de_estudios", "tipo_de_vivienda_donde_habita",
    "cu√°ntos_hijos__hijas_tiene",
    "indique_el_rango_de_edad_de_su_primer_hijo_a", "indique_el_rango_de_edad_de_su_segundo_hijo_a",
    "indique_el_rango_de_edad_de_su_tercer_hijo_a", "indique_el_rango_de_edad_de_su_cuarto_hijo_a",
    "indique_el_rango_de_edad_de_su_quinto_hijo_a"
]

# 2. Inter√©s en formaci√≥n
cols_intereses_formativos = [
    "formaci√≥n_t√©cnica_tecnol√≥gica", "formaci√≥n_profesional_(pregrado_posgrado)", "idiomas",
    "habilidades_b√°sicas_(excel,_power_point,_computaci√≥n)", "desarrollo_personal",
    "formaci√≥n_art√≠stica", "formaci√≥n_para_emprendedores"
]

# 3. Mascotas
cols_mascotas = ["no_tengo_mascotas", "gato", "perro", "p√°jaro", "pez", "otro"]

# 4. Salud mental (Depresi√≥n y Ansiedad)
cols_salud_mental = [
    "depresi√≥n_usted", "depresi√≥n_alg√∫n_familiar_cercano", "depresi√≥n_alg√∫n_amigo_cercano",
    "ansiedad_usted", "ansiedad_alg√∫n_familiar_cercano", "ansiedad_alg√∫n_amigo_cercano"
]

# 5. Datos laborales
cols_laborales = [
    "modalidad_de_trabajo", "antig√ºedad_en_la_organizaci√≥n", "tipo_de_contrato", "area_en_la_que_labora"
]

# 6. Evaluaci√≥n general
cols_satisfaccion = ["nivel_general_de_satisfaccion"]

# 7. Eje 1 - Organizacional
cols_eje_1 = [
    "orgullo_por_trabajar_en_la_empresa", "recomendaci√≥n", "beneficios", "bienestar",
    "balance", "la_empresa_demuestra_sensibilidad_con_las_particularidades_de_la_vida_personal_de_sus_empleados"
]

# 8. Eje 2 - Cargo
cols_eje_2 = ["recursos", "informaci√≥n", "cargo", "formacion", "entrenamiento_cargo", "evaluacion"]

# 9. Eje 3 - Liderazgo
cols_eje_3 = [
    "comunicacion_con_otras_√°reas", "comunicaci√≥n_con_el_jefe", "trabajo_en_equipo_con_otras_√°reas",
    "trabajo_ene_quipo_con_mi_√°rea", "lideres_que_inspiran", "lideres_que_forman"
]

# üß© Reordenar DataFrame final
final_column_order = (
    cols_info_general +
    cols_intereses_formativos +
    cols_mascotas +
    cols_salud_mental +
    cols_laborales +
    cols_satisfaccion +
    cols_eje_1 +
    cols_eje_2 +
    cols_eje_3
)

df = df[final_column_order]


---

## 5. Estado final del DataFrame

Dataset **listo para an√°lisis exploratorio** o para ser exportado a Power BI:

- ‚úÖ Columnas limpias y con nombres uniformes (min√∫sculas, sin tildes ni s√≠mbolos)
- ‚úÖ Se eliminaron columnas completamente vac√≠as y filas con registros incompletos
- ‚úÖ Las **variables tipo Likert** (1 a 10) fueron identificadas y convertidas a tipo entero
- ‚úÖ Las **variables categ√≥ricas** fueron normalizadas (minusculizadas y sin espacios)
- ‚úÖ Se elimin√≥ la columna de ubicaci√≥n (`ciudad__regi√≥n_donde_labora`) por ser completamente nula



---

##  6. Exportaci√≥n del DataFrame final

Una vez realizada toda la limpieza, transformaci√≥n y agrupaci√≥n de columnas tem√°ticas, podemos exportar el DataFrame listo para an√°lisis en Power BI u otras herramientas.

Usamos `to_excel()` para guardar el archivo en formato `.xlsx`:

In [14]:
# Exportar el DataFrame limpio a un archivo Excel 

df.to_excel("datos_limpios_para_powerbi.xlsx", index=False)
print("‚úÖ Archivo exportado exitosamente: datos_limpios_para_powerbi.xlsx")

‚úÖ Archivo exportado exitosamente: datos_limpios_para_powerbi.xlsx


---

##  7. An√°lisis exploratorio simple

En esta secci√≥n se realiza una primera exploraci√≥n del dataset para comprender mejor la distribuci√≥n de los datos y posibles relaciones entre variables.

###  Estad√≠sticas descriptivas de variables tipo Likert

In [15]:
df.info()

<class 'pandas.core.frame.DataFrame'>
Index: 215 entries, 0 to 229
Data columns (total 55 columns):
 #   Column                                                                                           Non-Null Count  Dtype 
---  ------                                                                                           --------------  ----- 
 0   #_participante                                                                                   215 non-null    object
 1   estado_de_la_participaci√≥n                                                                       215 non-null    object
 2   g√©nero                                                                                           215 non-null    object
 3   estado_civil                                                                                     215 non-null    object
 4   a√±o_de_nacimiento                                                                                215 non-null    object
 5   nivel_de_estudios

In [16]:
# Estad√≠sticas descriptivas b√°sicas
df[likely_likert_cols].describe().T.round(2)

Unnamed: 0,count,mean,std,min,25%,50%,75%,max
nivel_general_de_satisfaccion,215.0,9.21,1.16,2.0,9.0,10.0,10.0,10.0
orgullo_por_trabajar_en_la_empresa,215.0,3.81,0.41,2.0,4.0,4.0,4.0,4.0
recomendaci√≥n,215.0,3.73,0.47,2.0,3.0,4.0,4.0,4.0
beneficios,215.0,3.37,0.66,1.0,3.0,3.0,4.0,4.0
bienestar,215.0,3.32,0.74,1.0,3.0,3.0,4.0,4.0
balance,215.0,3.29,0.67,2.0,3.0,3.0,4.0,4.0
la_empresa_demuestra_sensibilidad_con_las_particularidades_de_la_vida_personal_de_sus_empleados,215.0,3.65,0.53,1.0,3.0,4.0,4.0,4.0
recursos,215.0,3.7,0.5,2.0,3.0,4.0,4.0,4.0
informaci√≥n,215.0,3.53,0.59,2.0,3.0,4.0,4.0,4.0
cargo,215.0,3.31,0.78,1.0,3.0,3.0,4.0,4.0


In [17]:
for col in categorical_cols:
    print(f"üß© {col}")
    print(df[col].value_counts(dropna=False), "\n")

üß© #_participante
#_participante
participante 1      1
participante 2      1
participante 4      1
participante 5      1
participante 6      1
                   ..
participante 225    1
participante 226    1
participante 227    1
participante 228    1
participante 230    1
Name: count, Length: 215, dtype: int64 

üß© estado_de_la_participaci√≥n
estado_de_la_participaci√≥n
participaci√≥n completa    215
Name: count, dtype: int64 

üß© g√©nero
g√©nero
femenino     142
masculino     73
Name: count, dtype: int64 

üß© estado_civil
estado_civil
soltero (a)                      108
uni√≥n libre                       57
casado (a)                        37
separado (a) / divorciado (a)     11
viudo (a)                          2
Name: count, dtype: int64 

üß© a√±o_de_nacimiento
a√±o_de_nacimiento
entre 1982 y 1994    81
entre 1965 y 1981    79
despu√©s de 1995      46
antes de 1964         9
Name: count, dtype: int64 

üß© nivel_de_estudios
nivel_de_estudios
profesional              

In [18]:
correlation_matrix = df[likely_likert_cols].corr()
correlation_matrix

Unnamed: 0,nivel_general_de_satisfaccion,orgullo_por_trabajar_en_la_empresa,recomendaci√≥n,beneficios,bienestar,balance,la_empresa_demuestra_sensibilidad_con_las_particularidades_de_la_vida_personal_de_sus_empleados,recursos,informaci√≥n,cargo,...,perro,p√°jaro,pez,otro,depresi√≥n_usted,depresi√≥n_alg√∫n_familiar_cercano,depresi√≥n_alg√∫n_amigo_cercano,ansiedad_usted,ansiedad_alg√∫n_familiar_cercano,ansiedad_alg√∫n_amigo_cercano
nivel_general_de_satisfaccion,1.0,0.325828,0.33999,0.400285,0.180502,0.219964,0.392384,0.296031,0.251964,0.214201,...,,,,,-0.132986,-0.005198,0.027396,-0.055971,0.019541,-0.078949
orgullo_por_trabajar_en_la_empresa,0.325828,1.0,0.556556,0.421371,0.227005,0.295803,0.483558,0.433965,0.328159,0.277802,...,,,,,-0.147751,0.041276,0.053218,-0.038311,0.064988,0.015915
recomendaci√≥n,0.33999,0.556556,1.0,0.477647,0.215456,0.283464,0.582192,0.470773,0.357914,0.357983,...,,,,,-0.228245,0.074755,0.073871,-0.178116,0.069072,0.082786
beneficios,0.400285,0.421371,0.477647,1.0,0.41651,0.360043,0.47398,0.375911,0.402539,0.312308,...,,,,,-0.240995,0.025357,0.024678,-0.167614,-0.010917,-0.048673
bienestar,0.180502,0.227005,0.215456,0.41651,1.0,0.293467,0.229416,0.273831,0.245133,0.288686,...,,,,,0.024104,0.093107,0.074806,0.088042,0.084395,0.074066
balance,0.219964,0.295803,0.283464,0.360043,0.293467,1.0,0.351125,0.328786,0.207025,0.399605,...,,,,,-0.102871,0.004777,-0.092618,-0.098102,-0.034165,-0.154192
la_empresa_demuestra_sensibilidad_con_las_particularidades_de_la_vida_personal_de_sus_empleados,0.392384,0.483558,0.582192,0.47398,0.229416,0.351125,1.0,0.410876,0.371842,0.304537,...,,,,,-0.24438,0.030564,0.001293,-0.052596,0.079157,-0.051433
recursos,0.296031,0.433965,0.470773,0.375911,0.273831,0.328786,0.410876,1.0,0.538797,0.414833,...,,,,,-0.146155,0.046795,0.018985,-0.104497,-0.004416,0.013315
informaci√≥n,0.251964,0.328159,0.357914,0.402539,0.245133,0.207025,0.371842,0.538797,1.0,0.40936,...,,,,,-0.208663,-0.044909,-0.050857,-0.1168,-0.028945,-0.028774
cargo,0.214201,0.277802,0.357983,0.312308,0.288686,0.399605,0.304537,0.414833,0.40936,1.0,...,,,,,-0.165086,-0.005779,-0.001761,-0.066687,0.021697,0.02781



## 8. Preguntas 

En esta secci√≥n se da respuesta a las preguntas planteadas en la prueba t√©cnica 

####	¬øQu√© hallazgos relevantes encuentras en los datos?


El conjunto de datos entregado contiene informaci√≥n clave sobre la percepci√≥n de los empleados en m√∫ltiples dimensiones organizacionales, combinando variables num√©ricas y categ√≥ricas relacionadas con aspectos demogr√°ficos, laborales y emocionales. Este tipo de datos me permiti√≥ comprender en profundidad la experiencia del empleado en √°reas como el liderazgo, el entorno de trabajo, las oportunidades de formaci√≥n y la percepci√≥n del bienestar emocional.

Como parte del tratamiento inicial, identifique que exist√≠an aproximadamente 15 registros de empleados cuyo estado era "ha participado pero todav√≠a no ha concluido", as√≠ como columnas irrelevantes o vac√≠as que no aportaban valor anal√≠tico, de tal manera que fueron descartadas, garantizando as√≠ la integridad y claridad del conjunto de datos. Realic√© adem√°s una verificaci√≥n y clasificaci√≥n de las variables seg√∫n su tipo (categ√≥ricas o num√©ricas) para aplicar el tratamiento adecuado a cada una. Adicionalmente, organic√© las columnas en ejes tem√°ticos relevantes. Esta clasificaci√≥n me permiti√≥ analizar el dataset de manera l√≥gica y orientada a presentar resultados estructurados y que facilitaran la identificaci√≥n de patrones significativos y su impacto sobre el nivel de satisfacci√≥n con la empresa. Como resultado del tratamiento inicial le di forma a una base de datos m√°s limpia, √≥ptima para su an√°lisis visual en Power BI.

A partir del an√°lisis realizado, identifique varios hallazgos relevantes. En primer lugar, una alta satisfacci√≥n general, con un promedio de 9,2, lo que muestra un ambiente laboral muy positivo. Respecto a la modalidad de trabajo, no hubo diferencias significativas.

En relaci√≥n con el tipo de contrato, los empleados con contratos a t√©rmino fijo o indefinido presentan mayores niveles de satisfacci√≥n, mientras que los temporales y aprendices muestran niveles inferiores. En cuanto a la salud mental, el 25,58‚ÄØ% de los empleados report√≥ niveles de depresi√≥n superiores o iguales a 3 (en una escala de 1 a 5), y un 32,56‚ÄØ% indic√≥ niveles de ansiedad superiores o iguales a 3, lo que evidencia posibles riesgos emocionales dentro del entorno laboral.

El perfil general de los participantes muestra predominancia de personas nacidas entre 1982 y 1994, mayor proporci√≥n de mujeres, y niveles educativos principalmente profesionales o t√©cnicos/tecn√≥logos. Adem√°s, una parte significativa tiene hijos y trabaja en el √°rea administrativa o externa.

Finalmente, en cuanto a intereses de aprendizaje, se identific√≥ como preferencia principal el desarrollo personal. La opci√≥n con menor inter√©s fue la formaci√≥n t√©cnica/tecnol√≥gica, con diferencias notables seg√∫n el nivel de escolaridad y la antig√ºedad del empleado.


####	¬øQu√© visualizaciones propones para presentar esta informaci√≥n?


Con el objetivo de presentar los resultados de manera clara, comprensible y orientada a la toma de decisiones, propongo el uso de visualizaciones simples e intuitivas que faciliten al cliente la interpretaci√≥n de los hallazgos. Gr√°ficas b√°sicas pero efectivas, permiten resaltar de forma visual los aspectos m√°s relevantes del an√°lisis sin recurrir a explicaciones t√©cnicas complejas.

El uso de elementos como indicadores, gr√°ficas de barras, gr√°ficos circulares, tarjetas informativas y filtros interactivos permite estructurar la informaci√≥n de forma accesible, favoreciendo una narrativa visual que gu√≠e al cliente en la comprensi√≥n de los datos. 


#### 	¬øCu√°les son tus principales conclusiones sobre los datos?


* Informaci√≥n general empleados

El perfil de los participantes se concentra en personas en edades entre 30 y 45 a√±os en su mayoria mujeres, el nivel educativo predominante es profesional o t√©cnico/tecnol√≥gico, y una gran cantidad de empleados tienen hijos. Esta diversidad permite analizar la experiencia laboral desde una perspectiva integral que incluye factores personales, familiares y socioeducativos.

* Intereses academicos

Hay un fuerte inter√©s por el desarrollo personal y la adquisici√≥n de habilidades blandas, seguido por temas como idiomas y herramientas b√°sicas. Esto sugiere una alta disposici√≥n al aprendizaje continuo y una oportunidad para dise√±ar planes de formaci√≥n adaptados a los distintos perfiles y trayectorias dentro de la organizaci√≥n.

* Salud mental (Depresi√≥n y Ansiedad)

Una proporci√≥n significativa de empleados reporta s√≠ntomas de depresi√≥n (25,58‚ÄØ%) y ansiedad (32,56‚ÄØ%) en niveles iguales o superiores a 3 en una escala de 1 a 5. Poniendo en evidencia posibles riesgos psicosociales que deben ser atendidos mediante programas de apoyo emocional, prevenci√≥n y acompa√±amiento en salud mental.

* Evaluaci√≥n general

El nivel general de satisfacci√≥n es alto (promedio de 9,2), lo que indica un clima organizacional bueno. Existen diferencias sutiles entre grupos que podr√≠an ser abordadas para fortalecer la experiencia laboral de manera equitativa.

* Ejes organizacionales (Eje 1, 2 y 3)

En conjunto, las dimensiones relacionadas con la organizaci√≥n, el cargo y el liderazgo presentan resultados positivos. Los empleados valoran el sentido de pertenencia, el acceso a recursos y la comunicaci√≥n con sus l√≠deres directos. Sin embargo, se ven oportunidades de mejora en aspectos como la inspiraci√≥n de los l√≠deres, la formaci√≥n dentro del rol, y la colaboraci√≥n entre √°reas, las cuales se encontraban con un promedio inferior.