## Enriquecimiento del dataset
En este proceso se realizan 2 principales acciones: 1) Seleccionar preguntas según los indicadores elegidos. 2) Ponderar valores de las preguntas elegidas.

## Indicadores
Se eligieron los siguientes indicadores para darle un valor agregado al dataset generado. Los mismos están enfocados desde la perspectiva de reflejar las opiniones de los encuestados; esto siguiendo siempre un enfoque de apoyo o beneficio a la educación.  
* **Nivel de alfabetización digital:** La población objetivo debe tener un nivel mínimo de alfabetización digital para poder utilizar las herramientas de TICs y aprovechar al máximo el proyecto. Si el nivel de alfabetización digital es bajo, se pueden ofrecer capacitaciones o tutoriales para mejorar sus habilidades.
* **Soporte técnico:** El soporte técnico se refiere a la disponibilidad y eficacia del apoyo técnico para los problemas y dificultades con las TICs. Se puede preguntar sobre la satisfacción con la calidad y eficacia del soporte técnico.
* **Fiabilidad:** La fiabilidad se refiere a la confiabilidad y estabilidad de las TICs. Se puede preguntar sobre la frecuencia de interrupciones y errores, la velocidad y capacidad de respuesta, la seguridad de los datos y la confianza en el uso de las TICs.
* **Utilidad:** La utilidad se refiere a la capacidad de las TICs para satisfacer las necesidades y expectativas de los encuestados. Se puede preguntar sobre la calidad de los servicios y herramientas disponibles, la efectividad de las TICs en la realización de tareas, la satisfacción con los servicios y la capacidad de las TICs para mejorar la vida cotidiana.
* **Accesibilidad:** La accesibilidad se refiere a la facilidad con la que los encuestados pueden acceder a las TICs. Se puede preguntar sobre el acceso a la tecnología, la conexión a Internet, la frecuencia de uso y la facilidad de uso.


In [1]:
import pandas as pd
import numpy as np
import json
pd.options.display.max_colwidth = 100

In [60]:
df = pd.read_csv("prof_fin_clnd.csv", index_col=0)
df.head()

Unnamed: 0,a0,a2,a3,a4,b1.b11.,b1.b12.,b1.b13.,b1.b14.,b1.b15.,b1.b16.,...,m2,m3,m4,m5,m6,m7,m71,m8,m9,m10
0,Sí,32,Santa Cruz,Santa Cruz de la Sierra,Sí,No,Sí,No,No,No,...,Me falto mas por aprender.,mucho,Es muy importante para un mejor desarrollo en el aprendizaje.,Sí,Hubo motivación a la hora de aprender un nuevo tema.,excelente,Tuvieron la paciencia necesaria con todas nuestras dudas.,Sí,Seria bueno aprender mas.,Me gustaria que al proximo año siga existiendo este apoyo a los estudiantes y profesores.
1,Sí,38,La Paz,El Alto,Sí,No,Sí,No,No,No,...,respondió ha algunas inquietudes que tuve como docente,mucho,al tener conocimiento suficiente de las herramientas tecnológicas seria mas fluido la enseñanza ...,Sí,"aun estamos en proceso de manejar estos software libres, pero pienso que sera de mucha utilidad.",buena,compartieron sus conocimientos.,Sí,cuanto mas te capacites con las nuevas tecnologías que a diario progresan estoy seguro que seria...,"espero que esta actividad piloto no se quede suspendida solo por ser una política de gobierno, m..."
2,Sí,54,La Paz,La Paz,Sí,No,Sí,Sí,No,No,...,"Por que nos permite generar material para el desarrollo en clases, fortalece la creatividad, per...",mucho,Porque rompe con laa Monotonía de una clase tradicional.,Sí,Nos permite acceso ilimitado y económico.,excelente,Mucho compromisos y capacidad de enseñanza a la demanda de los docentes que están en el proceso ...,Sí,"Por las herramientas que permite utilizar, que rompen con las Clase tradicionales.",Las observaciones que tengo es la falta de tiempo que tenemos los docentes que limita de alguna ...
3,Sí,54,La Paz,La Paz,No,No,Sí,No,No,No,...,Porque nos enseñaron con interés y paciencia.,mucho,Porque tenemos que motivar a los estudiantes con la tecnología ya que es un gran apoyo.,Sí,Porque se motivaron más.,buena,Pusieron mucho interés ganas en enseñar.,Sí,Porque necesitamos estar capacitados en el uso de Tics.,Que nos sigan capacitando con otros cursos.
4,Sí,34,La Paz,La Paz,No,No,Sí,No,No,No,...,Siempre estuvieron atentos a nuestras dudas y facilitaron los programas.,mucho,Se diversifica las estrategias didácticas u motiva más al estudiante.,Sí,Motiva al estudiante a conocer y profundizar sus aprendizajes,excelente,Excelente disponibilidad para aclarar las dudas que nos quedaban y mucha paciencia.,Sí,"Los programas o aplicaciones son amplias, sin embargo se tiene las bases necesarias para impleme...",Que el proyecto no se quede y se nos apoye en linea o con tutoriales para fortalecer el trabajo ...


## Ponderaciones y consideraciones
Para determinada serie de preguntas se seleccionan ciertas ponderaciones que se describen a continuación en formato de un objeto JSON.
Se asignan 0-1 para respuestas del tipo Sí-No y para las de selección múltiple se ponderan las respuestas de acuerdo a la opción que corresponde.


In [55]:
# Ponderaciones para preguntas del indicador: Utilidad.
pu1 = {
    "c9.c32.": 0.5,
    "c9.c33.": 1,
    "c9.c34.": 1,
    "c9.c35.": 0.2,
    "c9.c36.": 0,
    "c9.c37.": 1,
    "c9.c38.": 1,
    "c9.c39.": 1,
    "c9.c40.": 1
}
max_pu1 = sum(pu1.values()) # Máximo puntaje posible
# Para preguntas relacionadas a las kuaas: (k6,k7,k8, ^j11)
pu2q = ('k6', 'k7', 'k8', 'j11')
pu2 = {
    "Siempre": 1,
    "Casi siempre": 0.8,
    "Ocasionalmente": 0.5,
    "Rara vez": 0.2,
    "Nunca": 0
}
# Ponderaciones para preguntas del indicador: Soporte técnico. (m1)
pst1 = {
    "excelente": 1,
    "buena": 0.8,
    "regular": 0.5,
    "mala": 0
}
# Ponderaciones para preguntas del indicador: Nivel de alfabetización digital.
pad1 = {
    "b1.b11.": 0.7,
    "b1.b12.": 0.8,
    "b1.b13.": 0.9,
    "b1.b14.": 0.9,
    "b1.b15.": 1,
    "b1.b16.": 1
}

indicators = ('accesibilidad', 'utilidad', 'fiabilidad', 'soporte_tecnico', 'alfabetizacion')

### Preguntas seleccionadas según los indicadores
Estas preguntas fueron seleccionadas según los indicadores previos y se encuentran en el archivo de **final_questions.txt**. Dicho archivo contiene las preguntas seleccionadas divididas por indicadores que las representan y de la forma:  
**código de pregunta: pregunta**

In [4]:
# Recuperamos las preguntas seleccionadas
indicators_qs = dict.fromkeys(indicators, [])
indicator = ""
text = ""
aq = []
with open("final_questions.txt", "r", encoding="utf-8") as f:
    for qc in f:
        q = qc.split(":")
        if q[0] in indicators:
            if aq:
                indicators_qs[indicator] = aq
                aq = []
            indicator = q[0].strip()
        elif len(q) == 2 and q[0] not in indicators:
            aq.append(q[0])
    indicators_qs[indicator] = aq

In [57]:
# Columnas seleccionadas de accesibilidad
acc_df = df[indicators_qs["accesibilidad"]]
nq_acc = len(indicators_qs["accesibilidad"])
acc_df.head()

Unnamed: 0,a0,c1,c4,e1,e2,e3,i1,i2,i6
0,Sí,Sí,No,Sí,Sí,Sí,Sí,Sí,Sí
1,Sí,Sí,No,Sí,Sí,No,Sí,Sí,Sí
2,Sí,Sí,Sí,Sí,Sí,No,Sí,Sí,Sí
3,Sí,Sí,No,Sí,Sí,No,Sí,No,No
4,Sí,Sí,No,Sí,Sí,No,Sí,No,Sí


In [56]:
# Evaluando las preguntas del indicador accesibilidad
acces_col  = [round(list(acc_df.iloc[i]).count("Sí")/nq_acc, 3) for i in range(len(acc_df))]

In [58]:
# Evaluando las preguntas del indicador utilidad
df[pu1.keys()].head()

Unnamed: 0,c9.c32.,c9.c33.,c9.c34.,c9.c35.,c9.c36.,c9.c37.,c9.c38.,c9.c39.,c9.c40.
0,No,Sí,Sí,Sí,No,Sí,Sí,Sí,Sí
1,No,Sí,Sí,No,No,Sí,Sí,Sí,Sí
2,No,No,No,No,No,Sí,Sí,Sí,Sí
3,No,No,No,No,No,Sí,No,No,No
4,No,Sí,Sí,Sí,No,Sí,Sí,Sí,Sí


In [43]:
# Procesando preguntas del factor de utilidad
pu1_pt = []
for _, row in df[pu1.keys()].iterrows():
    sum_row = 0
    for col, val in row.items():
        if val == "Sí":
            sum_row += pu1[col]
    pu1_pt.append(sum_row/max_pu1)   
# pu1_pt

In [44]:
remain_columns = [x for x in indicators_qs["utilidad"] if x not in pu1.keys()] # Recuperamos columnas que todavía no fueron procesadas
util_df = df[remain_columns] # Seleccionamos todas las preguntas correspondientes al indicador
util_df.head()

Unnamed: 0,d4,i3,k2.k21.,k6,k7,k8,j11.SQ001.,j11.SQ005.,j11.SQ006.,j11.SQ007.,j11.SQ008.
0,No,Sí,Sí,Casi siempre,Casi siempre,Casi siempre,Casi siempre,Casi siempre,Casi siempre,Casi siempre,Rara vez
1,Sí,Sí,Sí,Siempre,Siempre,Siempre,Siempre,Siempre,Siempre,Siempre,Siempre
2,Sí,Sí,Sí,Siempre,Siempre,Siempre,Ocasionalmente,Casi siempre,Casi siempre,Nunca,Rara vez
3,Sí,No,No,Ocasionalmente,Ocasionalmente,Rara vez,Ocasionalmente,Ocasionalmente,Casi siempre,Nunca,Casi siempre
4,No,Sí,No,Rara vez,Rara vez,Ocasionalmente,Ocasionalmente,Casi siempre,Casi siempre,Nunca,Rara vez


In [45]:
pu2_pt = []
for _, row in util_df.iterrows():
    sum_row = 0
    for col, val in row.items():
        if val == "Sí":
            sum_row += 1
        elif val != "No":
            sum_row += pu2[val]
    pu2_pt.append(sum_row/(len(util_df.columns)))

In [50]:
# Sumamos los puntajes
util_col = [round(i, 3) for i in np.add(pu1_pt, pu2_pt)/2]

In [13]:
# Procesando preguntas del factor de fiabilidad
fia_df = df[indicators_qs["fiabilidad"]]
fia_df.head()

Unnamed: 0,j2,m8
0,Sí,Sí
1,Sí,Sí
2,Sí,Sí
3,Sí,Sí
4,Sí,Sí


In [25]:
fia_col = []
for _, row in fia_df.iterrows():
    sum_row = 0
    for _, val in row.items():
        if val == "Sí":
            sum_row += 1
    fia_col.append(sum_row/(len(fia_df.columns)))

In [15]:
# Procesando preguntas del factor de soporte técnico
sop_df = df[indicators_qs["soporte_tecnico"]]
sop_df.head()

Unnamed: 0,m1
0,buena
1,buena
2,excelente
3,buena
4,excelente


In [23]:
sop_col = []
for _, row in sop_df.iterrows():
    sum_row = 0
    for _, val in row.items():
        sum_row += pst1[val]
    sop_col.append(sum_row)

In [26]:
# Procesando preguntas del factor de alfabetización
alf_df = df[indicators_qs["alfabetizacion"]]
alf_df.head()

Unnamed: 0,b1.b11.,b1.b12.,b1.b13.,b1.b14.,b1.b15.,b1.b16.,b8,f1.f11.,f1.f12.,f1.f13.,f1.f14.,f1.f15.,f1.f16.,f1.f17.,g2,h1,h2,h3,l2
0,Sí,No,Sí,No,No,No,Sí,Sí,Sí,Dudoso,Sí,Dudoso,Sí,Sí,Sí,Sí,Sí,Sí,Sí
1,Sí,No,Sí,No,No,No,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí
2,Sí,No,Sí,Sí,No,No,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí
3,No,No,Sí,No,No,No,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,No,Sí,Sí
4,No,No,Sí,No,No,No,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,Sí,No,No,Sí


In [34]:
alf_col = []
b1_pt = 0 # Para obtener el último valor del nivel de instrucción
for _, row in alf_df.iterrows():
    sum_row = 0
    for col, val in row.items():
        if col.startswith("b1."):
            # sum_row += pst1[col]
            b1_pt = pad1[col]
        elif val == "Sí":
            sum_row += 1
    alf_col.append(round((sum_row+b1_pt)/(len(alf_df.columns)-5), 3)) # Se restan los números de opciones para el nivel de instrucción

## Finalmente incluimo todas las columnas calculadas que pertenecen los factores elegidos

In [61]:
df["accesibilidad"] = acces_col
df["utilidad"] = util_col
df["fiabilidad"] = fia_col
df["soporte_tecnico"] = sop_col
df["alfabetizacion"] = alf_col

In [62]:
df.head()

Unnamed: 0,a0,a2,a3,a4,b1.b11.,b1.b12.,b1.b13.,b1.b14.,b1.b15.,b1.b16.,...,m7,m71,m8,m9,m10,accesibilidad,utilidad,fiabilidad,soporte_tecnico,alfabetizacion
0,Sí,32,Santa Cruz,Santa Cruz de la Sierra,Sí,No,Sí,No,No,No,...,excelente,Tuvieron la paciencia necesaria con todas nuestras dudas.,Sí,Seria bueno aprender mas.,Me gustaria que al proximo año siga existiendo este apoyo a los estudiantes y profesores.,0.889,0.817,1.0,0.8,0.857
1,Sí,38,La Paz,El Alto,Sí,No,Sí,No,No,No,...,buena,compartieron sus conocimientos.,Sí,cuanto mas te capacites con las nuevas tecnologías que a diario progresan estoy seguro que seria...,"espero que esta actividad piloto no se quede suspendida solo por ser una política de gobierno, m...",0.778,0.948,1.0,0.8,1.0
2,Sí,54,La Paz,La Paz,Sí,No,Sí,Sí,No,No,...,excelente,Mucho compromisos y capacidad de enseñanza a la demanda de los docentes que están en el proceso ...,Sí,"Por las herramientas que permite utilizar, que rompen con las Clase tradicionales.",Las observaciones que tengo es la falta de tiempo que tenemos los docentes que limita de alguna ...,0.889,0.676,1.0,1.0,1.0
3,Sí,54,La Paz,La Paz,No,No,Sí,No,No,No,...,buena,Pusieron mucho interés ganas en enseñar.,Sí,Porque necesitamos estar capacitados en el uso de Tics.,Que nos sigan capacitando con otros cursos.,0.556,0.293,1.0,0.8,0.929
4,Sí,34,La Paz,La Paz,No,No,Sí,No,No,No,...,excelente,Excelente disponibilidad para aclarar las dudas que nos quedaban y mucha paciencia.,Sí,"Los programas o aplicaciones son amplias, sin embargo se tiene las bases necesarias para impleme...",Que el proyecto no se quede y se nos apoye en linea o con tutoriales para fortalecer el trabajo ...,0.667,0.654,1.0,1.0,0.857


In [63]:
# Exportamos el nuevo dataset enriquecido
df.to_csv("enrich_prof_fin_clnd.csv")