In [1]:
import pandas as pd

In [2]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [3]:
df = pd.read_csv('/content/drive/MyDrive/Proyecto/docentes_RAW.csv')

In [4]:
df.shape

(169, 5)

In [5]:
df.columns

Index(['DOCENTE', 'ASIGNATURAS', 'GRUPO', 'HORAS', 'COMPONENTE'], dtype='object')

In [6]:
df.tail()

Unnamed: 0,DOCENTE,ASIGNATURAS,GRUPO,HORAS,COMPONENTE
164,MÓDULO,módulo iv. diseña y gestiona bases de datos of...,5B,,Módulo
165,MÓDULO,módulo iv. diseña y gestiona bases de datos of...,5F,,Módulo
166,MÓDULO,módulo iv. diseña y mantiene los sistemas de i...,5D,,Módulo
167,MÓDULO,"módulo iv. mantiene equipos hidráulicos, neumá...",5E,,Módulo
168,MÓDULO,"módulo iv. mantiene equipos hidráulicos, neumá...",5H,,Módulo


In [7]:
df.dtypes

DOCENTE         object
ASIGNATURAS     object
GRUPO           object
HORAS          float64
COMPONENTE      object
dtype: object

In [8]:
df_docentes = df['DOCENTE'].str.title()
df_docentes_unicos = df_docentes.unique()
df_docentes_unicos = pd.DataFrame({'DOCENTES': df_docentes_unicos})

In [9]:
df['DOCENTE'] = df_docentes
df_docentes_unicos

Unnamed: 0,DOCENTES
0,Garcia Hernandez Luis Eduardo
1,Ramirez Perez Juana Maria
2,Lopez Rodriguez Antonio Manuel
3,Lopez Rodriguez Antonia Maria
4,Gutierrez Lopez Pedro Pablo
5,Rodriguez Garcia Ana Carmen
6,Velazquez Hernandez Maria Elena
7,Garcia Ruiz Francisco Javier
8,Velazquez Hernandez Luciana
9,Gutierrez Martinez Pedro Pablo


In [10]:
df_asignaturas = df['ASIGNATURAS'].str.upper()
df_asignaturas_unicas = df_asignaturas.unique()
df_asignaturas_unicas = pd.DataFrame({'ASIGNATURAS': df_asignaturas_unicas})

In [11]:
df['ASIGNATURAS'] = df_asignaturas
df_asignaturas_unicas

Unnamed: 0,ASIGNATURAS
0,ÁLGEBRA
1,APLICA LA METODOLOGÍA DE DESARROLLO RÁPIDO DE ...
2,APLICA LA METODOLOGÍA ESPIRAL CON PROGRAMACIÓN...
3,BIOLOGÍA
4,CÁLCULO INTEGRAL
5,"CIENCIA, TECNOLOGÍA, SOCIEDAD Y VALORES"
6,CONSTRUYE BASES DE DATOS PARA APLICACIONES WEB
7,DESARROLLA APLICACIONES WEB CON CONEXIÓN A BAS...
8,DISEÑA BASES DE DATOS OFIMÁTICAS
9,DISEÑA Y MANTIENE LOS SISTEMAS DE ILUMINACIÓN


In [12]:
# Cambiar los valores NaN en la columna "HORAS" por el número 0
df["HORAS"].fillna(0, inplace=True)

In [13]:
# Transformar la columna "HORAS" a tipo de dato int
df["HORAS"] = df["HORAS"].astype(int)

In [14]:
df

Unnamed: 0,DOCENTE,ASIGNATURAS,GRUPO,HORAS,COMPONENTE
0,Garcia Hernandez Luis Eduardo,ÁLGEBRA,1B,4,Asignatura
1,Ramirez Perez Juana Maria,ÁLGEBRA,1F,4,Asignatura
2,Lopez Rodriguez Antonio Manuel,ÁLGEBRA,1A,4,Asignatura
3,Lopez Rodriguez Antonia Maria,ÁLGEBRA,1C,4,Asignatura
4,Lopez Rodriguez Antonia Maria,ÁLGEBRA,1D,4,Asignatura
...,...,...,...,...,...
164,Módulo,MÓDULO IV. DISEÑA Y GESTIONA BASES DE DATOS OF...,5B,0,Módulo
165,Módulo,MÓDULO IV. DISEÑA Y GESTIONA BASES DE DATOS OF...,5F,0,Módulo
166,Módulo,MÓDULO IV. DISEÑA Y MANTIENE LOS SISTEMAS DE I...,5D,0,Módulo
167,Módulo,"MÓDULO IV. MANTIENE EQUIPOS HIDRÁULICOS, NEUMÁ...",5E,0,Módulo


In [15]:
# Agrupar y sumar las horas por docente
horas_por_docente = df.groupby('DOCENTE')['HORAS'].sum().reset_index()

In [16]:
# Ordenar en orden descendente según las horas y restablecer los índices
horas_por_docente = horas_por_docente.sort_values(by='HORAS', ascending=False).reset_index(drop=True)

In [17]:
# Mostrar el DataFrame resultante
print(horas_por_docente)

                                  DOCENTE  HORAS
0       Reyes Rodriguez Esteban Alejandro     31
1                Ojeda Rivera Lucia Maria     31
2                 Nuñez Mejia Pedro Pablo     27
3             Orozco Ramirez Pablo Ismael     25
4            Magaña Silva Maria Guadalupe     25
5         Velazquez Hernandez Maria Elena     24
6                Gonzalez Lopez Ana Luisa     24
7               Campos Garcia Juan Carlos     20
8                   Garcia Alvarez Andres     20
9          Rodriguez Rosales Luis Enrique     20
10            Lopez Ramirez Marco Antonio     20
11        Hernandez Garcia Fabian Enrique     19
12             Lopez Ochoa Liliana Isabel     19
13       Galvan Magaña Fernanda Alejandra     19
14     Covarrubias Murguia Andres Alberto     19
15         Cardenas Cardenas Ana Patricia     18
16            Rodriguez Garcia Ana Carmen     17
17      Verduzco Morales Fabian Alexander     16
18          Martinez Gonzalez Juan Andres     16
19     Rodriguez Mar

In [18]:
# Filtrar el DataFrame para el grupo 1F
grupo_1f = df[df['GRUPO'] == '1F'][['ASIGNATURAS', 'DOCENTE']]

grupo_1f

Unnamed: 0,ASIGNATURAS,DOCENTE
1,ÁLGEBRA,Ramirez Perez Juana Maria
80,INGLÉS I,Orozco Ramirez Pablo Ismael
104,"LECTURA, EXPRESIÓN ORAL Y ESCRITA I",Gonzalez Lopez Ana Luisa
115,LÓGICA,Odriz Nazario Fernando
120,QUÍMICA I,Campos Garcia Juan Carlos
150,TECNOLOGÍAS DE LA INFORMACIÓN Y LA COMUNICACIÓN,Lopez Romero Maria Fernanda


In [27]:
# Filtrar el DataFrame para el docente "Nuñez Mejia Pedro Pablo"
pedro_pablo = df[df['DOCENTE'] == 'Nuñez Mejia Pedro Pablo'][['ASIGNATURAS', 'GRUPO', 'HORAS']]

# Calcular la suma de las horas
total_horas = pedro_pablo['HORAS'].sum()

# Crear un DataFrame con la fila que muestra el total de horas
total_row = pd.DataFrame([['Total Horas', ' ', total_horas]], columns=['ASIGNATURAS', 'GRUPO', 'HORAS'])

# Concatenar el DataFrame original con la fila que muestra el total de horas
pedro_pablo = pd.concat([pedro_pablo, total_row], ignore_index=True)

pedro_pablo

Unnamed: 0,ASIGNATURAS,GRUPO,HORAS
0,QUÍMICA I,1C,4
1,QUÍMICA I,1D,4
2,QUÍMICA I,1E,4
3,REALIZA MANTENIMIENTO A LAS INSTALACIONES ELÉC...,5D,4
4,REGISTRA INFORMACIÓN CONTABLE EN FORMA ELECTRÓ...,3G,11
5,Total Horas,,27
