In [152]:
import os
import re
import pandas as pd
import shutil
import json
import difflib
import pprint as pp
from pathlib import Path
from io import StringIO
from itertools import zip_longest
from collections import defaultdict


### Funciones utiles para manejar archivos y directorios

In [153]:
def raiz():
    return Path.cwd().parent

def ubicar(comision, *camino):
    ''' Ubica una carpeta en la comisi칩n indicada '''
    carpeta = f'lab4-C{comision}' if comision != 0 else 'lab4'  # Si la comisi칩n es 0, se asume que es la c치tedra
    comision_path = raiz() / carpeta
    salida = comision_path.joinpath(*camino)
    # print(f'Ubicando en comisi칩n {comision} -> {carpeta} \n->[{salida}]')
    return salida

def carpeta_alumno(alumno):
    ''' Genera el nombre de la carpeta del alumno '''
    return f"{alumno['orden']:02} - {alumno['legajo']} - {alumno['apellido']}, {alumno['nombre']}".strip()

def listar_carpetas(origen):
    return sorted([c for c in Path(origen).iterdir() if c.is_dir() and not c.name.startswith('.')])

def ubicar_alumno(legajo, *camino, alumnos=None):
    ''' Dado el legajo de un alumno, devuelve la carpeta donde deber칤a estar '''
    if alumnos is None:
        alumnos = cargar_alumnos()

    alumno = alumnos.loc[alumnos['legajo'] == str(legajo)].iloc[0]
    comision = int(alumno['comision'])
    return ubicar(comision, 'practicos', carpeta_alumno(alumno), *camino)

def copiar_archivos(origen, destino, forzar=False):
    ''' Copia los archivos de una carpeta a otra '''
    origen_path = Path(origen)
    destino_path = Path(destino)

    # Si la carpeta de destino ya existe y se debe forzar la copia, eliminarla primero
    if destino_path.exists() and forzar:
        shutil.rmtree(destino_path)

    # Copiar todo el contenido de la carpeta de origen a la carpeta de destino
    shutil.copytree(origen_path, destino_path, dirs_exist_ok=True)

def renombrar_carpeta(origen, destino):
    ''' Renombra una carpeta '''
    origen_path = Path(origen)
    destino_path = Path(destino)

    # Renombrar la carpeta
    origen_path.rename(destino_path)

# print(f'Ubicar: {ubicar(0,'enunciados', 'tp5', 'ejercicio1')}')
# print(f'Ubicar: {ubicar(1,'practicos', '01 - 12345 - Apellido, Nombre', 'tp5', 'ejercicio1')}')

### Cargar alumnos

Toma los alumnos que estan en alumnos.md y lo carga en un datatable.

El formato del archivo debe ser
```
## Comision N
1. Legajo Apellido, Nombre
```

In [154]:
def cargar_alumnos(origen='alumnos.md'):
    ''' Carga los alumnos desde el archivo de texto '''
    
    origen_path = Path(origen)
    
    with origen_path.open('r') as file:
        lineas = file.readlines()

    # Inicializar listas para almacenar los datos
    comisiones, ordenes, legajos, apellidos, nombres = [], [], [], [], []
    comision = None
    
    for linea in lineas:
        linea = re.sub(r'\|.*|^\s*|\s*$', '', linea)  # Limpiar la l칤nea
        linea = linea[:50]
        if linea.startswith('## Comisi칩n'):  # Extraer el n칰mero de la comisi칩n
            comision = int(linea.split(' ')[-1])
        elif linea and linea[0].isdigit():  # Extraer el n칰mero de orden, legajo, apellido y nombre
            linea = linea[0:50]
            match = re.match(r'(\d+)\.\s+(\d+)\s+([^,]+),\s+(.+)', linea)
            if match:
                comisiones.append(comision)
                ordenes.append(int(match.group(1)))
                legajos.append(match.group(2))
                apellidos.append(match.group(3))
                nombres.append(match.group(4))
    
    # Crear el DataFrame
    data = {
        'comision': comisiones,
        'orden':    ordenes,
        'legajo':   legajos,
        'apellido': apellidos,
        'nombre':   nombres
    }
    return pd.DataFrame(data)

def guardar_alumnos(alumnos, destino='alumnos.md', asistencias=None):
    salida = StringIO()
    salida.write('# Alumnos Lab4.2024\n')

    for comision in alumnos['comision'].unique():
        salida.write("\n")
        salida.write(f'## Comisi칩n {comision}\n')
        salida.write("```\n")
        for _, alumno in alumnos[alumnos['comision'] == comision].iterrows():
            asistio = marcas(asistencias, alumno['legajo'])
            salida.write(f"{alumno['orden']:2}. {alumno['legajo']:5}  {f'{alumno['apellido']}, {alumno['nombre']}'.strip():40} {asistio}\n")
        salida.write("```\n")
        
    destino_path = Path(destino)
    with destino_path.open('w') as file:
        file.write(salida.getvalue())

def marcas(asistencias, legajo):
    asistio = ''
    if asistencias and legajo in asistencias:
        for _, resultado in asistencias[legajo].items():
            if resultado['ausente']:
                asistio += '游댮'
            elif resultado['revisar']:
                asistio += '游댯'
            else:
                asistio += '游릭'
    return asistio

# print(cargar_alumnos())
cargar_alumnos()

Unnamed: 0,comision,orden,legajo,apellido,nombre
0,2,1,58764,Acu침a,Ana Sof칤a
1,2,2,59277,Aguirre,Emanuel
2,2,3,58827,Albornoz Silva,Alejo Miguel
3,2,4,58952,Almiron,Maicol Leonel
4,2,5,58731,Alvarez,Nicol치s
...,...,...,...,...,...
137,9,17,59074,Teseyra,Juan Ignacio
138,9,18,59056,Villafa침e,Lucas Gast칩n
139,9,19,59314,Yapura,Ram칩n Alejandro
140,9,20,59186,Roldan,Jes칰s


### Detectar datos duplicados

Revisa si los legajos estan duplicados (error), y como curiosidad si hay nombre y apellidos repetidos.

In [155]:
def detectar_duplicados(data):
    def duplicados(columna):
        return data[data[columna].duplicated(keep=False)].sort_values(by=columna)
    
    def reportar_duplicados(columna):
        duplicados_columna = duplicados(columna)
        num_duplicados = len(duplicados_columna[columna].unique())
        if num_duplicados:
            print(f"\nHay {num_duplicados} {columna.title()} duplicados en {len(duplicados_columna)} registros")
            print(duplicados_columna)
        else:
            print(f"\nNo hay {columna.title()} duplicados")
    
    # Reportar registros con legajo duplicado
    print("Registros con legajo duplicado:")
    reportar_duplicados('legajo')
    
    # Reportar registros con nombre duplicado
    reportar_duplicados('nombre')
    
    # Reportar registros con apellido duplicado
    reportar_duplicados('apellido')

detectar_duplicados(cargar_alumnos())

Registros con legajo duplicado:

No hay Legajo duplicados

No hay Nombre duplicados

Hay 12 Apellido duplicados en 27 registros
     comision  orden legajo     apellido                             nombre
4           2      5  58731      Alvarez    Nicol치s                        
5           2      6  58828      Alvarez    Nicol치s Nahuel                 
6           2      7  59176    Arga침araz      Facundo Nahuel               
7           2      8  58909    Arga침araz      Leonardo Ramiro              
46          5     11  58740       Garc칤a    Sergio Mart칤n                  
45          5     10  59154       Garc칤a    M치ximo                         
51          5     16  58720     Gonzalez      Mart칤n Natanael              
52          5     17  59068     Gonzalez      Silvina Mariela              
21          2     22  55906     Gonz치lez      Ramiro Exequiel              
20          2     21  55533     Gonz치lez      Luciano Leandro              
50          5     15  59488     Gonz

### Generar trabajo pr치cticos
Copia de la carpeta pr치cticos el tp a cada una de los repositorios 


In [156]:
def publicar(practico):
    alumnos = cargar_alumnos()

    # Copia los archivos del pr치ctico a cada alumno
    for legajo in alumnos['legajo']:
        destino = f"{ubicar_alumno(legajo, alumnos=alumnos)}/{practico}" 
        copiar_archivos(f'./practicos/{practico}', destino)
        
    # Copia el enunciados del pr치ctico a cada comisi칩n
    for comision in [2,5,7,9]:
        destino = ubicar(comision)
        shutil.copy(f'./practicos/enunciados/{practico}.md', f"{destino}/README.md")

# publicar('tp5')

### Normalizar nombres de carpetas.
Esta funci칩n permite revisar que los nombres est칠n bien escritos (tomando en cuenta el n칰mero de legajo).

In [157]:
def extraer_legajo(carpeta):
    ''' Extrae el legajo del nombre de la carpeta '''
    m = re.match(r'.*(\d{5}).*', str(carpeta))
    return m.group(1) if m else None

def normalizar():
    alumnos = cargar_alumnos()
    for comision in [2, 5 ,7, 9]:
        # listar todas las carpetas de alumnos que esten en la carpeta de la comisi칩n

        carpetas = listar_carpetas(ubicar(comision, 'practicos'))
        for alumno in carpetas:
            legajo = extraer_legajo(str(alumno))
            if not legajo: continue
            
            origen  = ubicar(comision, 'practicos', alumno)
            destino = ubicar_alumno(legajo, alumnos=alumnos)
            
            if origen == destino: continue
            print(f"Renombrando [{origen.strip()}]\n            [{destino.strip()}]")

            renombrar_carpeta(origen.strip, destino)
            
# normalizar()
#TODO: Revisar por que da error 

### Soluciona el problema que publique TP1 directamente en la raiz

In [158]:
def mover_ejercicio_a_tp1():
    alumnos = cargar_alumnos()
    for comision in [2, 5, 7, 9]:
        # Listar todas las carpetas de alumnos que est칠n en la carpeta de la comisi칩n
        comision_path = ubicar(comision, 'practicos')
        carpetas = [carpeta for carpeta in Path(comision_path).iterdir() if carpeta.is_dir()]
        
        for carpeta in carpetas:
            carpeta_nombre = carpeta.name.strip()
            m = re.match(r'\d{2}\s+-?\s*(\d+) - ([^,]+), (.+)', carpeta_nombre)
            if not m:
                continue

            legajo = m.group(1)
            origen = ubicar_alumno(legajo, alumnos=alumnos)
            origen_path = Path(origen)

            archivos = [archivo for archivo in origen_path.iterdir() if archivo.is_file() and archivo.name != '.DS_Store']
            archivos.sort()

            tp1_path = origen_path / 'tp1'
            tp1_path.mkdir(exist_ok=True)

            for archivo in archivos:
                ruta_destino = tp1_path / archivo.name
                shutil.move(str(archivo), str(ruta_destino))
                print(f"Movido: {archivo} -> {ruta_destino}")

# mover_ejercicio_a_tp1()

### Funciones para comparar dos Jupiter Notebook 

In [159]:
def cargar_cuaderno(origen):
    '''Dado un archivo .ipynb, devuelve una lista con las l칤neas de c칩digo 
       de cada celda de c칩digo en el cuaderno.'''
    
    def limpiar(lineas): # Elimina l칤neas en blanco y comentarios
        return [linea.strip() for linea in lineas if linea.strip() and not linea.strip().startswith('#')]
    
    def codigo(cuaderno): # Extrae las l칤neas de c칩digo de las celdas de c칩digo
        celdas = cuaderno.get('cells', [])
        return [limpiar(celda.get('source', [])) for celda in celdas if celda.get('cell_type') == 'code']
    
    origen_path = Path(origen)
    with origen_path.open('r', encoding='utf-8') as f:
        cuaderno = json.load(f)
 
    return codigo(cuaderno)


def comparar_cuadernos(original, modificado):
    '''Dados dos cuadernos de Jupyter, devuelve la cantidad 
       de l칤neas de c칩digo que se agregaron en el segundo 
       respecto del primero.'''

    def igualar(a, b): 
        while len(a) < len(b): 
            a.append([])
        while len(b) < len(a): 
            b.append([])
        return zip(a, b)
    
    def cambios(a, b): 
        diferencias = difflib.unified_diff(a, b, lineterm='')
        diferencias = [l for l in diferencias if l.startswith('+') and not l.startswith('+++')]
        return len(diferencias)
    
    conteo = [cambios(o, m) for o, m in igualar(original, modificado)]
    
    # def cambios(origen, modificado):
    #     diferencias = difflib.unified_diff(origen, modificado, lineterm='')
    #     return sum(1 for l in diferencias if re.match(r'^\+[^+]', l))
    
    # conteo = [cambios(o, m) for o, m in zip_longest(original, modificado, fillvalue=[])]

    return {'diferencias': conteo, 'total': sum(conteo)}


In [160]:
def listar_cuadernos(origen):
    '''Dada una carpeta, devuelve una lista con los cuadernos de Jupyter (.ipynb) que contiene.'''
    return [archivo for archivo in Path(origen).iterdir() if archivo.suffix == '.ipynb']

def analizar(practico, comisiones=[2, 5, 7, 9]):
    if not isinstance(comisiones, list):
        comisiones = [comisiones]

    cuadernos = listar_cuadernos(ubicar(0, 'practicos', practico))
    print(f"Analizando {practico}...")
    print(f'{cuadernos!s}')

# analizar('tp1')
# analizar('tp2')
analizar('tp4')


Analizando tp4...
[PosixPath('/Users/adibattista/Documents/GitHub/lab4/practicos/tp4/ejercicio.ipynb')]


In [161]:
def analizar_cambios(practicos, comisiones=[2, 5, 7, 9]):
    resultados = defaultdict(dict)
    if not isinstance(comisiones, list): comisiones = [comisiones]
    if not isinstance(practicos, list):  practicos  = [practicos]

    # normalizar() # Asegurarse de que las carpetas de los alumnos est칠n normalizadas

    for practico in practicos:

        archivos = listar_cuadernos(ubicar(0, 'practicos', practico))
        for archivo in archivos:
            archivo = Path(archivo).name
            ruta_original = ubicar(0, 'practicos', practico, archivo)

            print(f"Analizando {ruta_original}:")
            original = cargar_cuaderno(str(ruta_original))
            celdas   = len(original)

            for comision in comisiones:
                carpetas = listar_carpetas(ubicar(comision, 'practicos'))
                # print(f"Comisi칩n {comision}: {len(carpetas)} alumnos")

                for alumno in carpetas:
                    alumno = str(Path(alumno).name)
                    print(f'Alumno:  {alumno}')

                    destino = ubicar(comision, 'practicos', alumno, practico, archivo)
                    # print(f'Comision: {comision}\n>>{ruta_original}\n=={destino}')
                    # print(f"{comision=} {alumno=} {practico=} {archivo=}")
                    nuevo   = cargar_cuaderno(str(destino))
                    cambios = comparar_cuadernos(original, nuevo)
                    
                    print(f"    {cambios['total']:3} l칤neas agregadas")
                    legajo = extraer_legajo(alumno)
                    cambios['celdas']  = celdas
                    cambios['ausente'] = cambios['total'] < 5
                    cambios['revisar'] = max(cambios['diferencias']) >= 40
                    resultados[legajo][practico] = cambios

    return resultados

alumnos = cargar_alumnos()
r = analizar_cambios(['tp1','tp2','tp3', 'tp4'], [2, 5, 7, 9])

guardar_alumnos(alumnos, asistencias=r)


Analizando /Users/adibattista/Documents/GitHub/lab4/practicos/tp1/ejercicio.ipynb:
Alumno:  01 - 58764 - Acu침a, Ana Sof칤a
     26 l칤neas agregadas
Alumno:  02 - 59277 - Aguirre, Emanuel
     27 l칤neas agregadas
Alumno:  03 - 58827 - Albornoz Silva, Alejo Miguel
     31 l칤neas agregadas
Alumno:  04 - 58952 - Almiron, Maicol Leonel
     37 l칤neas agregadas
Alumno:  05 - 58731 - Alvarez, Nicol치s
      0 l칤neas agregadas
Alumno:  06 - 58828 - Alvarez, Nicol치s Nahuel
     29 l칤neas agregadas
Alumno:  07 - 59176 - Arga침araz, Facundo Nahuel
     24 l칤neas agregadas
Alumno:  08 - 58909 - Arga침araz, Leonardo Ramiro
     40 l칤neas agregadas
Alumno:  09 - 50665 - Arias Olaiz, Marcos Ignacio
     26 l칤neas agregadas
Alumno:  10 - 59078 - Bazan, Bruno Gabriel
     27 l칤neas agregadas
Alumno:  11 - 49185 - Bett, Mat칤as Alejandro
      0 l칤neas agregadas
Alumno:  12 - 47121 - Caram, Jes칰s Nicol치s
     38 l칤neas agregadas
Alumno:  13 - 58865 - Ch치vez, Pedro Ismael
     27 l칤neas agregadas
Alumno:  14 