# Crear Cronograma de cursos automaticamente

---

La idea consiste en automatizar la generacion de un cronograma de materia que liste en orden la sucesion temporal de clases, intercalando teoricas, practicas y laboratorios (si es el caso), de forma tal de facilitar la organizacion tematica de cada clase. Esto es particularmente importante cuando se quiere mantener a la teorica siempre 'por delante tematicamente' de la practica y/o el laboratorio. 

Los pasos serian los siguientes.

Partiendo de:
  - Las fechas de inicio y fin del cuatrimestre en cuestion
  - Los nombres de los dias de la semana que hay teoricas
  - Los nombres de los dias de la semana que hay practicas
  - Los nombres de los dias de la semana que hay laboratorio
  - Las fechas de los feriados
    
se busca automatizar la creacion de un archivo Excel que contenga un *cronograma integrado* de todo el curso, en donde se marquen aquellas fechas que sean feriado.

---

In [1]:
import datetime

In [2]:
datetime.datetime.now()

datetime.datetime(2016, 3, 2, 19, 30, 4, 253498)

In [4]:
datetime.datetime.now().strftime("%A")

'Wednesday'

In [242]:
fecha_inicio = datetime.date(2016,3,14)
fecha_final  = datetime.date(2016,7,2)

In [243]:
fecha_inicio.strftime("%A")

'Monday'

In [244]:
fecha_final.strftime("%A")

'Saturday'

In [245]:
# fechas entre inicio y final
delta = fecha_final - fecha_inicio

for i in range(delta.days + 1):
    current = fecha_inicio + datetime.timedelta(days=i)
    if current.strftime("%A") == 'Monday':
        print(current)
  
    if current.strftime("%A") == 'Wednesday':
        print(current)

2016-03-14
2016-03-16
2016-03-21
2016-03-23
2016-03-28
2016-03-30
2016-04-04
2016-04-06
2016-04-11
2016-04-13
2016-04-18
2016-04-20
2016-04-25
2016-04-27
2016-05-02
2016-05-04
2016-05-09
2016-05-11
2016-05-16
2016-05-18
2016-05-23
2016-05-25
2016-05-30
2016-06-01
2016-06-06
2016-06-08
2016-06-13
2016-06-15
2016-06-20
2016-06-22
2016-06-27
2016-06-29


In [13]:
# Detectando feriados

In [59]:
feriados = [ "2016-03-24", "2016-03-25", "2016-04-02", "2016-05-25" ]
feriados

['2016-03-24', '2016-03-25', '2016-04-02', '2016-05-25']

In [28]:
# detectamos feriados entre inicio y final
delta = fecha_final - fecha_inicio

lista_dias = []
contador = 0

for i in range(delta.days + 1):
    current = fecha_inicio + datetime.timedelta(days=i)
    if current.strftime("%A") == 'Monday':
        lista_dias.append(current)
        contador += 1
  
    if current.strftime("%A") == 'Wednesday':
        lista_dias.append(current)
        contador += 1
           
for i in lista_dias:
    if i.isoformat() in feriados:
        print(i.strftime('%Y-%m-%d') + " es feriado")
    else:
        print(i)

2016-03-14
2016-03-16
2016-03-21
2016-03-23
2016-03-28
2016-03-30
2016-04-04
2016-04-06
2016-04-11
2016-04-13
2016-04-18
2016-04-20
2016-04-25
2016-04-27
2016-05-02
2016-05-04
2016-05-09
2016-05-11
2016-05-16
2016-05-18
2016-05-23
2016-05-25 es feriado
2016-05-30
2016-06-01
2016-06-06
2016-06-08
2016-06-13
2016-06-15
2016-06-20
2016-06-22
2016-06-27
2016-06-29


Soy muy vago... podemos tomar los feriados haciendo html scrapping, es decir, solo pasandole al algoritmo python la direccion web del calendario exactas?

In [62]:
from bs4 import BeautifulSoup
from urllib.request import urlopen
import codecs

response = urlopen('http://exactas.uba.ar/academico/display.php?estructura=2&desarrollo=1&id_caja=31&nivel_caja=1')
html = response.read()
soup = BeautifulSoup(html,"lxml")

# el 1 al final de la siguiente linea es porque la table que buscamos
# en el sitio web de la FCEN es la *segunda tabla* que aparece con la
# descripcion de clase "tabla_persona", esperemos que no la cambien!
tabla_feriados = soup.findAll("table", {"class" : "tabla_persona"})[1] 

feriados = []

records = [] # store all of the records in this list
for row in tabla_feriados.findAll('tr')[1:]:
    col = row.findAll('td')
    fecha_feriado = col[0].string.strip()
    razon_feriado = col[1].string.strip()
    record = '%s,%s' % (fecha_feriado, razon_feriado) # store the record with a ';' between prvy and druhy
    records.append(record)
    feriados.append(fecha_feriado)
    
# Lo interesante es que en la variable feriados tenemos la lista de feriados del agno!    
print(feriados)    

fl = codecs.open('Lista_de_Feriados.txt', 'wb', 'utf8')
line = ';'.join(records)
fl.write(line + u'\r\n')
fl.close()

['01-01-2016', '08-02-2016', '09-02-2016', '24-03-2016', '24-03-2016', '25-03-2016', '02-04-2016', '23-04-2016', '24-04-2016', '24-04-2016', '29-04-2016', '30-04-2016', '01-05-2016', '25-05-2016', '20-06-2016', '08-07-2016', '09-07-2016', '15-08-2016', '21-09-2016', '03-10-2016', '04-10-2016', '10-10-2016', '11-10-2016', '12-10-2016', '28-11-2016', '08-12-2016', '09-12-2016', '25-12-2016']


In [63]:
!cat Lista_de_Feriados.txt

01-01-2016,Año Nuevo;08-02-2016,Carnaval;09-02-2016,Carnaval;24-03-2016,Día Nacional de la Memoria por la Verdad y la Justicia;24-03-2016,Jueves Santo;25-03-2016,Viernes Santo;02-04-2016,Día del Veterano y de los Caídos en la Guerra de Malvinas;23-04-2016,1er día de Pascua Judía;24-04-2016,2do día de Pascua Judía;24-04-2016,Día de Acción por la Tolerancia y el Respeto entre los Pueblos;29-04-2016,Anteúltimo día de Pascua Judía;30-04-2016,Último día de Pascua Judía;01-05-2016,Día del Trabajador;25-05-2016,Día de la Revolución de Mayo;20-06-2016,Paso a la Inmortalidad del General Belgrano;08-07-2016,Feriado Puente Turístico;09-07-2016,Día de la Independencia;15-08-2016,Paso a la Inmortalidad del General San Martín;21-09-2016,Día del Estudiante;03-10-2016,Año Nuevo Judío;04-10-2016,Año Nuevo Judío;10-10-2016,Día del Respeto a la Diversidad Cultural;11-10-2016,Día del Perdón;12-10-2016,Día del Perdón;28-11-2016,Día de la Soberanía Nacional;08-12-2016,Inmaculada Concepción de María;09-12-20

In [64]:
feriados

['01-01-2016',
 '08-02-2016',
 '09-02-2016',
 '24-03-2016',
 '24-03-2016',
 '25-03-2016',
 '02-04-2016',
 '23-04-2016',
 '24-04-2016',
 '24-04-2016',
 '29-04-2016',
 '30-04-2016',
 '01-05-2016',
 '25-05-2016',
 '20-06-2016',
 '08-07-2016',
 '09-07-2016',
 '15-08-2016',
 '21-09-2016',
 '03-10-2016',
 '04-10-2016',
 '10-10-2016',
 '11-10-2016',
 '12-10-2016',
 '28-11-2016',
 '08-12-2016',
 '09-12-2016',
 '25-12-2016']

Es hora de probar si funciona con mi cursada! Uso el mismo codigo de antes, pero ahora habiendo definido la variable `feriados` via el `html` scrapping que acabo de hacer...

In [67]:
# detectamos feriados entre inicio y final
delta = fecha_final - fecha_inicio

lista_dias = []
contador = 0

for i in range(delta.days + 1):
    current = fecha_inicio + datetime.timedelta(days=i)
    if current.strftime("%A") == 'Monday':
        lista_dias.append(current)
        contador += 1
  
    if current.strftime("%A") == 'Wednesday':
        lista_dias.append(current)
        contador += 1
           
for i in lista_dias:
    # Estoy obligado a modificar la forma en la que se comparan porque 
    # en la tabla de la FCEN, la fecha esta en formato dd-mm-yy
    if i.strftime('%d-%m-%Y') in feriados:
        print(i.strftime('%d-%m-%Y') + " es feriado")
    else:
        print(i.strftime('%d-%m-%Y'))

14-03-2016
16-03-2016
21-03-2016
23-03-2016
28-03-2016
30-03-2016
04-04-2016
06-04-2016
11-04-2016
13-04-2016
18-04-2016
20-04-2016
25-04-2016
27-04-2016
02-05-2016
04-05-2016
09-05-2016
11-05-2016
16-05-2016
18-05-2016
23-05-2016
25-05-2016 es feriado
30-05-2016
01-06-2016
06-06-2016
08-06-2016
13-06-2016
15-06-2016
20-06-2016 es feriado
22-06-2016
27-06-2016
29-06-2016


Ahora veamos como hacemos para crear un archivo Excel con Python...

In [68]:
import xlsxwriter

In [72]:
workbook = xlsxwriter.Workbook('prueba.xlsx')
worksheet = workbook.add_worksheet('Cronograma')

# Widen the first column to make the text clearer.
# worksheet.set_column('A:A', 20)

# Add a bold format to use to highlight cells.
bold = workbook.add_format({'bold': True})

# Escribamos los encabezados de la primera linea.
# Write some simple text.
worksheet.write('A1', 'Clase', bold)
worksheet.write('B1', 'Fecha', bold)
worksheet.write('C1', 'Teoricas', bold)

# Escribimos la lista de dias
j = 1
for i in lista_dias:
    worksheet.write(j, 1, i.strftime('%d-%m-%Y'))
    if i.strftime('%d-%m-%Y') in feriados:
        worksheet.write(j, 2, "Feriado")
    j += 1 

workbook.close()

Quedaria ver como organizar facilmente los inputs de la rutina, para que sean lo menos estructurados posibles, ya que uno podria desear un cronograma solo de practicas, o bien de una materia sin laboratorio, o bien de una materia con varios turnos de practicas, etc. Ensayemos...

In [83]:
horarios = { 'Teoricas': ['lunes','miercoles'], 'Laboratorio 1': ['martes']}

In [86]:
horarios['Teoricas'].__len__()

2

In [87]:
horarios['Teoricas'][1]

'miercoles'

In [88]:
horarios.__len__()

2

In [89]:
len(horarios)

2

In [95]:
horarios.keys()

dict_keys(['Laboratorio 1', 'Teoricas'])

In [96]:
list(horarios.keys())[0]

'Laboratorio 1'

Esta bien pero necesitariamos conservar el orden, asi es ese mismo orden el que se vuelca a la tabla Excel. Para eso necesitamos diccionarios ordenados...

In [97]:
from collections import OrderedDict

In [107]:
horarios =  OrderedDict([('Teoricas', ['Monday','Wednesday']), ('Laboratorio 1', ['Friday'])])

In [108]:
horarios['Teoricas']

['Monday', 'Wednesday']

In [109]:
horarios.__len__()

2

In [110]:
list(horarios.keys())[0]

'Teoricas'

In [111]:
list(horarios.keys())[1]

'Laboratorio 1'

## Comenzamos la modularizacion del codigo

In [116]:
pagina = 'http://exactas.uba.ar/academico/display.php?estructura=2&desarrollo=1&id_caja=31&nivel_caja=1'

In [119]:
def lista_de_feriados(pagina_web_calendario_exactas, guardar=False):
    from bs4 import BeautifulSoup
    from urllib.request import urlopen
    import codecs

    response = urlopen(pagina_web_calendario_exactas)
    html = response.read()
    soup = BeautifulSoup(html,"lxml")

    # el 1 al final de la siguiente linea es porque la table que buscamos
    # en el sitio web de la FCEN es la *segunda tabla* que aparece con la
    # descripcion de clase "tabla_persona", esperemos que no la cambien!
    tabla_feriados = soup.findAll("table", {"class" : "tabla_persona"})[1] 

    feriados = []

    records = []
    for row in tabla_feriados.findAll('tr')[1:]:
        col = row.findAll('td')
        fecha_feriado = col[0].string.strip()
        razon_feriado = col[1].string.strip()
        record = '%s,%s' % (fecha_feriado, razon_feriado) 
        records.append(record)
        feriados.append(fecha_feriado)
    
    if guardar == True:
        fl = codecs.open('Lista_de_Feriados.txt', 'wb', 'utf8')
        line = ';'.join(records)
        fl.write(line + u'\r\n')
        fl.close()
        
    return feriados

In [122]:
feriados = []
feriados = lista_de_feriados(pagina)
feriados

['01-01-2016',
 '08-02-2016',
 '09-02-2016',
 '24-03-2016',
 '24-03-2016',
 '25-03-2016',
 '02-04-2016',
 '23-04-2016',
 '24-04-2016',
 '24-04-2016',
 '29-04-2016',
 '30-04-2016',
 '01-05-2016',
 '25-05-2016',
 '20-06-2016',
 '08-07-2016',
 '09-07-2016',
 '15-08-2016',
 '21-09-2016',
 '03-10-2016',
 '04-10-2016',
 '10-10-2016',
 '11-10-2016',
 '12-10-2016',
 '28-11-2016',
 '08-12-2016',
 '09-12-2016',
 '25-12-2016']

In [114]:
fecha_inicio = datetime.date(2016,3,14)
fecha_final  = datetime.date(2016,7,2)

cursada = [fecha_inicio, fecha_final]
cursada

In [126]:
turno = list(horarios.keys())[0]
turno

'Teoricas'

In [127]:
# Comenzamos detectando fechas entre inicio y final
def lista_de_dias_de_clase(horarios, turno, cursada, feriados):
    import datetime
    
    delta = cursada[1] - cursada[0]

    lista_dias = []
    contador = 0

    for i in range(delta.days + 1):
        current = fecha_inicio + datetime.timedelta(days=i)
        if current.strftime("%A") in horarios[turno]:
            lista_dias.append(current)
            contador += 1
           
    return lista_dias

In [135]:
dias_de_teoricas = lista_de_dias_de_clase(horarios, turno, cursada, feriados) 
dias_de_teoricas

[datetime.date(2016, 3, 14),
 datetime.date(2016, 3, 16),
 datetime.date(2016, 3, 21),
 datetime.date(2016, 3, 23),
 datetime.date(2016, 3, 28),
 datetime.date(2016, 3, 30),
 datetime.date(2016, 4, 4),
 datetime.date(2016, 4, 6),
 datetime.date(2016, 4, 11),
 datetime.date(2016, 4, 13),
 datetime.date(2016, 4, 18),
 datetime.date(2016, 4, 20),
 datetime.date(2016, 4, 25),
 datetime.date(2016, 4, 27),
 datetime.date(2016, 5, 2),
 datetime.date(2016, 5, 4),
 datetime.date(2016, 5, 9),
 datetime.date(2016, 5, 11),
 datetime.date(2016, 5, 16),
 datetime.date(2016, 5, 18),
 datetime.date(2016, 5, 23),
 datetime.date(2016, 5, 25),
 datetime.date(2016, 5, 30),
 datetime.date(2016, 6, 1),
 datetime.date(2016, 6, 6),
 datetime.date(2016, 6, 8),
 datetime.date(2016, 6, 13),
 datetime.date(2016, 6, 15),
 datetime.date(2016, 6, 20),
 datetime.date(2016, 6, 22),
 datetime.date(2016, 6, 27),
 datetime.date(2016, 6, 29)]

In [144]:
workbook = xlsxwriter.Workbook('prueba2.xlsx')
worksheet = workbook.add_worksheet('Cronograma')

# Widen the first column to make the text clearer.
# worksheet.set_column('A:A', 20)

# Add a bold format to use to highlight cells.
bold = workbook.add_format({'bold': True})

# Escribamos los encabezados de la primera linea.
worksheet.write('A1', 'Clase', bold)
worksheet.write('B1', 'Fecha', bold)

# Titulos de turnos
j = 2
for elem in horarios:
    worksheet.write(0, j, list(horarios.keys())[j-2])
    j += 1

# Escribimos cada turno, despues se ordena la columna fecha
# para tener el cronograma integrado.
linea = 1
contador_clase = 1
for dia in dias_de_teoricas:
    # Escribimos la fecha
    worksheet.write(linea, 1, dia.strftime('%d-%m-%Y'))
 
    # Chequeamos si es un feriado:
    #   si lo es, lo advertimos y no numeramos la clase;
    #   de otra forma numeramos la clase
    if dia.strftime('%d-%m-%Y') in feriados:
        worksheet.write(linea, 2, "Feriado")
    else:
        worksheet.write(linea, 0, turno + " " + '{0:02d}'.format(contador_clase))
        contador_clase += 1
    linea += 1 

workbook.close()

Ahora solo queda generalizar esto para incorporar la escritura de todos los turnos...

In [142]:
for turnos in horarios:
    print(turnos)

Teoricas
Laboratorio 1


In [147]:
workbook = xlsxwriter.Workbook('prueba3.xlsx')
worksheet = workbook.add_worksheet('Cronograma')

# Widen the first column to make the text clearer.
# worksheet.set_column('A:A', 20)

# Add a bold format to use to highlight cells.
bold = workbook.add_format({'bold': True})

# Escribamos los encabezados de la primera linea.
worksheet.write('A1', 'Clase', bold)
worksheet.write('B1', 'Fecha', bold)

# Titulos de turnos
j = 2
for elem in horarios:
    worksheet.write(0, j, list(horarios.keys())[j-2])
    j += 1

# Escribimos cada turno, despues se ordena la columna fecha
# para tener el cronograma integrado.
linea = 1

for turno in horarios:
    contador_clase = 1
    dias_del_turno = lista_de_dias_de_clase(horarios, turno, cursada, feriados) 
    for dia in dias_del_turno:
        # Escribimos la fecha
        worksheet.write(linea, 1, dia.strftime('%d-%m-%Y'))
 
        # Chequeamos si es un feriado:
        #   si lo es, lo advertimos y no numeramos la clase;
        #   de otra forma numeramos la clase
        if dia.strftime('%d-%m-%Y') in feriados:
            worksheet.write(linea, 2, "Feriado")
        else:
            worksheet.write(linea, 0, turno + " " + '{0:02d}'.format(contador_clase))
            contador_clase += 1
        linea += 1 

workbook.close()

Genial! Parece funcionar correctamente. Vamos a probarlo con el caso real de este cuatrimestre...

In [160]:
def escribir_cronograma_excel(archivo):
    import xlsxwriter
    
    workbook = xlsxwriter.Workbook(archivo + '.xlsx')
    worksheet = workbook.add_worksheet('Cronograma')

    # Add a bold format to use to highlight cells.
    bold = workbook.add_format({'bold': True})

    # Escribamos los encabezados de la primera linea.
    worksheet.write('A1', 'Clase', bold)
    worksheet.write('B1', 'Fecha', bold)

    # Titulos de turnos
    j = 2
    for elem in horarios:
        worksheet.write(0, j, list(horarios.keys())[j-2])
        j += 1

    # Escribimos cada turno, despues se ordena la columna fecha
    # para tener el cronograma integrado.
    linea = 1

    for turno in horarios:
        contador_clase = 1
        dias_del_turno = lista_de_dias_de_clase(horarios, turno, cursada, feriados) 
        for dia in dias_del_turno:
            # Escribimos la fecha
            worksheet.write(linea, 1, dia.strftime('%d-%m-%Y'))
 
            # Chequeamos si es un feriado:
            #   si lo es, lo advertimos y no numeramos la clase;
            #   de otra forma numeramos la clase
            if dia.strftime('%d-%m-%Y') in feriados:
                worksheet.write(linea, 2, "Feriado")
            else:
                worksheet.write(linea, 0, turno + " " + '{0:02d}'.format(contador_clase))
                contador_clase += 1
            linea += 1 

    workbook.close()

## Habiendo definido todo, operamos

In [161]:
fecha_inicio = datetime.date(2016,3,14)
fecha_final  = datetime.date(2016,7,2)
cursada = [fecha_inicio, fecha_final]
pagina = 'http://exactas.uba.ar/academico/display.php?estructura=2&desarrollo=1&id_caja=31&nivel_caja=1i'
horarios =  OrderedDict([('Teoricas', ['Monday','Wednesday']), 
                         ('Laboratorio 1', ['Tuesday']), 
                         ('Laboratorio 2', ['Friday'])])

In [162]:
feriados = lista_de_feriados(pagina)

In [163]:
escribir_cronograma_excel('pruebareal')

# Solo falta ver como prepararlo para uso desde la linea de comandos

Sobre todo el problema es determinar cual es la forma mas comoda de pasarle los argumentos...

In [293]:
f = open('MiCursada.txt', 'r') # 'r' = read
linea = []
for line in f:
    linea.append(line.rstrip('\n').strip())
    print(line) # note, coma erases the "cartridge return"
f.close()

14-03-2016

02-07-2016

http://exactas.uba.ar/academico/display.php?estructura=2&desarrollo=1&id_caja=31&nivel_caja=1

Teoricas:Monday

Laboratorio 1:Tuesday

Laboratorio 2:Friday



Intentemos *parsear* este archivo

In [294]:
linea

['14-03-2016',
 '02-07-2016',
 'http://exactas.uba.ar/academico/display.php?estructura=2&desarrollo=1&id_caja=31&nivel_caja=1',
 'Teoricas:Monday',
 'Laboratorio 1:Tuesday',
 'Laboratorio 2:Friday']

In [295]:
linea[3].split(':')

['Teoricas', 'Monday']

In [181]:
linea[4].split(':')

['Laboratorio 1', 'Tuesday']

In [186]:
turno, dias = linea[3].split(':')

In [190]:
intento_horario = OrderedDict([(turno, [dias])])

In [191]:
intento_horario

OrderedDict([('Teoricas', ['Monday,Wednesday'])])

In [192]:
intento_horario = OrderedDict()

In [193]:
intento_horario.update({turno: [dias]})

In [194]:
intento_horario

OrderedDict([('Teoricas', ['Monday,Wednesday'])])

In [195]:
turno2, dias2 = linea[4].split(':')

In [196]:
intento_horario.update({turno2: [dias2]})

In [197]:
intento_horario

OrderedDict([('Teoricas', ['Monday,Wednesday']),
             ('Laboratorio 1', ['Tuesday'])])

In [252]:
f = open('MiCursada.txt', 'r') 
datos = []
for line in f:
    datos.append(line.rstrip('\n').strip())
f.close()

fecha_inicio = datos[0]
fecha_final = datos[1]
pagina = datos[2]

datos = datos[3:]

horarios = OrderedDict()
for linea in datos:
    turno, dia = linea.split(':')
    horarios.update({turno: [dia]})

In [253]:
horarios

OrderedDict([('Teoricas', ['Monday,Wednesday']),
             ('Laboratorio 1', ['Tuesday']),
             ('Laboratorio 2', ['Friday'])])

In [254]:
pagina

'http://exactas.uba.ar/academico/display.php?estructura=2&desarrollo=1&id_caja=31&nivel_caja=1'

In [255]:
fecha_inicio

'14-03-2016'

In [256]:
fecha_final

'02-07-2016'

# Como convertir estos strings a fechas que entienda...

In [222]:
fecha_final

'02-07-2016'

In [224]:
datetime.datetime.strptime(fecha_final, '%d-%m-%Y').date()

datetime.date(2016, 7, 2)

# Empaquetemoslo todo!

In [296]:
def parsear_datos_iniciales(archivo_de_datos_de_cursada):
    
    f = open(archivo_de_datos_de_cursada, 'r') 
    datos = []
    for line in f:
        datos.append(line.rstrip('\n').strip())
    f.close()

    fecha_inicio = datetime.datetime.strptime(
        datos[0],'%d-%m-%Y').date()
    fecha_final = datetime.datetime.strptime(
        datos[1],'%d-%m-%Y').date()
    lapso_cursada = [fecha_inicio, fecha_final]
    pagina = datos[2]

    datos = datos[3:]

    horarios = OrderedDict()
    for linea in datos:
        turno, dia = linea.split(':')
        dias = dia.split(',')
        horarios.update({turno: dias})
    
    return fecha_inicio, fecha_final, pagina, horarios

In [297]:
def lista_de_dias_de_clase(horarios, turno, fecha_inicio, fecha_final, feriados):
    import datetime
    
    delta = fecha_final - fecha_inicio

    lista_dias = []
    contador = 0

    for i in range(delta.days + 1):
        current = fecha_inicio + datetime.timedelta(days=i)
        if current.strftime("%A") in horarios[turno]:
            lista_dias.append(current)
            contador += 1
           
    return lista_dias

In [298]:
def lista_de_feriados(pagina_web_calendario_exactas, guardar=False):
    from bs4 import BeautifulSoup
    from urllib.request import urlopen
    import codecs

    response = urlopen(pagina_web_calendario_exactas)
    html = response.read()
    soup = BeautifulSoup(html,"lxml")

    # el 1 al final de la siguiente linea es porque la table que buscamos
    # en el sitio web de la FCEN es la *segunda tabla* que aparece con la
    # descripcion de clase "tabla_persona", esperemos que no la cambien!
    tabla_feriados = soup.findAll("table", {"class" : "tabla_persona"})[1] 

    feriados = []

    records = []
    for row in tabla_feriados.findAll('tr')[1:]:
        col = row.findAll('td')
        fecha_feriado = col[0].string.strip()
        razon_feriado = col[1].string.strip()
        record = '%s,%s' % (fecha_feriado, razon_feriado) 
        records.append(record)
        feriados.append(fecha_feriado)
    
    if guardar == True:
        fl = codecs.open('Lista_de_Feriados.txt', 'wb', 'utf8')
        line = ';'.join(records)
        fl.write(line + u'\r\n')
        fl.close()
        
    return feriados

In [299]:
def escribir_cronograma_excel(archivo, horarios, fecha_inicio, fecha_final, feriados):
    import xlsxwriter
    
    workbook = xlsxwriter.Workbook(archivo + '.xlsx')
    worksheet = workbook.add_worksheet('Cronograma')

    # Add a bold format to use to highlight cells.
    bold = workbook.add_format({'bold': True})

    # Escribamos los encabezados de la primera linea.
    worksheet.write('A1', 'Clase', bold)
    worksheet.write('B1', 'Fecha', bold)

    # Titulos de turnos
    j = 2
    for elem in horarios:
        worksheet.write(0, j, list(horarios.keys())[j-2])
        j += 1

    # Escribimos cada turno, despues se ordena la columna fecha
    # para tener el cronograma integrado.
    linea = 1

    for turno in horarios:
        contador_clase = 1
        dias_del_turno = lista_de_dias_de_clase(horarios, turno, fecha_inicio, fecha_final, feriados) 
        for dia in dias_del_turno:
            # Escribimos la fecha
            worksheet.write(linea, 1, dia.strftime('%d-%m-%Y'))
 
            # Chequeamos si es un feriado:
            #   si lo es, lo advertimos y no numeramos la clase;
            #   de otra forma numeramos la clase
            if dia.strftime('%d-%m-%Y') in feriados:
                worksheet.write(linea, 2, "Feriado")
            else:
                worksheet.write(linea, 0, turno + " " + '{0:02d}'.format(contador_clase))
                contador_clase += 1
            linea += 1 

    workbook.close()

In [307]:
def crear_cronograma(archivo_de_datos_de_cursada, archivo_salida):
    
    fecha_inicio, fecha_final, pagina, horarios = parsear_datos_iniciales(archivo_de_datos_de_cursada)
    feriados = lista_de_feriados(pagina)
    escribir_cronograma_excel(archivo_salida, horarios, fecha_inicio, fecha_final, feriados)
    print('Cronograma creado en ' + archivo_salida + '.xlsx.') 

In [308]:
# Ensayamos usar el paquete completo! 
fecha_inicio = []
fecha_final = []
pagina = []
horarios = []
feriados = []
horarios = crear_cronograma('MiCursada.txt','Cronograma_F1Q_1c2016')

Cronograma creado en Cronograma_F1Q_1c2016.xlsx.
