# Análise dos dados da monitoria de Cálculo Diferencial e Integral 1 (02/2018) utilizando Python 3
## Objetivos
1. Quantos atendimentos presenciais e à distância foram realizados no semestre?
2. Qual a quantidade de atendimentos por mês?
3. Quantos alunos diferentes buscaram a monitoria?
4. Os mesmos alunos costumavam buscar a monitoria?
5. Em qual dia da semana houve maior procura?
6. Qual a duração média dos atendimentos (presencial e EAD)?
7. Qual foi o número máximo de atendimentos em um dia?
8. Familiarizar-se com o uso da linguagem voltada à análise de dados.

### Aparência do arquivo csv com os dados dos atendimentos
* **Código**: código do aluno;
* **Tipo**: se o atendimento foi individual ou em grupo, se foram feitos exercícios ou revisão;
* **Data**: data do atendimento;
* **Horário**: horário em que começou e terminou o atendimento;
* **Presencial**: se foi presencial (na sala de monitoria) ou EAD;
* **Dúvidas**: se foi registrado ou não as dúvidas que o aluno apresentou.

In [1]:
from csv import reader

# transformando o arquivo em uma lista de listas
opened_file = open('monitoria.csv')
read_file = reader(opened_file)
monitoria = list(read_file)

# exibindo algumas linhas
for i in range(0,5):
    print(monitoria[i])

['Código', 'Tipo', 'Data', 'Horário', 'Presencial', 'Duvidas']
['2051800', 'Individual', '12-09-2018', '13:00 à 15:30', 'Sala', 'Registrado']
['2052423', 'Exercícios', '17-09-2018', '16:00 à 17:57', 'Sala', 'Registrado']
['2052482', 'Exercícios', '24-09-2018', '00:02 à 00:39', 'Não', 'Registrado']
['2052423', 'Exercícios', '24-09-2018', '14:10 à 17:12', 'Sala', 'Registrado']


### 1. Quantos atendimentos presenciais e à distância foram realizados no semestre?

In [2]:
# removendo o cabeçalho
monitoria = monitoria[1:]

# separando os atendimentos presenciais e EAD
sala = []
ead = []
for row in monitoria:
    if row[4] == 'Sala':
        sala.append(row)
    else:
        ead.append(row)
        
# exibindo os tamanhos das listas, que correspondem à quantidade de atendimentos
print('Sala: {}'.format(len(sala)))
print('EAD: {}'.format(len(ead)))
print('Total: {}'.format(len(monitoria)))

Sala: 36
EAD: 10
Total: 46


### 2. Qual a quantidade de atendimentos por mês?

In [3]:
# retorna um dicionário com a quantidade de atendimentos por dia de um determinado mês
def month(date, month):
    if date not in month:
        month[date] = 1
    else:
        month[date] += 1
    return month

# calcula o total de atendimentos no mês
def total(month):
    total = 0
    for value in month.values():
        total += value
    return total

# exibe organizadamente os dados do mês argumentado
def print_month(string, month):
    print(string + ' (Day, Quant.):')
    for m in month.items():
        print(m)
    print('total quant.', total(month),'\n')


import datetime as dt
# exibindo os dias dos meses de setembro, outubro, novembro e dezembro, nos quais houveram
# atendimentos, assim como a quantidade respectiva e o total no mês
september = {}
october = {}
november = {}
december = {}
for row in monitoria:
    date = dt.datetime.strptime(row[2],"%d-%m-%Y")
    if date.month == 9:
        september = month(date.day, september)
    elif date.month == 10:
        october = month(date.day, october)
    elif date.month == 11:
        november = month(date.day, november)
    elif date.month == 12:
        december = month(date.day, december)
print_month('September', september)
print_month('October', october)
print_month('November', november)
print_month('December', december)

September (Day, Quant.):
(12, 1)
(17, 1)
(24, 2)
total quant. 4 

October (Day, Quant.):
(1, 1)
(3, 1)
(9, 1)
(17, 3)
(22, 2)
(24, 1)
(29, 4)
(31, 2)
total quant. 15 

November (Day, Quant.):
(5, 1)
(7, 1)
(12, 5)
(21, 3)
(18, 1)
(20, 1)
(19, 2)
(25, 2)
(28, 1)
total quant. 17 

December (Day, Quant.):
(3, 4)
(5, 3)
(10, 2)
(6, 1)
total quant. 10 



### 3. Quantos alunos diferentes buscaram a monitoria?

In [17]:
# contando quantas vezes cada aluno compareceu
code = {}
for row in monitoria:
    if row[0] not in code:
        code[row[0]] = 1
    else:
        code[row[0]] += 1
        
# mostrando o tamanho do dicionário, que representa a quantidade de alunos que foram
print('Students: ', len(code))

Students:  14


### 4. Os mesmos alunos costumavam buscar a monitoria?

In [16]:
# transformando o dicionário em uma lista e invertendo as colunas para ordenar
# do aluno que mais buscou atendimento para o que menos buscou
code_list = []
for c in code.items():
    code_list.append([c[1],c[0]])
code_list = sorted(code_list, reverse = True)
print('Quant, Code')
for c in code_list:
    print(c)

Quant, Code
[17, '2052423']
[5, '2052300']
[4, '2053446']
[4, '2051001']
[3, '1835947']
[3, '1828193']
[2, '2053560']
[2, '1828207']
[1, '2100908']
[1, '2052482']
[1, '2051800']
[1, '1999230']
[1, '1999184']
[1, '1997777']


### 5. Em qual dia da semana houve maior procura?

In [15]:
# utilizando o método weekday, que retorna o dia da semana correspondente
# à data argumentada, para criar um dicionário com os dias da semana e o
# a quantidade de atendimentos de cada um, de todo o semestre
week = {}
for row in monitoria:
    date = dt.datetime.strptime(row[2],"%d-%m-%Y")
    if date.weekday() not in week:
        week[date.weekday()] = 1
    else:
        week[date.weekday()] += 1
sorted_week = sorted(list(week))
print('Day : Quant.')
for w in sorted_week:
    print(w, ':', week[w])

Day : Quant.
0 : 24
1 : 2
2 : 16
3 : 1
6 : 3


### 6. Qual a duração média dos atendimentos (presencial e EAD)?

In [9]:
# somando o tempo de cada atendimento EAD e presencial, e dividindo pelo número
# de atendimentos respectivo
sum_pre = dt.timedelta()
sum_ead = dt.timedelta()
for row in monitoria:
    time = row[3].split(' à ')
    time0 = dt.datetime.strptime(time[0],"%H:%M")
    time1 = dt.datetime.strptime(time[1],"%H:%M")
    delta = time1 - time0
    if row[4] == 'Sala':
        sum_pre += delta
    else:
        sum_ead += delta
print('Sala: ', sum_pre/len(sala))
print('EAD: ', sum_ead/len(ead))

Sala:  1:22:00
EAD:  0:26:48


### 7. Qual foi o número máximo de atendimentos em um dia?

In [12]:
# itera sobre os valores do dicionário e encontra o maior
def found_max(month):
    global Max
    for m in month.values():
        if Max < m:
            Max = m


# encontrando e exibindo o máximo número de atendimentos entre todos os meses
Max = 0
found_max(september)
found_max(october)
found_max(november)
found_max(december)
print('Max:',Max)

Max: 5


## Conclusões
   Observa-se que o número de atendimentos total foi baixo(36 presenciais e 10 EAD, totalizando 46), tendo em vista que, em vários dias, este foi zero.

   O mês com maior número de atendimentos foi novembro, o que já era esperado devido ao acúmulo de provas no fim do semestre. Em contrapartida, setembro foi o que obteve menos atendimentos, possivelmente devido o início da monitoria ter ocorrido nesse mês.

   Apenas 14 alunos buscaram a monitoria, sendo que alguns deles não estavam matriculados nas turmas de Cálculo Dif. e Integral 1 (que totalizam 44 estudantes). Desses 14, a maioria frequentou apenas 1 ou 2 vezes, destacando-se um aluno que foi atendido 17 vezes.

   O dia da semana mais procurado foi segunda-feira, provavelmente devido ao fato dos alunos estudarem nos finais de semana. A média de tempo dos atendimentos na sala foi alta, de 1 hora e 22 minutos, enquanto que EAD foi 26 minutos. O máximo de atendimentos que houve em um único dia foi 5.
### 8. Familiarizar-se com o uso da linguagem voltada à análise de dados.
   Com isto, cumpriu-se o último objetivo.