<a href="https://colab.research.google.com/github/edersonmcm/indMDL4/blob/main/edersonTrbIndividualMDL4.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## ***Importando Bibliotecas***
- **`import pandas as pd`**: Importa a biblioteca Pandas para manipulação de dados, utilizando `pd` como um alias para referência mais curta.

- **`from google.colab import files`**: Importa o módulo `files` do ambiente Google Colab, permitindo operações de upload e download de arquivos diretamente no notebook.

- **`import io`**: Importa o módulo `io`, fornecendo funcionalidades para manipulação de streams de entrada/saída, usado aqui para trabalhar com dados após o upload de arquivos.

In [None]:
import pandas as pd
from google.colab import files
import io

## **Solicitar upload do arquivo**

- **`print("Por favor, faça o upload do arquivo:")`**: Exibe uma mensagem solicitando ao usuário que faça o upload de um arquivo referente ao mês de novembro.

- **`uploaded_nov = files.upload()`**: Utiliza a funcionalidade `upload()` do módulo `files` para permitir que o usuário faça o upload do arquivo. O resultado é armazenado em `uploaded_nov`, um dicionário onde as chaves são os nomes dos arquivos enviados e os valores são os dados dos arquivos.

- **`nome_arquivo_nov = list(uploaded_nov.keys())[0]`**: Extrai o nome do arquivo do primeiro item no dicionário `uploaded_nov`. A função `list(uploaded_nov.keys())` retorna uma lista com os nomes dos arquivos enviados, e `[0]` pega o primeiro nome da lista.

- **`dados_Trb = pd.read_excel(io.BytesIO(uploaded_nov[nome_arquivo_nov]), decimal=',')`**: Utilizando o nome do arquivo, esta linha lê o arquivo Excel enviado pelo usuário utilizando o Pandas (`pd.read_excel`). A função `io.BytesIO` é usada para criar um objeto de leitura a partir dos bytes do arquivo enviado. O parâmetro `decimal=','` é utilizado para lidar com números decimais em formato específico (vírgula como separador decimal).

- **`dados_Trb.name = 'relacao'`**: Este código tenta definir um atributo `name` no DataFrame `dados_Trb`. No entanto, o atributo `name` não é um atributo padrão dos DataFrames no Pandas, então essa linha não terá efeito prático. Se você deseja fornecer um nome ao DataFrame, você pode simplesmente atribuir o nome à variável, como `relacao = dados_Trb`.

In [None]:
# Solicitar upload do arquivo
print("Por favor, faça o upload do arquivo:")
uploaded_nov = files.upload()
nome_arquivo_nov = list(uploaded_nov.keys())[0]

# Ler arquivo de novembro e ajustar o separador decimal
dados_Trb = pd.read_excel(io.BytesIO(uploaded_nov[nome_arquivo_nov]), decimal=',')

# Definir os nomes dos dataframes
dados_Trb.name = 'relacao'

Por favor, faça o upload do arquivo:


Saving trabalhoIndividualML4.xlsx to trabalhoIndividualML4.xlsx


In [None]:
dados_Trb

Unnamed: 0.1,Unnamed: 0,Dia,Horas Trabalhadas,Bugs Corrigidos,Tarefas concluídas
0,0,Segunda,6,3,5
1,1,Terça,7,2,4
2,2,Quarta,8,1,6
3,3,Quinta,6,4,4
4,4,Sexta,7,3,5
5,5,Sábado,5,2,3
6,6,Domingo,4,1,2


## **Manipulação e Análise de Dados**

- **`dados_Trb = dados_Trb.reset_index(drop=True)`**: Remove a coluna índice existente e redefine o DataFrame `dados_Trb` sem a coluna de índice.

- **`dados_Trb['Produtividade Diária'] = dados_Trb['Tarefas concluídas'] / dados_Trb['Horas Trabalhadas']`**: Adiciona uma nova coluna chamada 'Produtividade Diária' ao DataFrame, calculada como a razão entre 'Tarefas concluídas' e 'Horas Trabalhadas'.

- **Calcular Totais e Médias**:
  - **`total_horas_trabalhadas = dados_Trb['Horas Trabalhadas'].sum()`**: Calcula o total de horas trabalhadas.
  - **`media_diaria_horas = dados_Trb['Horas Trabalhadas'].mean()`**: Calcula a média diária de horas trabalhadas.
  - **`total_bugs_corrigidos = dados_Trb['Bugs Corrigidos'].sum()`**: Calcula o total de bugs corrigidos.
  - **`media_diaria_bugs = dados_Trb['Bugs Corrigidos'].mean()`**: Calcula a média diária de bugs corrigidos.
  - **`total_tarefas_concluidas = dados_Trb['Tarefas concluídas'].sum()`**: Calcula o total de tarefas concluídas.
  - **`media_diaria_tarefas = dados_Trb['Tarefas concluídas'].mean()`**: Calcula a média diária de tarefas concluídas.
  - **`media_produtividade_diaria = dados_Trb['Produtividade Diária'].mean()`**: Calcula a média de produtividade diária.

- **Imprimir os resultados**:
  - **`print(f'Total de Horas Trabalhadas: {total_horas_trabalhadas} horas')`**: Imprime o total de horas trabalhadas.
  - **`print(f'Média Diária de Horas Trabalhadas: {media_diaria_horas:.2f} horas')`**: Imprime a média diária de horas trabalhadas.
  - **`print(f'Total de Bugs Corrigidos: {total_bugs_corrigidos}')`**: Imprime o total de bugs corrigidos.
  - **`print(f'Média Diária de Bugs Corrigidos: {media_diaria_bugs:.2f}')`**: Imprime a média diária de bugs corrigidos.
  - **`print(f'Total de Tarefas Concluídas: {total_tarefas_concluidas}')`**: Imprime o total de tarefas concluídas.
  - **`print(f'Média Diária de Tarefas Concluídas: {media_diaria_tarefas:.2f}')`**: Imprime a média diária de tarefas concluídas.
  - **`print(f'Média de Produtividade Diária: {media_produtividade_diaria:.2f} tarefas por hora')`**: Imprime a média de produtividade diária.

In [None]:
# Remover a coluna índice
dados_Trb = dados_Trb.reset_index(drop=True)

# Adicionar coluna de Produtividade Diária
dados_Trb['Produtividade Diária'] = dados_Trb['Tarefas concluídas'] / dados_Trb['Horas Trabalhadas']

# Calcular Totais e Médias
total_horas_trabalhadas = dados_Trb['Horas Trabalhadas'].sum()
media_diaria_horas = dados_Trb['Horas Trabalhadas'].mean()

total_bugs_corrigidos = dados_Trb['Bugs Corrigidos'].sum()
media_diaria_bugs = dados_Trb['Bugs Corrigidos'].mean()

total_tarefas_concluidas = dados_Trb['Tarefas concluídas'].sum()
media_diaria_tarefas = dados_Trb['Tarefas concluídas'].mean()

media_produtividade_diaria = dados_Trb['Produtividade Diária'].mean()


# Imprimir os resultados
print(f'Total de Horas Trabalhadas: {total_horas_trabalhadas} horas')
print(f'Média Diária de Horas Trabalhadas: {media_diaria_horas:.2f} horas')

print(f'Total de Bugs Corrigidos: {total_bugs_corrigidos}')
print(f'Média Diária de Bugs Corrigidos: {media_diaria_bugs:.2f}')

print(f'Total de Tarefas Concluídas: {total_tarefas_concluidas}')
print(f'Média Diária de Tarefas Concluídas: {media_diaria_tarefas:.2f}')

print(f'Média de Produtividade Diária: {media_produtividade_diaria:.2f} tarefas por hora')

Total de Horas Trabalhadas: 43 horas
Média Diária de Horas Trabalhadas: 6.14 horas
Total de Bugs Corrigidos: 16
Média Diária de Bugs Corrigidos: 2.29
Total de Tarefas Concluídas: 29
Média Diária de Tarefas Concluídas: 4.14
Média de Produtividade Diária: 0.66 tarefas por hora


## ***ANÁLISE DO COMPORTAMENTO DOS DADOS***

  Como pode-se perceber na tabela plotada em `dados_Trb`, há uma certa relação entre horas trabalhadas e tarefas concluídas, onde o coeficiente de pearson para essa relação é de, aproximadamente 0.9079 , o que indica uma relação muito forte entre essas variáveis.

  O r de Pearson é um coeficiente de correlação que mede a relação positiva ou negativa entre uma variável e outra (quantitativamene), de modo que (quando negativo) quando uma cresce a outra decresce e de modo positivo quando uma cresce a outra cresce também. No caso mencionado a percepção é positiva.

  Quando analisada a relação entre bugs corrigidos e tarefas concluídas, vemos um r de Perason em, aproximadamente, 0.109, o que indica quase nenhuma ou nula relação. É insuficiente fazer qualquer tipo de afirmação nesta relação. Outra relação nula é entre horas trabalhadas e bugs corrigidos, foi verificado um resultado ainda menor, próximo de 0.0907.

  No que diz respeito aos bugs corrigidos, também é possível verificar que, a media em que os erros são corrigidos e chegam em números próximos de "zero bugs a serem corrigos", existe uma tendência dos bugs aparecerem quando são corrigidos apenas 1. Percebe que de segunda para quarta a quantidade de bugs descresce "-1" todos os dias, até que bugs = 1. Quando bugs = 1, no dia seguinte ele aumenta a sua quantidade de 300% à 400%.

  Além de tais fatores apreciados, há de se ressaltar que os erros corrigidos correspondem à cerca de 35% das horas trabalhadas na semana, levando em consideração a Média de buds corrigidos diariamente e a média diária de horas trabalhadas. A produtividade provavelmente está sendo prejudicada no mal aproveitamento das horas trabalhadas que, em 35% do tempo, está contida e voltada à correções de bugs.

  Visando uma certa proporcionalidade, também podemos afirmar, mesmo que de forma prévia, que exise uma razão matemática entre bugs e tarefas concluídas, de forma que o aproveitamento deve ser revisto.