# ETL 
## Requirements

In [None]:
pip install pandas requests Faker

## Extracting

In [26]:
import requests
from datetime import datetime
from faker import Faker


api_url = 'https://jsonplaceholder.typicode.com/todos'

def get_todos():
    response = requests.get(api_url)
    return response.json() if response.status_code == 200 else None

todos = get_todos()

faker = Faker()

for todo in todos:
    createDate = faker.date_time()
    dueDate = faker.date_between(createDate)
    doneDate = faker.date_between(createDate)

    todo['createDate'] = createDate.strftime('%x')
    todo['dueDate'] = dueDate.strftime('%x')

    todo['doneDate'] = doneDate.strftime('%x') if todo['completed'] == True else None

print(todos)

[{'userId': 1, 'id': 1, 'title': 'delectus aut autem', 'completed': False, 'createDate': '02/22/78', 'dueDate': '04/03/95', 'doneDate': None}, {'userId': 1, 'id': 2, 'title': 'quis ut nam facilis et officia qui', 'completed': False, 'createDate': '04/21/07', 'dueDate': '01/19/13', 'doneDate': None}, {'userId': 1, 'id': 3, 'title': 'fugiat veniam minus', 'completed': False, 'createDate': '09/09/05', 'dueDate': '07/03/20', 'doneDate': None}, {'userId': 1, 'id': 4, 'title': 'et porro tempora', 'completed': True, 'createDate': '10/05/18', 'dueDate': '02/04/20', 'doneDate': '08/28/19'}, {'userId': 1, 'id': 5, 'title': 'laboriosam mollitia et enim quasi adipisci quia provident illum', 'completed': False, 'createDate': '12/09/89', 'dueDate': '04/19/12', 'doneDate': None}, {'userId': 1, 'id': 6, 'title': 'qui ullam ratione quibusdam voluptatem quia omnis', 'completed': False, 'createDate': '07/03/70', 'dueDate': '05/16/89', 'doneDate': None}, {'userId': 1, 'id': 7, 'title': 'illo expedita cons

## Transforming

In [29]:
import pandas as pd
df = pd.DataFrame(todos)

# Análise de padrões de uso
print("Total de tarefas: ", len(df))
print("Total de tarefas concluídas: ", df['completed'].sum())

# Análise de desempenho
df['doneDate'] = pd.to_datetime(df['doneDate'])
df['dueDate'] = pd.to_datetime(df['dueDate'])
df['delay'] = df['doneDate'] - df['dueDate']
avg_delay = df['delay'].mean()

if avg_delay.days < 0:
    print("As tarefas são concluídas em média", abs(avg_delay.days), "dias antes do prazo.")
else:
    print("As tarefas são concluídas em média", avg_delay.days, "dias de atraso.")

# Análise de produtividade
df['createDate'] = pd.to_datetime(df['createDate'])
df['completionTime'] = df['doneDate'] - df['createDate']
avg_completionTime = df['completionTime'].mean()

print("Tempo médio para conclusão de uma tarefa: ", avg_completionTime)


Total de tarefas:  200
Total de tarefas concluídas:  90
As tarefas são concluídas em média 296 dias de atraso.
Tempo médio para conclusão de uma tarefa:  2120 days 10:56:00


  df['doneDate'] = pd.to_datetime(df['doneDate'])
  df['dueDate'] = pd.to_datetime(df['dueDate'])
  df['createDate'] = pd.to_datetime(df['createDate'])


## Loading

In [30]:
df.to_csv('todos_data.csv', index=False)