<a href="https://colab.research.google.com/github/Oreki820/ETL-SIMPLES-DIO/blob/main/ETL_DIO.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Importações + Criação do DataFrame (EXTRACT)

In [6]:
import pandas as pd

# Simulação de banco de dados de usuários
dados = {
    "id": [1,2,3,4,5,6,7,8,9,10],
    "nome": ["Priscila","Lucas","Renato","Amanda","João","Beatriz","Felipe","Karina","Daniel","Mariana"],
    "interesse": ["Python","IA","Nuvem","Data Science","Machine Learning","Front-end","Back-end","Estatística","DevOps","Cybersecurity"],
    "nivel": ["Iniciante","Avançado","Intermediário","Iniciante","Intermediário","Iniciante","Avançado","Iniciante","Intermediário","Avançado"]
}

df = pd.DataFrame(dados)
df

Unnamed: 0,id,nome,interesse,nivel
0,1,Priscila,Python,Iniciante
1,2,Lucas,IA,Avançado
2,3,Renato,Nuvem,Intermediário
3,4,Amanda,Data Science,Iniciante
4,5,João,Machine Learning,Intermediário
5,6,Beatriz,Front-end,Iniciante
6,7,Felipe,Back-end,Avançado
7,8,Karina,Estatística,Iniciante
8,9,Daniel,DevOps,Intermediário
9,10,Mariana,Cybersecurity,Avançado


# **TRANSFORMAÇÃO (SEM IA / LÓGICA CUSTOMIZADA)**

In [7]:
def gerar_recomendacao(interesse, nivel):

    cursos = {
        "Python": {
            "Iniciante": "Lógica de Programação com Python + Introdução ao Python",
            "Intermediário": "Manipulação de Dados com Pandas + APIs em Python",
            "Avançado": "Automação, Web Scraping e Python para IA"
        },
        "IA": {
            "Iniciante": "Inteligência Artificial para Iniciantes",
            "Intermediário": "Machine Learning com Python",
            "Avançado": "Deep Learning + Redes Neurais Avançadas"
        },
        "Nuvem": {
            "Iniciante": "Fundamentos de Computação em Nuvem",
            "Intermediário": "AWS Practitioner",
            "Avançado": "Arquitetura Cloud e DevOps"
        },
        "Data Science": {
            "Iniciante": "Fundamentos de Data Science",
            "Intermediário": "Análise Exploratória + Estatística Aplicada",
            "Avançado": "Machine Learning Completo"
        },
        "Machine Learning": {
            "Iniciante": "Introdução ao ML para Iniciantes",
            "Intermediário": "Modelos Preditivos com Python",
            "Avançado": "ML Avançado + XGBoost e Otimização"
        },
        "Front-end": {
            "Iniciante": "HTML e CSS do Zero",
            "Intermediário": "JavaScript e React Básico",
            "Avançado": "React Avançado + Performance"
        },
        "Back-end": {
            "Iniciante": "Lógica + Introdução a APIs",
            "Intermediário": "Node.js + Banco de Dados",
            "Avançado": "Arquitetura e Escalabilidade"
        },
        "Estatística": {
            "Iniciante": "Estatística Básica para Dados",
            "Intermediário": "Probabilidade e Análise Descritiva",
            "Avançado": "Inferência Estatística e Modelagem"
        },
        "DevOps": {
            "Iniciante": "Fundamentos de Sistemas",
            "Intermediário": "Docker + Linux",
            "Avançado": "CI/CD + Kubernetes"
        },
        "Cybersecurity": {
            "Iniciante": "Fundamentos de Segurança",
            "Intermediário": "Pentest Iniciante",
            "Avançado": "Hacking Ético e Segurança Ofensiva"
        }
    }

    return cursos.get(interesse, {}).get(nivel, "Curso não encontrado")

# Aplicar a Transformação ao DataFrame

In [8]:
df["recomendacao"] = df.apply(
    lambda row: gerar_recomendacao(row["interesse"], row["nivel"]),
    axis=1
)

df

Unnamed: 0,id,nome,interesse,nivel,recomendacao
0,1,Priscila,Python,Iniciante,Lógica de Programação com Python + Introdução ...
1,2,Lucas,IA,Avançado,Deep Learning + Redes Neurais Avançadas
2,3,Renato,Nuvem,Intermediário,AWS Practitioner
3,4,Amanda,Data Science,Iniciante,Fundamentos de Data Science
4,5,João,Machine Learning,Intermediário,Modelos Preditivos com Python
5,6,Beatriz,Front-end,Iniciante,HTML e CSS do Zero
6,7,Felipe,Back-end,Avançado,Arquitetura e Escalabilidade
7,8,Karina,Estatística,Iniciante,Estatística Básica para Dados
8,9,Daniel,DevOps,Intermediário,Docker + Linux
9,10,Mariana,Cybersecurity,Avançado,Hacking Ético e Segurança Ofensiva


# LOAD (SALVAR RESULTADOS)

In [9]:
# Excel
df.to_excel("usuarios_transformados.xlsx", index=False)

# CSV
df.to_csv("usuarios_transformados.csv", index=False)

# JSON
df.to_json("usuarios_transformados.json", orient="records", indent=4)

# Mostrar mensagem final

In [10]:
print("Pipeline ETL executado com sucesso!")
print("Arquivos gerados: usuarios_transformados.xlsx / csv / json")

Pipeline ETL executado com sucesso!
Arquivos gerados: usuarios_transformados.xlsx / csv / json
