🚀 Este projeto automatiza transformações de dados e análises exploratórias utilizando a API da OpenAI (ChatGPT). A ideia é permitir que a IA analise colunas, sugira tratamentos e execute comandos automaticamente, gerando gráficos e insights sem precisar de intervenção manual.
✅ 🛠️ Transformação Automática de Dados ✅ 📊 Análises Exploratórias Dinâmicas ✅ 🔍 Limpeza Inteligente de Dados ✅ 🤖 Integração com OpenAI para Sugestões Automáticas ✅ 📉 Geração Automática de Gráficos e Relatórios
O projeto processa um dataset CSV (ou qualquer outro formato suportado para criação de DataFrame), identifica colunas problemáticas e usa a IA para sugerir e executar transformações. Além disso, qualquer pergunta sobre os dados pode ser enviada à IA, que gera códigos prontos para execução automática.
📌 Exemplo de fluxo:
1️⃣ Carrega e processa os dados 2️⃣ A IA analisa as colunas e sugere transformações 3️⃣ O código é executado automaticamente 4️⃣ Insights e gráficos são gerados conforme perguntas do usuário
📦 projeto
┣ 📜 openai_project.py # Código principal com todas as funções
┣ 📜 dataset.csv (exemplo) # Base de dados analisada (pode ser substituída)
┣ 📜 README.md # Documentação
┗ 📜 requirements.txt # Dependências do projeto
git clone https://github.com/RenanBjj/Python-AI-Data-Cleaner.git
cd Python-AI-Data-Cleaner
pip install -r requirements.txt
Crie um arquivo .env
e adicione sua chave da OpenAI:
OPENAI_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxx
Ou, diretamente no código:
import openai
openai.api_key = "sk-xxxxxxxxxxxxxxxxxxxxxxxx"
python openai_project.py
A IA analisa colunas e aplica tratamentos automaticamente:
realizar_transformacao("Stock Quantity")
📌 Exemplo de saída:
📌 Trabalhando na coluna: Stock Quantity
✅ Coluna convertida para float sem perda de dados
Basta fazer uma pergunta que a IA responde com código pronto para execução!
fazer_pergunta("Quais classificações etárias vendem mais?")
📌 Exemplo de saída:
📊 Gráfico gerado com vendas por classificação etária
🔹 Qual publisher tem mais jogos em estoque? 🔹 Existe correlação entre idade do público e preço do jogo? 🔹 Qual mês teve mais pedidos enviados? 🔹 Quais produtos estão com baixo estoque?
🚀 Tudo isso é feito automaticamente!
🔹 Python 🔹 Pandas - Manipulação e limpeza de dados 🔹 Matplotlib & Seaborn - Geração de gráficos 🔹 OpenAI API - Sugestões automáticas e execução de código
Se este projeto te ajudou de alguma forma, deixe uma ⭐ e contribua! Sugestões e melhorias são sempre bem-vindas!
Aqui estão algumas formas de ajudar:
- ⭐ Dê uma estrela no repositório
- 💡 Sugira novas funcionalidades via Issues
- 🛠 Contribua com código via Pull Requests
Este projeto é open-source.
Para dúvidas ou sugestões:
🚀 Criado por Renan Marques com ❤️ e muita automação 🤖!