Este é um aplicativo Next.js projetado para transformar roteiros de vídeo em prompts detalhados e otimizados para modelos de IA generativa de vídeo e imagem, como VEO e Gemini.
O Velum Media Engine analisa um roteiro em texto, o segmenta em cenas com ritmo controlado (pacing) e gera múltiplos prompts de alta fidelidade para cada cena, com base em uma direção de arte selecionada. É a ferramenta ideal para diretores, criadores de conteúdo e artistas visuais que desejam acelerar o processo de criação de storyboards e produção de vídeos com IA.
Siga estas instruções para configurar e executar o projeto em seu ambiente de desenvolvimento local.
- Node.js (versão 18 ou superior)
- npm ou yarn
Clone o repositório e instale as dependências do projeto:
npm installPara que o aplicativo possa se comunicar com a API do Gemini, você precisa de uma chave de API.
- Crie um arquivo chamado
.env.localna raiz do projeto. - Adicione sua chave de API do Google AI Studio ao arquivo da seguinte forma:
NEXT_PUBLIC_GEMINI_API_KEY=SUA_CHAVE_DE_API_AQUI
Nota: Você pode usar o gerenciador de chaves integrado na interface do aplicativo para carregar um arquivo
.txtcom múltiplas chaves. Isso ajuda a distribuir as requisições e evitar limites de taxa.
Após a instalação e configuração, inicie o servidor de desenvolvimento:
npm run devAbra http://localhost:9002 (ou a porta que seu terminal indicar) em seu navegador para ver o aplicativo em funcionamento.
- Upload de Roteiro: Envie seu roteiro em um arquivo de texto simples (
.txt). - Pacing Inteligente: O roteiro é automaticamente dividido em cenas de 8 segundos, com base em uma taxa de fala média, garantindo um ritmo consistente.
- Seleção de Estilo Global: Escolha entre diversos estilos de direção de arte (Cinematográfico, Anime, Cyberpunk, etc.) para guiar a geração dos prompts.
- Geração de Prompts Multi-Modelo: Para cada cena, o sistema gera prompts otimizados para:
- VEO 3.1: Focado em movimento cinematográfico e instruções de câmera.
- Gemini 2.5 Flash: Para imagens icônicas e de rápida geração.
- Whisk Pro (Gemini Pro Image): Para imagens com detalhes artísticos e alta fidelidade.
- Sora: Um prompt extra, mais descritivo e detalhado.
- Gerenciador de Chaves: Carregue um arquivo com várias chaves de API para fazer um rodízio automático a cada processamento.
- Exportação de Resultados: Baixe os prompts gerados em arquivos de texto, seja o projeto completo ou filtrado por modelo de IA.