# GAN Video

Esse código Python demonstra o uso da DiffusionPipeline do pacote Diffusers para gerar um vídeo a partir de descrições textuais. 


1. Importamos o módulo torch e diffusers

2. De diffusers, importamos a classe DiffusionPipeline. Essa é a classe responsável por gerenciar todo o processo de geração de imagens/vídeos com os modelos de Diffusion.

3. Também importamos a função utils export_to_video. Essa função irá converter as imagens geradas pela DiffusionPipeline em um vídeo.

4. A partir daqui, podemos criar uma instância da DiffusionPipeline configurada com o modelo de Diffusion desejado (por exemplo, Stable Diffusion).

5. Em seguida, chamamos o método .process() passando uma lista de descrições textuais para cada quadro que queremos gerar.

6. O pipeline gera imagens automaticamente a partir dessas descrições.

7. Por fim, passamos essas imagens para a função export_to_video para gerar nosso vídeo final.

Então esse código fornece uma maneira fácil e poderosa de usar os modelos de Diffusion para gerar vídeos automaticamente a partir de texto!

In [None]:
!pip install diffusers transformers accelerate safetensors

In [None]:
import torch
from diffusers import DiffusionPipeline
from diffusers.utils import export_to_video

In [None]:
prompt = "Superman dancing in the rain"
num_inference_steps = 50
num_frames = 32 #padrão 16
pretrained_model_or_path = "damo-vilab/text-to-video-ms-1.7b"

In [None]:
pipeline = DiffusionPipeline.from_pretrained(pretrained_model_or_path ,
                                             torch_dtype=torch.float16, variant="fp16").to("cuda")
video_frames = pipeline(prompt=prompt,num_inference_steps=num_inference_steps, num_frames=num_frames).frames
export_to_video(video_frames, "superman.mp4")

Downloading (…)ain/model_index.json:   0%|          | 0.00/384 [00:00<?, ?B/s]

Fetching 12 files:   0%|          | 0/12 [00:00<?, ?it/s]

Downloading (…)f74/unet/config.json:   0%|          | 0.00/787 [00:00<?, ?B/s]

Downloading (…)cheduler_config.json:   0%|          | 0.00/465 [00:00<?, ?B/s]

Downloading (…)cial_tokens_map.json:   0%|          | 0.00/460 [00:00<?, ?B/s]

Downloading (…)tokenizer/merges.txt:   0%|          | 0.00/525k [00:00<?, ?B/s]

Downloading (…)tokenizer/vocab.json:   0%|          | 0.00/1.06M [00:00<?, ?B/s]

Downloading (…)8f74/vae/config.json:   0%|          | 0.00/657 [00:00<?, ?B/s]

Downloading (…)_encoder/config.json:   0%|          | 0.00/644 [00:00<?, ?B/s]

Downloading (…)okenizer_config.json:   0%|          | 0.00/755 [00:00<?, ?B/s]

Downloading model.fp16.safetensors:   0%|          | 0.00/681M [00:00<?, ?B/s]

Downloading (…)del.fp16.safetensors:   0%|          | 0.00/167M [00:00<?, ?B/s]

Downloading (…)del.fp16.safetensors:   0%|          | 0.00/2.82G [00:00<?, ?B/s]

Loading pipeline components...:   0%|          | 0/5 [00:00<?, ?it/s]

  0%|          | 0/50 [00:00<?, ?it/s]

'superman.mp4'