<a href="https://colab.research.google.com/github/AntoniZalewski/Veo2_Video_Generation_Loop/blob/main/VideoGenerationLoop.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# @title Komórka 1: Instalacja i Przygotowanie Środowiska
print(" Krok 1: Instalowanie niezbędnych bibliotek...")
# ZMIANA: Usunięto 'mlcroissant'
!pip install google-generativeai pillow requests -q
print("✅ Biblioteki zainstalowane.")

 Krok 1: Instalowanie niezbędnych bibliotek...
✅ Biblioteki zainstalowane.


In [None]:
# @title Komórka 2: Konfiguracja i Klucze API (Twoje Centrum Dowodzenia)
import os
import requests
from PIL import Image
from io import BytesIO
from google.colab import drive
from google.colab import userdata
import google.generativeai as genai

print(" Krok 2: Konfiguracja projektu...")

# --- Klucz API ---
try:
    GOOGLE_API_KEY = userdata.get('GOOGLE_API_KEY')
    genai.configure(api_key=GOOGLE_API_KEY)
    print("✅ Klucz GOOGLE_API_KEY wczytany i skonfigurowany.")
except Exception as e:
    print(f"❌ BŁĄD: Nie udało się wczytać klucza API. Upewnij się, że dodałeś go w sekretach (🔑) pod nazwą 'GOOGLE_API_KEY'.")

# --- STRATEGIA: Nowy, potężny i precyzyjny System Prompt ---
# ZMIANA: Dodano regułę nr 4, aby wymusić zwięzłą odpowiedź.
SYSTEM_PROMPT = """
Jesteś ekspertem od kultury internetowej i wiralowych memów. Twoim zadaniem jest stworzenie krótkiego (1-2 zdania) scenariusza na wideo na podstawie zdjęcia kota.
Scenariusz musi spełniać 4 warunki:
1.  **VIBE KOTA:** Perfekcyjnie oddaj nastrój, emocje i pozę kota ze zdjęcia.
2.  **MEME MASHUP:** Wpleć w scenariusz subtelne lub bezpośrednie nawiązanie do innego, znanego formatu mema. Przykłady do inspiracji: 'Distracted Boyfriend', 'Woman Yelling at a Cat', 'This is Fine', 'Drake Hotline Bling', 'Hide the Pain Harold', 'Is this a pigeon?'. Bądź kreatywny.
3.  **FORMAT REELS/TIKTOK:** Scenariusz musi być wizualny, zwięzły i idealny do nałożenia jako chwytliwy tekst na krótki filmik.
4.  **BEZPOŚREDNIA ODPOWIEDŹ:** Twoja odpowiedź musi być TYLKO I WYŁĄCZNIE scenariuszem. Nie dodawaj żadnych wstępów, nagłówków, ani zdań typu 'Oto propozycja:'. Zacznij odpowiedź bezpośrednio od opisu scenariusza (np. od słów "Tekst na ekranie: ...").
"""
print("✅ Zaktualizowany System Prompt został zdefiniowany.")


# --- Źródło Danych ---
drive.mount('/content/drive')
IMAGE_FOLDER_PATH = "/content/drive/MyDrive/Cat_archive/cats_from_memes"
print(f"✅ Cel danych: Folder na Dysku Google: {IMAGE_FOLDER_PATH}")


# --- Miejsce Zapisu Filmów ---
VIDEO_SAVE_PATH = '/content/drive/MyDrive/Wygenerowane_Kocie_Filmy'
os.makedirs(VIDEO_SAVE_PATH, exist_ok=True)
print(f"✅ Filmy będą zapisywane w: {VIDEO_SAVE_PATH}")

 Krok 2: Konfiguracja projektu...
✅ Klucz GOOGLE_API_KEY wczytany i skonfigurowany.
✅ Zaktualizowany System Prompt został zdefiniowany.
Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
✅ Cel danych: Folder na Dysku Google: /content/drive/MyDrive/Cat_archive/cats_from_memes
✅ Filmy będą zapisywane w: /content/drive/MyDrive/Wygenerowane_Kocie_Filmy


In [None]:
# @title Komórka 3: Wczytywanie Danych z Dysku Google (Nasza Kopalnia Kotów)
print(f" Krok 3: Wczytywanie obrazów z folderu: {IMAGE_FOLDER_PATH}...")

image_paths = []
try:
    # Wylistuj wszystkie pliki w folderze
    wszystkie_pliki = os.listdir(IMAGE_FOLDER_PATH)

    # Wybierz tylko te, które są obrazami
    pliki_z_obrazami = [
        plik for plik in wszystkie_pliki
        if plik.lower().endswith(('.png', '.jpg', '.jpeg', '.webp'))
    ]

    if not pliki_z_obrazami:
        print(f"❌ UWAGA: Nie znalazłem żadnych plików obrazów w folderze '{IMAGE_FOLDER_PATH}'.")
        print("Upewnij się, że ścieżka jest poprawna i że pliki zostały już wgrane.")
    else:
        # Tworzymy pełne ścieżki do każdego pliku
        image_paths = [os.path.join(IMAGE_FOLDER_PATH, plik) for plik in pliki_z_obrazami]
        print(f"✅ Sukces! Znaleziono {len(image_paths)} obrazów w Twoim folderze.")

except FileNotFoundError:
    print(f"❌ BŁĄD: Folder nie został znaleziony. Sprawdź, czy ścieżka '{IMAGE_FOLDER_PATH}' jest na pewno poprawna.")

 Krok 3: Wczytywanie obrazów z folderu: /content/drive/MyDrive/Cat_archive/cats_from_memes...
✅ Sukces! Znaleziono 2283 obrazów w Twoim folderze.


In [None]:
# @title Komórka 4: Definicje Funkcji (WERSJA OSTATECZNA i ODPORNA)
import random
import time

print(" Krok 4: Definiowanie funkcji produkcyjnych (WERSJA OSTATECZNA i ODPORNA)...")

# Ta funkcja jest poprawna i pozostaje bez zmian
def get_random_image_path(paths):
    """Wybiera losową ścieżkę do obrazu z listy."""
    return random.choice(paths) if paths else None

# Ta funkcja jest poprawna i pozostaje bez zmian
def generate_scenario_in_two_steps(image_path):
    """Generuje scenariusz w dwóch krokach: Analiza + Kreatywność."""
    print(f"  -> Rozpoczynam dwuetapowe generowanie dla: {os.path.basename(image_path)}")
    try:
        print("    -> Etap 1: Analiza obrazu...")
        img = Image.open(image_path)
        analysis_model = genai.GenerativeModel('gemini-1.5-flash-latest')
        analysis_prompt = """
        Twoim zadaniem jest być precyzyjnym analitykiem obrazu. Opisz to zdjęcie w 3-5 zwięzłych punktach. Skup się na:
        1. Pozie i mowie ciała kota.
        2. Emocjach lub 'vibie', który kot wyraża (np. złość, nuda, ciekawość, osąd).
        3. Charakterystycznych elementach otoczenia.
        Odpowiedz TYLKO w formie listy punktowanej. Nie dodawaj żadnych wstępów.
        """
        analysis_response = analysis_model.generate_content([analysis_prompt, img])
        image_analysis = analysis_response.text
        print(f"    -> Wynik analizy:\n{image_analysis.strip()}")
        print("    -> Etap 2: Tworzenie scenariusza na podstawie analizy...")
        creative_model = genai.GenerativeModel('gemini-1.5-flash-latest')
        creative_user_prompt = f"Na podstawie tej obiektywnej analizy zdjęcia kota:\n---\n{image_analysis}\n---\nStwórz scenariusz, trzymając się swoich głównych wytycznych."
        creative_response = creative_model.generate_content([SYSTEM_PROMPT, creative_user_prompt])
        final_scenario = creative_response.text
        print(f"  -> Otrzymano finalny scenariusz: '{final_scenario.strip()}'")
        return final_scenario.strip()
    except Exception as e:
        print(f"  -> ❌ BŁĄD podczas dwuetapowego generowania: {e}")
        return None

# ==============================================================================
# === ZMIANA: Dodano sprawdzanie uprawnień modelu przed wywołaniem ===
# ==============================================================================
def generate_video_with_veo(image_path, scenario, save_path, video_number):
    """Generuje wideo używając poprawnej metody dla modelu Veo w Gemini API."""
    print(f"  -> Inicjuję generowanie wideo dla pliku: {os.path.basename(image_path)}")

    try:
        # 1. Znajdź model Veo i sprawdź jego uprawnienia
        print("    -> Wyszukuję dostępny model Veo...")
        veo_model_object = None
        for m in genai.list_models():
            if 'veo' in m.name:
                # Sprawdzamy, czy ten model na pewno obsługuje metodę, której chcemy użyć
                if 'generateContent' in m.supported_generation_methods:
                    veo_model_object = m
                    break

        if not veo_model_object:
            print("  -> ❌ KRYTYCZNY BŁĄD: Znaleziono model Veo, ale Twoje konto nie ma uprawnień do używania go z metodą 'generateContent'.")
            print("  -> Upewnij się, że jesteś na liście dopuszczonych testerów (allowlist) dla Veo API.")
            return None

        print(f"    -> Znaleziono model i potwierdzono uprawnienia dla: {veo_model_object.name}")

        # 2. Użyj nazwy modelu, aby stworzyć działający obiekt
        veo_runnable_model = genai.GenerativeModel(veo_model_object.name)

        # 3. Wczytaj dane obrazu
        print("    -> Przygotowuję obraz do wysłania...")
        img = Image.open(image_path)

        # 4. Wywołaj funkcję 'generate_content'
        print("    -> Wysyłam zlecenie do API i czekam na wygenerowanie wideo...")
        response = veo_runnable_model.generate_content(
            [scenario, img],
            request_options={'timeout': 1200}
        )

        video_data = response.parts[0].blob.data

        final_video_path = os.path.join(save_path, f"film_kota_{video_number}.mp4")
        print(f"    -> Zapisuję plik wideo w: {final_video_path}")
        with open(final_video_path, 'wb') as f:
            f.write(video_data)

        print(f"  -> ✅ Wideo zostało pomyślnie wygenerowane i zapisane.")
        return final_video_path

    except Exception as e:
        print(f"  -> ❌ KRYTYCZNY BŁĄD podczas procesu generowania wideo: {e}")
        return None

print("✅ Wszystkie funkcje fabryki (WERSJA OSTATECZNA i ODPORNA) zdefiniowane.")

 Krok 4: Definiowanie funkcji produkcyjnych (WERSJA OSTATECZNA i ODPORNA)...
✅ Wszystkie funkcje fabryki (WERSJA OSTATECZNA i ODPORNA) zdefiniowane.


In [None]:
# @title Komórka 5: Główna Pętla Produkcyjna (Wersja z Analizą)
import time

print(" Krok 5: Uruchamianie Głównej Pętli Produkcyjnej...")
print("Naciśnij przycisk 'Stop' w Colab, aby bezpiecznie zakończyć działanie.")

video_counter = 0
try:
    if not image_paths:
        print("\n❌ Brak wczytanych obrazów. Zatrzymaj i uruchom ponownie komórki 2 i 3.")
    else:
        while True:
            video_counter += 1
            print(f"\n{'='*25} Rozpoczynam cykl produkcyjny #{video_counter} {'='*25}")

            # 1. Wybierz losowego kota
            print("1. Losowanie kota...")
            kot_path = get_random_image_path(image_paths)

            # 2. Wygeneruj dla niego scenariusz (NOWA FUNKCJA)
            print("2. Generowanie scenariusza w dwóch krokach...")
            scenariusz = generate_scenario_in_two_steps(kot_path) # ZMIANA
            if not scenariusz:
                print("Nie udało się wygenerować scenariusza. Przechodzę do następnej iteracji za 15 sekund.")
                time.sleep(15)
                continue

            # 3. Wygeneruj wideo
            print("3. Generowanie wideo z Veo...")
            sciezka_filmu = generate_video_with_veo(kot_path, scenariusz, VIDEO_SAVE_PATH, video_counter)

            print(f"\n✅ Zakończono cykl #{video_counter}. Film (symulacja) dostępny w {VIDEO_SAVE_PATH}")

            # 4. Chwila przerwy
            pauza = random.randint(45, 90)
            print(f"Następny cykl za {pauza} sekund...")
            time.sleep(pauza)

except KeyboardInterrupt:
    print("\n\n Pętla zatrzymana przez użytkownika. Dobra robota!")

 Krok 5: Uruchamianie Głównej Pętli Produkcyjnej...
Naciśnij przycisk 'Stop' w Colab, aby bezpiecznie zakończyć działanie.

1. Losowanie kota...
2. Generowanie scenariusza w dwóch krokach...
  -> Rozpoczynam dwuetapowe generowanie dla: cat (180).jpg
    -> Etap 1: Analiza obrazu...
    -> Wynik analizy:
* Kot jest sfotografowany z bliska, w zbliżeniu, co sprawia, że jego twarz wypełnia prawie całe zdjęcie. Jego pozycja sugeruje bezpośredni kontakt wzrokowy z obserwatorem.
* Kot wydaje się być czujny i nieco podejrzliwy, a może nawet lekko zirytowany, sugerując to jego wyraz twarzy.
* Na zdjęciu widoczne są elementy typowego salonu: drewniana podłoga, meble, telewizor i fragmenty tekstyliów.
* W tle znajduje się również telewizor z włączonym ekranem, co sugeruje, że kot może być obserwował obraz z ekranu.
* Kot jest bez sierści, co jest typowe dla rasy Sphynx.
    -> Etap 2: Tworzenie scenariusza na podstawie analizy...
  -> Otrzymano finalny scenariusz: 'Tekst na ekranie: "Kot obserwuj