<a href="https://colab.research.google.com/github/lrcherubini/photoIndexer/blob/main/PhotoIndexer.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# √Årea Compartilhada

Bloco 1: Instala√ß√£o e Imports
Esta √© a primeira c√©lula do seu notebook.

In [None]:
# C√©lula 1: Instala√ß√µes e Imports
!pip install -q google-generativeai pandas

import google.generativeai as genai
import pandas as pd
import pathlib
import json
import numpy as np
import time
from google.colab import drive # Importa a biblioteca para o Google Drive

Exception ignored in: <function MediaFileUpload.__del__ at 0x7a38e86e9e40>
Traceback (most recent call last):
  File "/usr/local/lib/python3.12/dist-packages/googleapiclient/http.py", line 607, in __del__
    self._fd.close()
OSError: [Errno 107] Transport endpoint is not connected


Bloco 2: Conex√£o e API Key
Rode esta c√©lula. Ela vai pedir permiss√£o para acessar seu Google Drive e solicitar sua API Key do Gemini.

In [None]:
# C√©lula 2: Conex√£o com Google Drive e API
from google.colab import userdata

# 1. Montar o Google Drive
#    (Vai abrir uma janela pop-up para voc√™ dar permiss√£o)
drive.mount('/content/drive', force_remount=True)

# 2. Configurar a API Key do Gemini
#    (Recomendado: Salve sua key como um "Secret" no Colab com o nome 'PhotoIndexer')
try:
    api_key = userdata.get('PhotoIndexer')
    genai.configure(api_key=api_key)
    print("Google Drive e API Key configurados com sucesso!")
except Exception as e:
    print(f"Erro ao configurar a API Key. Verifique se voc√™ criou o Secret 'PhotoIndexer'.\n{e}")

Mounted at /content/drive
Google Drive e API Key configurados com sucesso!


# INDEXA√á√ÉO (Gerar Legendas e Embeddings)

Objetivo: Rodar uma √∫nica vez sobre sua pasta de fotos. Ele vai:

Ler todas as fotos do seu Google Drive.

Para cada foto, gerar a legenda (alt-text).

Para cada foto, gerar o embedding (vetor de busca).

Salvar tudo em um √∫nico arquivo indice_fotos.csv no seu Drive.

Bloco 3: Painel de Controle (Seus Par√¢metros)
Aqui voc√™ define suas pastas e modelos. Edite as vari√°veis aqui para que correspondam √† sua organiza√ß√£o no Google Drive.

In [None]:
# C√©lula 3: Painel de Controle (EDITE AQUI)

# 1. Onde est√£o suas fotos no Google Drive?
PASTA_DAS_FOTOS = "/content/drive/MyDrive/F√©rias 2016/Rafting" # <- MUDE AQUI

# 2. Onde voc√™ quer salvar o arquivo de √≠ndice?
ARQUIVO_DE_SAIDA = "/content/drive/MyDrive/F√©rias 2016/Rafting/indice_fotos.csv" # <- MUDE AQUI

# 3. Modelos de IA
MODELO_VISAO = 'models/gemini-2.0-flash'      # Para gerar legendas
MODELO_EMBEDDING = 'models/embedding-001'     # Para gerar vetores de busca (DE TEXTO)

# 4. Prompt para a legenda (COM CHAVES "ESCAPADAS" {{ }})
PROMPT_LEGENDA = """
Sua √∫nica tarefa √© analisar a imagem e retornar um objeto JSON.

VOC√ä √â UM FOT√ìGRAFO PROFISSIONAL E ESPECIALISTA EM ACESSIBILIDADE.
Seu objetivo √© catalogar esta imagem para um portf√≥lio de fotografia, considerando tamb√©m a futura busca baseada em texto descritivo.

---
INFORMA√á√ïES DE CONTEXTO DA SESS√ÉO (Use isso para guiar sua an√°lise):
{session_context}
---

O JSON deve ter a seguinte estrutura:
{{
  "caption": "Uma legenda descritiva e literal para fins de acessibilidade (alt-text). Foque no sujeito principal, a√ß√£o e cen√°rio.",
  "keywords": {{
    "subjects": ["palavra1", "palavra2", "palavra3"],
    "techniques": ["palavra4", "palavra5", "palavra6"],
    "mood": ["palavra7"]
  }},
  "category": "categoria_da_imagem",
  "context": "Breve descri√ß√£o do que est√° acontecendo na imagem e o que ela transmite. Foque no contexto da cena e nas emo√ß√µes ou a√ß√µes. USE AS INFORMA√á√ïES DE CONTEXTO DA SESS√ÉO."
}}

Responda apenas com o JSON, sem adicionar texto adicional. Sempre responda em portugu√™s BR.
"""

print(f"Arquivos de fotos ser√£o lidos de: {PASTA_DAS_FOTOS}")
print(f"O √≠ndice ser√° salvo em: {ARQUIVO_DE_SAIDA}")

Arquivos de fotos ser√£o lidos de: /content/drive/MyDrive/F√©rias 2016/Rafting
O √≠ndice ser√° salvo em: /content/drive/MyDrive/F√©rias 2016/Rafting/indice_fotos.csv


Bloco 4: O Script Principal (Indexador)
Este √© o bloco mais importante. Ele vai demorar para rodar se voc√™ tiver muitas fotos (pois faz 2 chamadas de API por foto e espera 1 segundo).

In [None]:
# C√©lula 4: Script de Indexa√ß√£o (Vers√£o 7.0 - Otimizada)

import json # Certifique-se de que o json est√° importado
import os # Importar os para verifica√ß√£o de arquivo

# 1. Carregar os modelos
model_visao = genai.GenerativeModel(MODELO_VISAO)
model_embedding = genai.GenerativeModel(MODELO_EMBEDDING)

# 2. Encontrar as fotos
pasta = pathlib.Path(PASTA_DAS_FOTOS)
arquivos_fotos = list(pasta.glob('*.jpg')) + list(pasta.glob('*.png')) + list(pasta.glob('*.jpeg')) + list(pasta.glob('*.JPG')) + list(pasta.glob('*.PNG')) + list(pasta.glob('*.JPEG'))

print(f"Encontradas {len(arquivos_fotos)} fotos. Iniciando indexa√ß√£o...")

# --- OTIMIZA√á√ÉO: Ler o session.json UMA VEZ, fora do loop ---
session_json_content = "Nenhum contexto de sess√£o fornecido." # Padr√£o
caminho_sessao = pasta / "session.json" # Procura o JSON na pasta principal

if caminho_sessao.exists():
    try:
        with open(caminho_sessao, 'r', encoding='utf-8') as f:
            session_json_content = f.read()
        print(f"Contexto 'session.json' carregado com sucesso.")
    except Exception as e:
        print(f"--- Aviso: Falha ao ler o session.json. Erro: {e}")
else:
    print("--- Aviso: 'session.json' n√£o encontrado na pasta. Usando prompt padr√£o.")

# Formatar o prompt final UMA VEZ, com o contexto da sess√£o
final_prompt = PROMPT_LEGENDA.format(session_context=session_json_content)
# --- FIM DA OTIMIZA√á√ÉO ---


# 3. Loop de processamento (Agora muito mais limpo)
resultados_finais = []
for caminho_foto in arquivos_fotos:
    arquivo_upload = None  # Inicia a vari√°vel como nula
    try:
        print(f"Processando: {caminho_foto.name}...")

        # Faz o upload da imagem para a API
        arquivo_upload = genai.upload_file(path=caminho_foto)
        print(f"{caminho_foto.name} uploaded.")

        # --- OBJETIVO 1: Gerar JSON Estruturado (Usando o prompt pr√©-formatado) ---
        response_legenda_json = model_visao.generate_content([final_prompt, arquivo_upload])

        # Vari√°veis padr√£o em caso de falha no parse
        caption = "ERRO: Falha no parse"
        keywords_subjects = ""
        keywords_techniques = ""
        keywords_mood = ""
        category = ""
        context = ""

        try:
            # Limpar a resposta do modelo (√†s vezes vem com ```json ... ```)
            texto_limpo = response_legenda_json.text.strip().replace("```json", "").replace("```", "")
            dados_json = json.loads(texto_limpo)

            caption = dados_json.get('caption', 'ERRO: Missing caption')
            category = dados_json.get('category', '')
            context = dados_json.get('context', '')

            # Parsear o dicion√°rio aninhado de keywords
            keywords_dict = dados_json.get('keywords', {})
            keywords_subjects = ", ".join(keywords_dict.get('subjects', []))
            keywords_techniques = ", ".join(keywords_dict.get('techniques', []))
            keywords_mood = ", ".join(keywords_dict.get('mood', []))

        except Exception as e:
            print(f"--- Aviso: Falha ao parsear JSON da legenda. Erro: {e}")
            print(f"--- Resposta Bruta: {response_legenda_json.text}")
            caption = response_legenda_json.text.strip() # Salva o texto bruto em caso de falha

        print(f"  Legenda: {caption}")
        print(f"  Categoria: {category}")
        print(f"  Contexto: {context}")
        print(f"  Keywords (Assuntos): {keywords_subjects}")
        print(f"  Keywords (T√©cnica): {keywords_techniques}")
        print(f"  Keywords (Sentimento): {keywords_mood}")

        # --- OBJETIVO 2 (Parte A): Gerar Embedding (DO TEXTO) ---

        # Criar um "super-texto" combinando todos os campos para um embedding rico
        texto_para_embedding = f"""
        Legenda: {caption}
        Categoria: {category}
        Contexto: {context}
        Assuntos: {keywords_subjects}
        T√©cnicas: {keywords_techniques}
        Sentimento: {keywords_mood}
        """

        response_embedding = genai.embed_content(
            model=MODELO_EMBEDDING,
            content=texto_para_embedding, # Usando o novo "super-texto"
            task_type="RETRIEVAL_DOCUMENT"
        )
        embedding = response_embedding['embedding']

        # Converter a lista de embedding em um texto JSON para salvar no CSV
        embedding_json = json.dumps(embedding)
        print(f"  Embedding do texto gerado.")


        # Guardar resultados
        resultados_finais.append({
            "arquivo": caminho_foto.name,
            "legenda": caption,
            "categoria": category,
            "contexto": context,
            "keywords_assuntos": keywords_subjects,
            "keywords_tecnica": keywords_techniques,
            "keywords_sentimento": keywords_mood,
            "embedding_json": embedding_json
        })

        # Pausa para evitar limite da API
        time.sleep(1)

    except Exception as e:
        print(f"!!! Erro ao processar {caminho_foto.name}: {e}")

    finally:
        # Bloco de limpeza
        if arquivo_upload:
            try:
                genai.delete_file(arquivo_upload.name)
            except Exception as e:
                print(f"--- Aviso: Falha ao limpar o arquivo {arquivo_upload.name}. {e}")

# 4. Salvar tudo em um arquivo CSV
df = pd.DataFrame(resultados_finais)
df.to_csv(ARQUIVO_DE_SAIDA, index=False)

print("\n--- SUCESSO! ---")
print(f"Processamento conclu√≠do. {len(df)} fotos foram indexadas.")
print(f"Resultados salvos em: {ARQUIVO_DE_SAIDA}")
print(f"\nSeu CSV agora cont√©m as colunas: {df.columns.to_list()}")

Encontradas 72 fotos. Iniciando indexa√ß√£o...
Contexto 'session.json' carregado com sucesso.
Processando: 21-11-16  13 h 001.JPG...
21-11-16  13 h 001.JPG uploaded.
  Legenda: Um jovem sorrindo dentro de um caiaque azul e preto em um rio, usando capacete azul e colete salva-vidas, com um remo amarelo √† sua frente e dando um sinal de positivo com as duas m√£os.
  Categoria: Esportes Aqu√°ticos
  Contexto: A imagem captura um momento de pura alegria durante uma aventura de rafting em Santo Amaro da Imperatriz, SC, em 2016. O jovem, membro da Fam√≠lia Cherubini e amigos, demonstra entusiasmo e confian√ßa enquanto navega pelo rio em seu caiaque, parte de um dia de f√©rias de ver√£o cheio de emo√ß√£o e companheirismo.
  Keywords (Assuntos): caiaque, rio, crian√ßa, rafting, remo, √°gua, esporte, aventura
  Keywords (T√©cnica): fotografia de aventura, luz natural, composi√ß√£o centralizada
  Keywords (Sentimento): alegria, divers√£o, a√ß√£o
  Embedding do texto gerado.
Processando: 21-11-16

# BUSCA (Encontrar Fotos por Depoimento)

Bloco 3: carrega seu √≠ndice na mem√≥ria e prepara o modelo de IA. Voc√™ s√≥ precisa rodar uma vez por sess√£o

In [None]:
# C√©lula 3: Carregar o √çndice de Fotos e o Modelo

# --- EDITE AQUI ---
# 1. Onde est√° seu arquivo de √≠ndice? (O mesmo que o Notebook 1 criou)
ARQUIVO_DE_INDICE = "/content/drive/MyDrive/F√©rias 2016/Rafting/indice_fotos.csv" # <- MUDE AQUI
# --- FIM DA EDI√á√ÉO ---

# 2. Carregar o modelo de embedding (para texto)
model_embedding = genai.GenerativeModel('models/embedding-001')

# 3. Carregar o √≠ndice de fotos do CSV
try:
    df_fotos = pd.read_csv(ARQUIVO_DE_INDICE)
    if df_fotos.empty:
        print(f"Erro: O arquivo de √≠ndice '{ARQUIVO_DE_INDICE}' est√° vazio.")
    else:
        # Pr√©-processar os embeddings (converter JSON de volta para vetor)
        # Fazemos isso uma vez na carga para ser r√°pido
        df_fotos['embedding'] = df_fotos['embedding_json'].apply(lambda x: np.array(json.loads(x)))
        print(f"√çndice de {len(df_fotos)} fotos carregado e processado com sucesso.")

except FileNotFoundError:
    print(f"Erro: Arquivo de √≠ndice '{ARQUIVO_DE_INDICE}' n√£o encontrado.")
except Exception as e:
    print(f"Erro ao ler o arquivo de √≠ndice: {e}")

O Script de Busca (Seu Painel Principal). Alterar o MEU_DEPOIMENTO e rodar a c√©lula para ter seus resultados.

In [None]:
# C√©lula 4: Script de Busca Sem√¢ntica (Objetivo 2 - Parte B)

# --- EDITE AQUI ---
# 1. Qual texto voc√™ quer usar para buscar?
MEU_DEPOIMENTO = "Adorei o atendimento, me senti muito acolhido e feliz com o resultado."
# --- FIM DA EDI√á√ÉO ---


if 'df_fotos' not in locals() or df_fotos.empty:
    print("Erro: O √≠ndice de fotos n√£o foi carregado. Rode a C√©lula 3 primeiro.")
else:
    print(f"Gerando embedding para o depoimento: '{MEU_DEPOIMENTO}'")

    # 2. Gerar o embedding para o depoimento (a "query")
    response_query = genai.embed_content(
        model=MODELO_EMBEDDING,
        content=MEU_DEPOIMENTO,
        task_type="RETRIEVAL_QUERY" # Importante: "RETRIEVAL_QUERY" para busca
    )
    query_embedding = np.array(response_query['embedding'])

    # 3. Calcular a similaridade (Produto Escalar)
    #    (Compara o vetor do depoimento com CADA vetor de texto da foto)
    df_fotos['similaridade'] = df_fotos['embedding'].apply(
        lambda texto_emb: np.dot(query_embedding, texto_emb)
    )

    # 4. Ordenar e mostrar os melhores resultados
    df_resultados = df_fotos.sort_values(by='similaridade', ascending=False)

    print("\n--- üèÜ MELHORES FOTOS ENCONTRADAS üèÜ ---")
    print(f"Para o depoimento: '{MEU_DEPOIMENTO}'\n")

    # 5. Mostrar as 5 fotos mais relevantes de forma leg√≠vel
    for index, row in df_resultados.head(5).iterrows():
        print(f"--- Posi√ß√£o #{index+1} (Similaridade: {row['similaridade']:.4f}) ---")
        print(f"Arquivo: {row['arquivo']}")
        print(f"Legenda: {row['legenda']}")
        print(f"Contexto: {row['contexto']}")
        print(f"Keywords (Assuntos): {row['keywords_assuntos']}")
        print("\n")