In [5]:
import pandas as pd
from pathlib import Path

def create_parquet_from_png_and_txt(image_dir, output_path="dataset.parquet"):
    image_dir = Path(image_dir)
    data = []
    
    # Assumindo que cada imagem tem um txt com o mesmo nome (ex: img1.png, img1.txt)
    for img_path in sorted(image_dir.glob("*.jpg")):
        txt_path = img_path.with_suffix('.txt')
        if txt_path.exists():
            with open(txt_path, "r", encoding="utf-8") as f:
                label = f.read().strip()
        else:
            label = ""
        
        data.append({
            "image_path": str(img_path.resolve()),
            "label": label
        })
    
    df = pd.DataFrame(data)
    df.to_parquet(output_path)
    print(f"✅ Parquet criado: {output_path}")
    print(df.head())

# Exemplo de uso:
# create_parquet_from_png_and_txt("data/van_gogh", "van_gogh_png_labels.parquet")

In [10]:
create_parquet_from_png_and_txt("rembrandt/barroco/", "rembrandt_barroco.parquet")

✅ Parquet criado: rembrandt_barroco.parquet
                                          image_path  \
0  /home/jmvjr/Documentos/unicamp/MC949/Generativ...   
1  /home/jmvjr/Documentos/unicamp/MC949/Generativ...   
2  /home/jmvjr/Documentos/unicamp/MC949/Generativ...   
3  /home/jmvjr/Documentos/unicamp/MC949/Generativ...   
4  /home/jmvjr/Documentos/unicamp/MC949/Generativ...   

                                               label  
0  Grupo de homens em cena caótica. Figura centra...  
1  Cena histórica complexa. Rei em estrado com ce...  
2  Ancião de barba branca repousa a cabeça na mão...  
3  Homem em trajes orientais bate em um burro caí...  
4  No templo, ancião segura bebê iluminado. Mulhe...  


In [9]:
create_parquet_from_png_and_txt("rembrandt/portrait/", "rembrandt_portrait.parquet")

✅ Parquet criado: rembrandt_portrait.parquet
                                          image_path  \
0  /home/jmvjr/Documentos/unicamp/MC949/Generativ...   
1  /home/jmvjr/Documentos/unicamp/MC949/Generativ...   
2  /home/jmvjr/Documentos/unicamp/MC949/Generativ...   
3  /home/jmvjr/Documentos/unicamp/MC949/Generativ...   
4  /home/jmvjr/Documentos/unicamp/MC949/Generativ...   

                                               label  
0  Um erudito com um grande colarinho de rufo bra...  
1  Homem idoso com armadura de metal (gorjal), bo...  
2  Busto de um homem idoso com barba, boina escur...  
3  Mulher rica com colarinho de renda branca, joi...  
4  Homem com bigode e cabelo escuro, usando gorja...  
