# Решить задачу с определением породы кошки. Британская это порода или нет.

Для решения используем провайдеры LLM на Hugging face

Сравниваем метрики двух выбранных LLM

Выборка:
- Британские кошки
- Фотографии обычных кошек
- Шотландские вислоухие
- Русская голубая

brit1-10. Фотографии 100% британских кошек голубого окраса.
brithard. Кошки другого окраса, либо с отсутствием каких-либо признаков (закрытые глаза).
random. Обычные кошки.
rus. Русская голубая
scot. Шотландая вислоухая.

Основные признаки:
- Британская. Большие, упитанные. Серая шертсть, оранжевые (миндальные) глаза.
- Шотлансдая. Серая шерсть. Из отличий - вислоухость, меньше британской.
- Русская. Такая же серая кошка. Отличия - меньше и глаза голубые, а не оранжевые.

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
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

Устанавливаем все необходимые библиотеки. 

Эту ячейку достаточно запустить один раз.

pip install --upgrade requests Pillow pandas tqdm python-dotenv huggingface_hub ipywidgets

In [None]:
import os
import pandas as pd
from tqdm import tqdm
from dotenv import load_dotenv
from IPython.display import display
from huggingface_hub import InferenceClient
from PIL import Image
import base64
import io

# --- 1. Загрузка и верификация токена ---

HF_TOKEN = os.getenv("HUGGINGFACEHUB_API_TOKEN")

token_looks_valid = False
if HF_TOKEN:
    print("✅ Токен найден. Инициализируем InferenceClient.")
    try:
        client = InferenceClient(token=HF_TOKEN)
        token_looks_valid = True
    except Exception as e:
        print(f"❌ Не удалось инициализировать клиент: {e}")
else:
    print("❌ Токен не найден или не изменен. Проверьте ваш .env файл.")

# --- 2. Основной цикл (запускается, если клиент создан) ---
if token_looks_valid:
    # --- Конфигурация с НОВЫМИ моделями ---
    MODEL_1_ID = "lmms-lab/LLaVA-OneVision-1.5-8B-Instruct"
    MODEL_2_ID = "PsiPi/NousResearch_Nous-Hermes-2-Vision-GGUF"
    
    IMG_DIR = "img"
    PROMPT = "Скажи, изображена ли на данном фото кошка породы \"Британская короткошерстная\", дай коротки ответ \"да\" или \"нет\". Опиши одним словом каждый признак, который убедил тебя в правильности или неправильности ответа. Если это не британская короткошерстная кошка, скажи какая это порода."

    # --- НОВАЯ ФУНКЦИЯ: Изменение размера изображения ---
    def resize_image(image_path, max_size=(1024, 1024)):
        """Открывает изображение, изменяет его размер и возвращает в виде байтов."""
        with Image.open(image_path) as img:
            img.thumbnail(max_size)
            # Сохраняем измененное изображение в байтовый поток в памяти
            byte_arr = io.BytesIO()
            # Убедимся, что сохраняем в формате, который не поддерживает прозрачность (если исходник был PNG)
            if img.mode in ("RGBA", "P"):
                img = img.convert("RGB")
            img.save(byte_arr, format='JPEG')
            return byte_arr.getvalue()

    # --- Обновленная функция для запроса ---
    def query_chat_model(image_path, model_id, prompt):
        try:
            # <-- НОВЫЙ ШАГ: Изменение размера изображения перед кодированием
            resized_image_bytes = resize_image(image_path)
            
            # Кодируем в base64 уже измененное, маленькое изображение
            img_base64 = base64.b64encode(resized_image_bytes).decode('utf-8')
            
            messages = [
                {
                    "role": "user",
                    "content": [
                        {"type": "image_url", "image_url": {"url": f"data:image/jpeg;base64,{img_base64}"}},
                        {"type": "text", "text": prompt}
                    ]
                }
            ]

            response = client.chat_completion(
                messages=messages,
                model=model_id,
                max_tokens=100
            )
            return response.choices[0].message.content

        except Exception as e:
            return f"Error: {type(e).__name__}, {e}"

    # --- Цикл обработки ---
    try:
        image_files = [f for f in os.listdir(IMG_DIR) if f.endswith(('.jpg', '.jpeg', '.png'))]
        print(f"\nНайдено {len(image_files)} изображений для обработки.")
    except FileNotFoundError:
        print(f"Ошибка: Директория '{IMG_DIR}' не найдена.")
        image_files = []

    results_data = []
    if image_files:
        for filename in tqdm(image_files, desc="Обработка изображений"):
            image_path = os.path.join(IMG_DIR, filename)
            response_1 = query_chat_model(image_path, MODEL_1_ID, PROMPT)
            response_2 = query_chat_model(image_path, MODEL_2_ID, PROMPT)
            results_data.append({
                "filename": filename,
                "model_1_response": response_1,
                "model_2_response": response_2
            })
        
        df_results = pd.DataFrame(results_data)
        
        print("\nСбор данных завершен. Вот первые 5 результатов:")
        display(df_results.head())
        
        output_csv_path = "llm_comparison_results.csv"
        df_results.to_csv(output_csv_path, index=False, encoding='utf-8')
        print(f"✅ Результаты сохранены в файл: {output_csv_path}")
        
    else:
        print("Нет файлов для обработки.")
else:
    print("\nОсновной процесс не был запущен.")

✅ Токен найден. Инициализируем InferenceClient.

Найдено 30 изображений для обработки.


Обработка изображений: 100%|██████████| 30/30 [00:16<00:00,  1.79it/s]


Сбор данных завершен. Вот первые 5 результатов:





Unnamed: 0,filename,model_1_response,model_2_response
0,brit1.jpg,"Error: BadRequestError, (Request ID: Root=1-69...","Error: BadRequestError, (Request ID: Root=1-69..."
1,brit10.jpg,"Error: BadRequestError, (Request ID: Root=1-69...","Error: BadRequestError, (Request ID: Root=1-69..."
2,brit2.jpg,"Error: BadRequestError, (Request ID: Root=1-69...","Error: BadRequestError, (Request ID: Root=1-69..."
3,brit3.jpg,"Error: BadRequestError, (Request ID: Root=1-69...","Error: BadRequestError, (Request ID: Root=1-69..."
4,brit4.jpg,"Error: BadRequestError, (Request ID: Root=1-69...","Error: BadRequestError, (Request ID: Root=1-69..."


✅ Результаты сохранены в файл: llm_comparison_results.csv


In [43]:
# Проверяем, существует ли переменная df_results, прежде чем сохранять
if 'df_results' in locals() and not df_results.empty:
    output_csv_path = "llm_comparison_results.csv"
    df_results.to_csv(output_csv_path, index=False, encoding='utf-8')
    print(f"✅ Результаты успешно сохранены в файл: {output_csv_path}")
else:
    print("❌ Таблица с результатами пуста или не существует. Сохранение не выполнено.")

✅ Результаты успешно сохранены в файл: llm_comparison_results.csv
