# DATOS

In [2]:
import os
import cv2
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.ensemble import RandomForestClassifier
from sklearn.svm import SVC
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# Ruta a la carpeta de entrenamiento que contiene subcarpetas con imágenes de frutas
data_dir = r"C:\Users\PC\OneDrive\Documentos\UNIVERSIDAD\CONCURSO DE MODELIZACIÓN EN EMPRESAS\GMV\datos\train\train"

# Lista de clases (nombres de las subcarpetas)
classes = os.listdir(data_dir)

# Listas para almacenar las imágenes y las etiquetas
images = []
labels = []

# Leer las imágenes y etiquetas desde las subcarpetas
for class_name in classes:
    class_dir = os.path.join(data_dir, class_name)
    for img_file in os.listdir(class_dir):
        img_path = os.path.join(class_dir, img_file)
        img = cv2.imread(img_path)
        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)  # Convertir a formato RGB si es necesario
        images.append(img)
        labels.append(class_name)

# Codificar las etiquetas en valores numéricos
label_encoder = LabelEncoder()
labels = label_encoder.fit_transform(labels)

# Dividir el conjunto de datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(images, labels, test_size=0.2, random_state=42)

# Aplanar y redimensionar las imágenes (ajusta el tamaño según tus necesidades)
X_train = [img.flatten() for img in X_train]
X_test = [img.flatten() for img in X_test]

# Definir una lista de modelos a evaluar
models = {
    'Random Forest': RandomForestClassifier(),
    'SVM': SVC(),
    'K-Nearest Neighbors': KNeighborsClassifier()
}

# Realizar la clasificación de imágenes y encontrar el mejor modelo
best_model = None
best_accuracy = 0.0

for model_name, model in models.items():
    model.fit(X_train, y_train)
    y_pred = model.predict(X_test)
    accuracy = accuracy_score(y_test, y_pred)
    print(f'{model_name} - Accuracy: {accuracy}')

    if accuracy > best_accuracy:
        best_accuracy = accuracy
        best_model = model

print(f'Mejor modelo: {best_model}')


ModuleNotFoundError: No module named 'sklearn'

In [None]:
import os
import cv2
import numpy as np
from sklearn.preprocessing import LabelEncoder

# Ruta a la carpeta de pruebas que contiene imágenes sin clasificar
test_dir = 'ruta/a/tu/carpeta/de/pruebas'

# Listas para almacenar las imágenes y las rutas de archivo
test_images = []
file_paths = []

# Leer las imágenes desde la carpeta de pruebas y mantener un registro de las rutas de archivo
for img_file in os.listdir(test_dir):
    img_path = os.path.join(test_dir, img_file)
    img = cv2.imread(img_path)
    img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)  # Convertir a formato RGB si es necesario
    test_images.append(img)
    file_paths.append(img_path)

# Aplanar y redimensionar las imágenes (ajusta el tamaño según tus necesidades)
test_images = [img.flatten() for img in test_images]

# Cargar el modelo previamente entrenado (asegúrate de que el modelo está disponible)
# Reemplaza 'nombre_del_modelo_entrenado.pkl' con el nombre de tu modelo entrenado
from sklearn.externals import joblib
loaded_model = joblib.load('nombre_del_modelo_entrenado.pkl')

# Realizar predicciones en las imágenes de prueba
predicted_labels = loaded_model.predict(test_images)

# Decodificar las etiquetas numéricas en nombres de clases
decoded_labels = label_encoder.inverse_transform(predicted_labels)

# Imprimir resultados
for i in range(len(test_images)):
    print(f'Archivo: {file_paths[i]} - Clase predicha: {decoded_labels[i]}')
