# rename

In [None]:
# Сначала прочитаем содержимое загруженного CSV файла, чтобы понять его структуру
import pandas as pd

# Загрузка данных из CSV файла
file_path = 'data/bob_ross_paintings.csv'
data = pd.read_csv(file_path)

# Выведем первые несколько строк, чтобы понять структуру данных
data.head()
# Создадим словарь для сопоставления имен файлов и названий картин
rename_dict = {}

for index, row in data.iterrows():
    # Извлекаем имя файла из URL
    original_name = row['img_src'].split('/')[-1].replace('.png', '')
    # Название картины для нового имени файла
    new_name = row['painting_title']
    # Добавляем в словарь
    rename_dict[original_name] = new_name

# Выведем первые несколько элементов словаря, чтобы убедиться, что он создан корректно
list(rename_dict.items())[:5]
import os

# Путь к папке с изображениями
directory = 'data/train'

# Перебираем файлы в папке
for filename in os.listdir(directory):
    # Удаляем расширение файла для сопоставления с ключом в словаре
    file_base_name = filename.replace('.png', '')
    
    # Проверяем, есть ли файл в словаре для переименования
    if file_base_name in rename_dict:
        # Создаем новое имя файла, добавляя расширение .png
        new_filename = rename_dict[file_base_name] + '.png'
        
        # Полные пути к исходному и новому файлу
        original_file_path = os.path.join(directory, filename)
        new_file_path = os.path.join(directory, new_filename)
        
        # Переименовываем файл
        os.rename(original_file_path, new_file_path)
        print(f"Файл {filename} переименован в {new_filename}")
    else:
        print(f"Файл {filename} не найден в словаре и не был переименован.")

print("Переименование файлов завершено.")


# split dataset

In [1]:
import os
import shutil
from random import sample

# Путь к директории с исходными картинами
train_dir = 'data/train'
# Путь к директории для валидации
validate_dir = 'data/validate'

# Создаем директорию для валидации, если она не существует
if not os.path.exists(validate_dir):
    os.makedirs(validate_dir)

# Получаем список всех файлов png в директории train
train_images = [img for img in os.listdir(train_dir) if img.endswith('.png')]

# Выбираем случайно ~10% изображений для перемещения
num_to_move = max(1, len(train_images) // 10)  # Убедимся, что по крайней мере один файл будет выбран
images_to_move = sample(train_images, num_to_move)

# Перемещаем выбранные изображения в директорию validate
for img in images_to_move:
    shutil.move(os.path.join(train_dir, img), os.path.join(validate_dir, img))

# Возвращаем количество перемещенных изображений и их имена для подтверждения
num_moved_images = len(images_to_move)
moved_images = images_to_move

num_moved_images, moved_images


(40,
 ['Secluded Mountain.png',
  'Half-Oval Vignette.png',
  "Woodman's Retreat.png",
  'Mountain Oval.png',
  'Meadow Stream.png',
  'Golden Mist Oval.png',
  'Christmas Eve Snow.png',
  "Nature's Splendor.png",
  'Mountains of Grace.png',
  'Splendor of Winter.png',
  'Ebony Sunset.png',
  'Babbling Brook.png',
  'Winter Hideaway.png',
  'Black Waterfall.png',
  'Countryside Oval.png',
  'Surprising Falls.png',
  'Ebony Sea.png',
  'Majestic Peaks.png',
  'Glacier Lake.png',
  'Forest Edge.png',
  'Mt. McKinley.png',
  'Ebb Tide.png',
  "A Mild Winter's Day.png",
  'Tranquil Valley.png',
  'The Windmill.png',
  'Purple Haze.png',
  'Bubbling Stream.png',
  'Tropical Seascape.png',
  'Wooded Stream Oval.png',
  'Cabin in the Hollow.png',
  'Winter Cabin.png',
  'Waves of Wonder.png',
  "Florida's Glory.png",
  'Horizons West.png',
  'Storm on the Horizon.png',
  'Meadow Road.png',
  'Peaceful Valley.png',
  'Daybreak.png',
  'The Old Oak Tree.png',
  'Silent Forest.png'])

# file classification

In [4]:
import os
import shutil

# Ключевое слово для поиска
keyword = 'mounty'

# Путь к исходной папке с изображениями
source_folder = 'data/train/'

# Путь к целевой папке, куда будут перемещены изображения
target_folder = os.path.join(source_folder, keyword)

# Создаем целевую папку, если она еще не существует
if not os.path.exists(target_folder):
    os.makedirs(target_folder)

# Перебираем файлы в исходной папке
for filename in os.listdir(source_folder):
    # Проверяем, содержит ли название файла ключевое слово
    if keyword in filename.lower() and filename.endswith('.png'):
        # Полный путь к файлу
        source_path = os.path.join(source_folder, filename)
        
        # Полный путь к целевому местоположению файла
        target_path = os.path.join(target_folder, filename)
        
        # Перемещаем файл
        shutil.move(source_path, target_path)
        print(f"Файл {filename} перемещен в {target_folder}")
