# Курсовая работа по дисциплине ФКИИ.

# Исследование датасета "CIFAR-10"


## Описание датасета: ##

Датасет CIFAR-10 состоит из 60 000 цветных изображений размером 32x32 пикселя, разделённых на 10 классов, по 6000 изображений в каждом классе. Из них 50 000 изображений предназначены для обучения, а 10 000 — для тестирования.

Датасет разделён на пять обучающих партий и одну тестовую партию, каждая из которых содержит 10 000 изображений. Тестовая партия содержит ровно 1000 случайным образом выбранных изображений из каждого класса. Обучающие партии содержат оставшиеся изображения в случайном порядке, но некоторые обучающие партии могут содержать больше изображений одного класса, чем другого. В общей сложности обучающие партии содержат ровно 5000 изображений из каждого класса.

Вот классы в датасете, а также 10 случайных изображений из каждого:

![image1](image1.webp)


Классы в датасете полностью взаимно исключающие. Нет перекрытия между автомобилями и грузовиками. Класс "Автомобиль" включает седаны, внедорожники и подобные им транспортные средства. Класс "Грузовик" включает только большие грузовики. Ни в одном классе нет пикапов.

---

# DataLoader: # 11vbzi4NFTU1gqZP6DGXO8AJ8NbV5fqyH

In [15]:
import gdown
import pickle
import numpy as np
import tarfile
import os
from PIL import Image
import matplotlib.pyplot as plt

# Функция для скачивания файла с Google Диска
def download_from_google_drive(file_id, output_path):
    url = f'https://drive.google.com/uc?export=download&id={file_id}'
    gdown.download(url, output_path, quiet=False)

# Функция для загрузки pickle-файла
def unpickle(file):
    with open(file, 'rb') as fo:
        data_dict = pickle.load(fo, encoding='bytes')
    return data_dict

# Распаковка архива .tar.gz
def extract_tar_gz(file_path, extract_to):
    with tarfile.open(file_path, "r:gz") as tar:
        tar.extractall(path=extract_to)
        print(f"Архив распакован в: {extract_to}")

# Скачивание и распаковка
file_id = '11vbzi4NFTU1gqZP6DGXO8AJ8NbV5fqyH'  # Замените на свой ID файла
data_dir = './cifar_data/cifar-10-batches-py'  # Путь к директории
batch_files = ['data_batch_1']

# Скачиваем архив и распаковываем его
download_from_google_drive(file_id, 'data.tar.gz')
extract_tar_gz('data.tar.gz', data_dir)

# Загружаем первый батч
batch_file = batch_files[0]
batch_data = unpickle(os.path.join(data_dir, batch_file))

# Извлекаем первые 5 картинок
data = batch_data[b"data"][:5]  # первые 5 картинок
labels = batch_data[b"labels"][:5]  # их метки

# Визуализируем эти картинки
fig, axes = plt.subplots(1, 5, figsize=(15, 5))
for i, img_data in enumerate(data):
    img = Image.fromarray(np.transpose(img_data.reshape(3, 32, 32), (1, 2, 0)))
    axes[i].imshow(img)
    axes[i].axis('off')
    axes[i].set_title(f"Label: {labels[i]}")

plt.show()


Downloading...
From (original): https://drive.google.com/uc?export=download&id=11vbzi4NFTU1gqZP6DGXO8AJ8NbV5fqyH
From (redirected): https://drive.google.com/uc?export=download&id=11vbzi4NFTU1gqZP6DGXO8AJ8NbV5fqyH&confirm=t&uuid=9a140f91-a60c-4e0e-9f83-feba7376ea11
To: c:\Users\sgs-w\OneDrive\Рабочий стол\Курсач\data.tar.gz

[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[A
[

Архив распакован в: ./cifar_data/cifar-10-batches-py


FileNotFoundError: [Errno 2] No such file or directory: './cifar_data/cifar-10-batches-py\\data_batch_1'

# Список литературы и источников:

1. Learning Transferable Architectures for Scalable Image Recognition
Barret Zoph, Vijay Vasudevan (2018). Learning Transferable Architectures for Scalable Image Recognition. Retrieved from https://paperswithcode.com/paper/learning-transferable-architectures-for
2. Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks
Radford A., Metz L., & Chintala S. (2015). Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks. Retrieved from https://paperswithcode.com/paper/unsupervised-representation-learning-with-1
3. RegNet: Self-Regulated Network for Image Classification
Xu, J., Pan, Y., Pan, X., Hoi, S., Yi, Z., & Xu, Z. (2021). RegNet: Self-Regulated Network for Image Classification. Retrieved from https://paperswithcode.com/paper/regnet-self-regulated-network-for-image