# 卷积神经网络

输入、输出
卷积：不是对一个像素进行处理，而是对图片上的一小块区域进行

图片1（`长*宽*高(r+g+b)`）经过一次`卷积`得到新的图片，
图片2（`长/2 * 宽/2 * 高(r+g+b+一个新的特征)`）它的长宽信息减少，但在图片的深度上会增加，增加新的信息维度（例如边缘等）

在卷积的过程中可能会丢失一些信息，此时我们采用池化（Pooling）尽量不压缩长宽

常见结构（从下到上）：
   - image 图片
   - convolution 卷积
   - max pooling 池化
   - fully connected 全连接
   - fully connected 全连接
   - classifier 分类器

In [1]:
# 猫狗图片分类

# 1.数据加载

In [26]:
# coding:utf-8
import os
from PIL import Image
from torch.utils import data
import numpy as np
from torchvision import transforms as T

class DogCat(data.Dataset):
    def __init__(self, root, transforms=None, train=True, test=False):
        """
        目标：获取所有图片地址，并根据训练、验证、测试划分数据
        """
        self.test = test
        imgs = [os.path.join(root, img) for img in os.listdir(root)]# 
        
        # test1: data/test1/8973.jpg
        # train: data/train/cat.10004.jpg 
        if self.test:
            imgs = sorted(imgs, key=lambda x: int(x.split('.')[-2].split('/')[-1]))
        else:
            imgs = sorted(imgs, key=lambda x: int(x.split('.')[-2]))
            # lambda 部分目的是从文件名中筛出那些数字 10004
            # sorted 则是按照数字顺序排序，并存储到新的列表
        imgs_num = len(imgs)
        
        # 划分训练、验证集，验证:训练 = 3:7
        if self.test:
            self.imgs = imgs
        elif train:
            self.imgs = imgs[:int(0.7*imgs_num)]
        else :
            self.imgs = imgs[int(0.7*imgs_num):]
        
        
        if transforms is None:
            # 数据转换操作，测试验证和训练的数据转换有所区别
            # 归一化 channel = (channel-mean)/std 不明白
            normalize = T.Normalize(mean = [0.485, 0.456, 0.406], 
                                     std = [0.229, 0.224, 0.225])
            # 测试集和验证集
            if self.test or not train: 
                self.transforms = T.Compose([
                    T.Scale(224),
                    T.CenterCrop(224),
                    T.ToTensor(),
                    normalize
                ]) 
            # 训练集
            else :
                self.transforms = T.Compose([
                    T.Scale(256),
                    T.RandomSizedCrop(224),
                    T.RandomHorizontalFlip(),
                    T.ToTensor(),
                    normalize
                ]) 
    
    def __getitem__(self, index):
        """
        返回一张图片的数据
        对于测试集，没有label，返回图片id，如1000.jpg返回1000
        """
        img_path = self.imgs[index]
        if self.test: 
             label = int(self.imgs[index].split('.')[-2].split('/')[-1])
        else: 
             label = 1 if 'dog' in img_path.split('/')[-1] else 0
        data = Image.open(img_path)
        data = self.transforms(data)
        return data, label
    
    def __len__(self):
        """
        返回数据集中所有图片的个数
        """
        return len(self.imgs)

In [None]:
train_dataset = DogCat(opt.train_data_root, train=True)
trainloader = DataLoader(train_dataset,
                        batch_size = opt.batch_size,
                        shuffle = True,
                        num_workers = opt.num_workers)
                  
for ii, (data, label) in enumerate(trainloader):
    train()

In [17]:
a = 'data/test1/8973.jpg'
b = 'data/train/cat.10004.jpg'
c = [a,b]
print(c)

f = b.split('.')
fd = b.split('/')[-1]
print(f)
print(fd)

e = int(b.split('.')[-2])
print(e)

d = int(b.split('.')[-2].split('/')[-1])
print(d)

['data/test1/8973.jpg', 'data/train/cat.10004.jpg']
['data/train/cat', '10004', 'jpg']
cat.10004.jpg
10004
10004


In [None]:
if True:
    imgs = sorted(c, key=lambda x: int(x.split('.')[-2].split('/')[-1]))
    print(imgs)
else:
    imgs = sorted(c, key=lambda x: int(x.split('.')[-2]))
    print(imgs)

In [21]:
import os
root = 'D:/0_PyData/Dog&Cat_Data'
imgs = [os.path.join(root, img) for img in os.listdir(root)]
print(imgs)

['D:/0_PyData/Dog&Cat_Data\\sampleSubmission.csv', 'D:/0_PyData/Dog&Cat_Data\\test1', 'D:/0_PyData/Dog&Cat_Data\\test1.zip', 'D:/0_PyData/Dog&Cat_Data\\train', 'D:/0_PyData/Dog&Cat_Data\\train.zip']


In [24]:
import os
root = 'D:/0_PyData/Dog&Cat_Data'
for img in os.listdir(root):
    print(img)


sampleSubmission.csv
test1
test1.zip
train
train.zip
