# 语法和常见示例
DataLoader(dataset, batch_size=1, shuffle=False, sampler=None, pin_memory=False, drop_last=False, timeout=0, worker_init_fn=None, *, prefetch_factor=2, persistent_workers=False)
- dataset:数据集本身
- batch_size:我们希望在迭代时传递到训练循环中的样本数
- shuffle:我们可以选择在每个epoch期间随机打乱数据
shuffle 选项很有帮助，因为您的数据集中按顺序排列了许多相同的标签。例如，如果您有一个包含狗和猫图片的数据集，那么如果每个 mini-batch 都包含狗和猫的混合示例，那就太好了。一些数据集是按顺序存储的，因此在构建批次时，每个批次最终都只有狗或猫，而不是混合的。将 shuffle 设置为 true 可以在训练期间消除该问题。

In [None]:
from torchvision import datasets
from torchvision import transforms
from torch.utils.data import DataLoader

In [None]:
# Grab the CIFAR10 Dataset
dataset_train = datasets.CIFAR10('../data', train=True, download=False,
                                 transform=transforms.Compose([transforms.ToTensor()]))

dataset_test = datasets.CIFAR10('../data', train=False, download=False,
                                transform=transforms.Compose([transforms.ToTensor()]))

- root:表示CIFAR数据的加载目录
- train:表示是否加载数据库的训练集，False的时候加载测试集
- download:表示是否自动下载cifar数据集
- transform:表示是否需要对数据进行预处理，None为不进行预处理

In [None]:
# Create test and traing dataloader with dataset
train_loader = DataLoader(dataset_train, batch_size=64, shuffle=True)

test_loader = DataLoader(dataset_test, batch_size=64, shuffle=False)


In [None]:
!pip install efficientnet_pytorch
from torch import nn
from torch import optim
from efficientnet_pytorch import EfficientNet
model = EfficientNet.from_pretrained('efficientnet-b0', num_classes=10)

In [None]:
# Define criterion and optimizer
criterion = nn.CrossEntropyLoss()
optimizer = optim.RMSprop(model.parameters(), lr=0.0002)

# Training Loop with Loader
for x, y in train_loader:
    optimizer.zero_grad()
    pred = model(x)
    loss = criterion(pred,y)
    loss.backward()
    optimizer.step()

    print (loss.item())

In [None]:
# Test model using test_loader
totalLoss=0
for x, y in test_loader:
    pred = model(x)
    loss = criterion(pred,y)
    totalLoss+=loss.item()

In [None]:
totalLoss

# DataLoader高级选项
