In [3]:
import numpy as np
import torch

from torch.utils.data import DataLoader, TensorDataset

In [4]:
n_observations = 100
n_features = 20

data = np.random.randn(n_observations, n_features)

In [7]:
dataT = torch.tensor(data)

print('Numpy data:')
print(type(data))
print(data.shape)
print(data.dtype)
print(' ')

print('Tensor data:')
print(type(dataT))
print(dataT.size())
print(dataT.dtype)
print(' ')

Numpy data:
<class 'numpy.ndarray'>
(100, 20)
float64
 
Tensor data:
<class 'torch.Tensor'>
torch.Size([100, 20])
torch.float64
 


In [8]:
dataT2 = torch.tensor(data).float()
print(dataT2.dtype)

dataT3 = torch.tensor(data).long()
print(dataT3.dtype)

torch.float32
torch.int64


In [9]:
dataset = TensorDataset(dataT)

dataset.tensors

(tensor([[-2.2849, -0.4143,  0.3851,  ...,  0.4203,  0.0225,  0.5106],
         [-0.1934, -1.5936,  0.4925,  ...,  0.2854, -0.2941,  0.5130],
         [-0.4417, -0.4318, -0.2262,  ...,  1.1162, -0.9986,  0.0986],
         ...,
         [ 0.2448, -0.8723, -0.6204,  ..., -0.5832,  2.1082,  0.6355],
         [-2.2794, -1.4198, -0.9267,  ...,  0.0927,  0.9481,  0.3755],
         [-1.0849, -1.1821,  1.7996,  ..., -0.0372,  1.6561, -0.9539]],
        dtype=torch.float64),)

In [13]:
labels = torch.ceil(torch.linspace(.01,4,n_observations))

labels = labels.reshape((len(labels), 1))
print(labels)

dataset = TensorDataset(dataT, labels)
print(dataset[0])
print(dataset.tensors[0].size())
print(dataset.tensors[1].size())

print(np.shape(np.random.randint(5,size=n_observations)))

tensor([[1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [1.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [2.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
        [3.],
      

In [15]:
batch_size=25
dataloader = DataLoader(dataset, batch_size=batch_size)

dataloader.dataset.tensors[0].size()

torch.Size([100, 20])

In [16]:
for dat, labs in dataloader:
    print('BATCH INFO:')
    print(dat.size())
    print(labs.size())
    print(' ')

BATCH INFO:
torch.Size([25, 20])
torch.Size([25, 1])
 
BATCH INFO:
torch.Size([25, 20])
torch.Size([25, 1])
 
BATCH INFO:
torch.Size([25, 20])
torch.Size([25, 1])
 
BATCH INFO:
torch.Size([25, 20])
torch.Size([25, 1])
 


In [17]:
for dat, labs in dataloader:
    print(labs.T)
    print(' ')

tensor([[1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
         1., 1., 1., 1., 1., 1., 1.]])
 
tensor([[2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2., 2.,
         2., 2., 2., 2., 2., 2., 2.]])
 
tensor([[3., 3., 3., 3., 3., 3., 3., 3., 3., 3., 3., 3., 3., 3., 3., 3., 3., 3.,
         3., 3., 3., 3., 3., 3., 3.]])
 
tensor([[4., 4., 4., 4., 4., 4., 4., 4., 4., 4., 4., 4., 4., 4., 4., 4., 4., 4.,
         4., 4., 4., 4., 4., 4., 4.]])
 


In [24]:
dataloader = DataLoader(dataset, batch_size=batch_size, shuffle=True)

for dat, labs in dataloader:
    print(labs.T)
    print(' ')

tensor([[2., 2., 1., 3., 4., 2., 4., 2., 4., 3., 1., 1., 1., 3., 1., 2., 4., 2.,
         4., 1., 3., 2., 4., 3., 3.]])
 
tensor([[3., 1., 2., 2., 4., 4., 2., 1., 3., 2., 4., 4., 4., 1., 4., 2., 1., 1.,
         4., 3., 3., 1., 1., 1., 3.]])
 
tensor([[4., 2., 2., 4., 1., 1., 3., 2., 1., 3., 1., 4., 4., 3., 3., 4., 3., 4.,
         4., 2., 3., 3., 4., 3., 3.]])
 
tensor([[1., 4., 2., 1., 1., 2., 4., 4., 2., 1., 1., 3., 2., 3., 2., 2., 4., 1.,
         3., 3., 3., 2., 1., 2., 2.]])
 


In [26]:
dat, labs = next(iter(dataloader))
labs

tensor([[1.],
        [2.],
        [1.],
        [3.],
        [2.],
        [1.],
        [1.],
        [2.],
        [3.],
        [1.],
        [4.],
        [3.],
        [1.],
        [2.],
        [1.],
        [3.],
        [1.],
        [2.],
        [4.],
        [3.],
        [1.],
        [1.],
        [3.],
        [2.],
        [2.]])