In [1]:
from tinygrad.densetensor import DenseTensor
from tinygrad.sparsetensor import SparseTensor
import numpy as np
import tinygrad.optim as optim

%load_ext autoreload
%autoreload 2

DEVICE:GPU


In [2]:
dim1 = 3
dim2 = 3
dim3 = 3

x_init = np.random.randn(3,3).astype(np.float32)
x2_init = np.random.randn(3).astype(np.float32)
U_init = np.random.randn(3,3).astype(np.float32)
V_init = np.random.randn(3,3).astype(np.float32)
W_init = SparseTensor.uniform(dim2,dim3, randsparsity=0.7).to_numpy().astype(np.float32)
m_init = np.random.randn(1,3).astype(np.float32)

In [3]:
x_init

array([[ 1.3046834 ,  0.04164853,  1.2508975 ],
       [ 0.8677658 ,  0.588463  ,  0.6791847 ],
       [ 1.2291559 , -0.38143384,  3.3918836 ]], dtype=float32)

In [4]:
W_init

array([[0.        , 0.        , 0.00533126],
       [0.        , 0.00018555, 0.        ],
       [0.        , 0.00736821, 0.        ]], dtype=float32)

In [5]:
x = DenseTensor(x_init)
W = DenseTensor(W_init)
m = DenseTensor(m_init)
out = x.dot(W).relu()
out = out.logsoftmax()
out = out.mul(m).add(m).sum()
out.backward()

out.cpu().data, x

(array([0.4609747], dtype=float32),
 <DenseTensor <GPUBuffer with shape (3, 3)> with grad <GPUBuffer with shape (3, 3)>>)

In [6]:
x = SparseTensor(x_init.T)
W = DenseTensor(W_init.T)
m = DenseTensor(m_init)
out = x.dot(W).relu()
out = out.logsoftmax()
out = out.mul(m).add(m).sum()
out.backward()

out.cpu().data, x



(array([0.5117228], dtype=float32),
 <SparseTensor <GPUBuffer with shape (9,)> with grad <DenseTensor <GPUBuffer with shape (3, 3)> with grad None>>)

In [7]:
dim = 16
x2 = DenseTensor(np.random.randn(dim,1).astype(np.float32))#.gpu()
W = SparseTensor(randinit=(dim,dim), randsparsity=0.2)
out = W.dot(x2).relu()

out.backward()

out.cpu().data, out.cpu().data.shape

(array([[1.1672085e-02, 0.0000000e+00, 0.0000000e+00, 0.0000000e+00,
         1.5308875e-02, 1.4638890e-03, 0.0000000e+00, 1.5457895e-03,
         0.0000000e+00, 1.3800284e-03, 0.0000000e+00, 1.2581232e-02,
         0.0000000e+00, 2.4767483e-03, 0.0000000e+00, 0.0000000e+00],
        [1.3627433e-03, 0.0000000e+00, 0.0000000e+00, 5.1594963e-03,
         0.0000000e+00, 0.0000000e+00, 7.3302458e-03, 7.7157617e-03,
         4.6693324e-03, 2.4113131e-03, 0.0000000e+00, 0.0000000e+00,
         0.0000000e+00, 0.0000000e+00, 2.1204946e-03, 4.4324631e-03],
        [0.0000000e+00, 0.0000000e+00, 0.0000000e+00, 0.0000000e+00,
         0.0000000e+00, 0.0000000e+00, 0.0000000e+00, 0.0000000e+00,
         2.1381886e-03, 0.0000000e+00, 0.0000000e+00, 0.0000000e+00,
         0.0000000e+00, 0.0000000e+00, 0.0000000e+00, 0.0000000e+00],
        [0.0000000e+00, 8.4899077e-03, 0.0000000e+00, 0.0000000e+00,
         0.0000000e+00, 2.6155699e-03, 0.0000000e+00, 0.0000000e+00,
         0.0000000e+00, 6.75337

In [8]:
out.grad.cpu().data

array([[1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,