In [1]:
from tinygrad.densetensor import DenseTensor
from tinygrad.sparsetensor import SparseTensor
import numpy as np
import tinygrad.optim as optim

%load_ext autoreload
%autoreload 2

DEVICE:GPU


In [2]:
dim1 = 3
dim2 = 3
dim3 = 3

x_init = np.random.randn(3,3).astype(np.float32)
x2_init = np.random.randn(3).astype(np.float32)
U_init = np.random.randn(3,3).astype(np.float32)
V_init = np.random.randn(3,3).astype(np.float32)
W_init = SparseTensor.uniform(dim2,dim3, randsparsity=0.7).to_numpy().astype(np.float32)
m_init = np.random.randn(1,3).astype(np.float32)

In [3]:
x_init

array([[-1.2104248 , -0.07473759,  0.20473339],
       [-0.00983489, -1.4275917 , -1.1297107 ],
       [ 1.357535  , -0.7259296 , -2.2484922 ]], dtype=float32)

In [4]:
W_init

array([[0.        , 0.        , 0.00452769],
       [0.        , 0.        , 0.0024916 ],
       [0.        , 0.00648984, 0.        ]], dtype=float32)

In [5]:
x = DenseTensor(x_init)
W = DenseTensor(W_init)
m = DenseTensor(m_init)
out = x.dot(W).relu()
out = out.logsoftmax()
out = out.mul(m).add(m).sum()
out.backward()

out.cpu().data, x

(array([-0.09661156], dtype=float32),
 <DenseTensor <GPUBuffer with shape (3, 3)> with grad <GPUBuffer with shape (3, 3)>>)

In [6]:
x = SparseTensor(x_init.T)
W = DenseTensor(W_init.T)
m = DenseTensor(m_init)
out = x.dot(W).relu()
out = out.logsoftmax()
out = out.mul(m).add(m).sum()
out.backward()

out.cpu().data, x



(array([-0.10065711], dtype=float32),
 <SparseTensor <GPUBuffer with shape (9,)> with grad <SparseTensor <GPUBuffer with shape (24,)> with grad None>>)

In [7]:
dim = 16
x2 = DenseTensor(np.random.randn(dim,1).astype(np.float32))#.gpu()
W = SparseTensor(randinit=(dim,dim), randsparsity=0.2)
out = W.dot(x2).relu()

out.backward()

out.cpu().data, out.cpu().data.shape

(array([[3.08799502e-02, 5.15602827e-02, 6.02791794e-02, 2.71089729e-02,
         6.24181032e-02, 6.11800365e-02, 3.00276205e-02, 6.84318319e-02,
         2.40639038e-02, 5.61855808e-02, 4.46009971e-02, 4.09489013e-02,
         4.19365242e-02, 4.89238463e-02, 4.87585030e-02, 8.30676109e-02],
        [2.65361406e-02, 6.36616722e-02, 3.80985551e-02, 2.71566715e-02,
         4.65024449e-02, 5.31135798e-02, 3.99603210e-02, 6.51992932e-02,
         5.17629199e-02, 3.52812596e-02, 1.49593260e-02, 3.46229710e-02,
         3.70891839e-02, 4.05528769e-02, 1.85205471e-02, 3.68745364e-02],
        [3.84404585e-02, 3.74787115e-02, 3.69156785e-02, 3.09467800e-02,
         5.83103038e-02, 2.77402662e-02, 3.63044776e-02, 4.17459160e-02,
         3.49338688e-02, 6.07558489e-02, 2.27183569e-02, 4.79307361e-02,
         2.57297643e-02, 5.12005873e-02, 2.59459727e-02, 6.34528846e-02],
        [2.78822388e-02, 2.44403891e-02, 4.39893752e-02, 1.94227509e-02,
         2.10531000e-02, 3.38816233e-02, 2.97852

In [8]:
out.grad.cpu().data

array([[1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,