<a href="https://colab.research.google.com/github/DarkKillX/MachineLearningTasks/blob/main/Final-Exam/00_pytorch_fundamentals.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Dery Hidayat**


## **1103228181**

# 00. PyTorch Fundamentals

## What is PyTorch?

[PyTorch](https://pytorch.org/) is an open source machine learning and deep learning framework.

## What can PyTorch be used for?

PyTorch allows you to manipulate and process data and write machine learning algorithms using Python code.

## Who uses PyTorch?

Many of the worlds largest technology companies such as [Meta (Facebook)](https://ai.facebook.com/blog/pytorch-builds-the-future-of-ai-and-machine-learning-at-facebook/), Tesla and Microsoft as well as artificial intelligence research companies such as [OpenAI use PyTorch](https://openai.com/blog/openai-pytorch/) to power research and bring machine learning to their products.

![pytorch being used across industry and research](https://raw.githubusercontent.com/mrdbourke/pytorch-deep-learning/main/images/00-pytorch-being-used-across-research-and-industry.png)

For example, Andrej Karpathy (head of AI at Tesla) has given several talks ([PyTorch DevCon 2019](https://youtu.be/oBklltKXtDE), [Tesla AI Day 2021](https://youtu.be/j0z4FweCy4M?t=2904)) about how Tesla use PyTorch to power their self-driving computer vision models.

PyTorch is also used in other industries such as agriculture to [power computer vision on tractors](https://medium.com/pytorch/ai-for-ag-production-machine-learning-for-agriculture-e8cfdb9849a1).

## Why use PyTorch?

Machine learning researchers love using PyTorch. And as of February 2022, PyTorch is the [most used deep learning framework on Papers With Code](https://paperswithcode.com/trends), a website for tracking machine learning research papers and the code repositories attached with them.

PyTorch also helps take care of many things such as GPU acceleration (making your code run faster) behind the scenes.

So you can focus on manipulating data and writing algorithms and PyTorch will make sure it runs fast.

And if companies such as Tesla and Meta (Facebook) use it to build models they deploy to power hundreds of applications, drive thousands of cars and deliver content to billions of people, it's clearly capable on the development front too.

## What we're going to cover in this module

This course is broken down into different sections (notebooks).

Each notebook covers important ideas and concepts within PyTorch.

Subsequent notebooks build upon knowledge from the previous one (numbering starts at 00, 01, 02 and goes to whatever it ends up going to).

This notebook deals with the basic building block of machine learning and deep learning, the tensor.

Specifically, we're going to cover:

| **Topic** | **Contents** |
| ----- | ----- |
| **Introduction to tensors** | Tensors are the basic building block of all of machine learning and deep learning. |
| **Creating tensors** | Tensors can represent almost any kind of data (images, words, tables of numbers). |
| **Getting information from tensors** | If you can put information into a tensor, you'll want to get it out too. |
| **Manipulating tensors** | Machine learning algorithms (like neural networks) involve manipulating tensors in many different ways such as adding, multiplying, combining. |
| **Dealing with tensor shapes** | One of the most common issues in machine learning is dealing with shape mismatches (trying to mixed wrong shaped tensors with other tensors). |
| **Indexing on tensors** | If you've indexed on a Python list or NumPy array, it's very similar with tensors, except they can have far more dimensions. |
| **Mixing PyTorch tensors and NumPy** | PyTorch plays with tensors ([`torch.Tensor`](https://pytorch.org/docs/stable/tensors.html)), NumPy likes arrays ([`np.ndarray`](https://numpy.org/doc/stable/reference/generated/numpy.ndarray.html)) sometimes you'll want to mix and match these. |
| **Reproducibility** | Machine learning is very experimental and since it uses a lot of *randomness* to work, sometimes you'll want that *randomness* to not be so random. |
| **Running tensors on GPU** | GPUs (Graphics Processing Units) make your code faster, PyTorch makes it easy to run your code on GPUs. |

## Where can you get help?

All of the materials for this course [live on GitHub](https://github.com/mrdbourke/pytorch-deep-learning).

And if you run into trouble, you can ask a question on the [Discussions page](https://github.com/mrdbourke/pytorch-deep-learning/discussions) there too.

There's also the [PyTorch developer forums](https://discuss.pytorch.org/), a very helpful place for all things PyTorch.

## Importing PyTorch

> **Note:** Before running any of the code in this notebook, you should have gone through the [PyTorch setup steps](https://pytorch.org/get-started/locally/).
>
> However, **if you're running on Google Colab**, everything should work (Google Colab comes with PyTorch and other libraries installed).

Let's start by importing PyTorch and checking the version we're using.

In [1]:
import torch
torch.__version__

'2.1.0+cu121'

torch.__version__ adalah sebuah perintah dalam bahasa pemrograman Python yang digunakan untuk menampilkan versi dari pustaka PyTorch yang sedang digunakan.

Wonderful, it looks like we've got PyTorch 1.10.0+.

This means if you're going through these materials, you'll see most compatability with PyTorch 1.10.0+, however if your version number is far higher than that, you might notice some inconsistencies.

And if you do have any issues, please post on the course [GitHub Discussions page](https://github.com/mrdbourke/pytorch-deep-learning/discussions).

## Introduction to tensors

Now we've got PyTorch imported, it's time to learn about tensors.

Tensors are the fundamental building block of machine learning.

Their job is to represent data in a numerical way.

For example, you could represent an image as a tensor with shape `[3, 224, 224]` which would mean `[colour_channels, height, width]`, as in the image has `3` colour channels (red, green, blue), a height of `224` pixels and a width of `224` pixels.

![example of going from an input image to a tensor representation of the image, image gets broken down into 3 colour channels as well as numbers to represent the height and width](https://raw.githubusercontent.com/mrdbourke/pytorch-deep-learning/main/images/00-tensor-shape-example-of-image.png)

In tensor-speak (the language used to describe tensors), the tensor would have three dimensions, one for `colour_channels`, `height` and `width`.

But we're getting ahead of ourselves.

Let's learn more about tensors by coding them.


### Creating tensors

PyTorch loves tensors. So much so there's a whole documentation page dedicated to the [`torch.Tensor`](https://pytorch.org/docs/stable/tensors.html) class.

Your first piece of homework is to [read through the documentation on `torch.Tensor`](https://pytorch.org/docs/stable/tensors.html) for 10-minutes. But you can get to that later.

Let's code.

The first thing we're going to create is a **scalar**.

A scalar is a single number and in tensor-speak it's a zero dimension tensor.

> **Note:** That's a trend for this course. We'll focus on writing specific code. But often I'll set exercises which involve reading and getting familiar with the PyTorch documentation. Because after all, once you're finished this course, you'll no doubt want to learn more. And the documentation is somewhere you'll be finding yourself quite often.

In [2]:
# Scalar
scalar = torch.tensor(7)
scalar

tensor(7)

Kode ini membuat variabel yang disebut scalar dan mengisinya dengan nilai 7 menggunakan pustaka PyTorch. Variabel scalar ini merupakan contoh dari skalar, yang merupakan konsep dalam matematika dan pemrograman yang mewakili nilai tunggal. Dalam hal ini, nilai 7 merupakan skalar karena hanya memiliki satu nilai tanpa memiliki arah atau dimensi tambahan.

See how the above printed out `tensor(7)`?

That means although `scalar` is a single number, it's of type `torch.Tensor`.

We can check the dimensions of a tensor using the `ndim` attribute.

In [3]:
scalar.ndim

0

.ndim pada sebuah tensor PyTorch memberikan jumlah dimensi dari tensor tersebut. Namun, pada skalar (seperti yang Anda definisikan sebelumnya dengan torch.tensor(7)), karena skalar hanya memiliki satu nilai tunggal tanpa dimensi tambahan, properti .ndim akan mengembalikan nilai 0.

What if we wanted to retrieve the number from the tensor?

As in, turn it from `torch.Tensor` to a Python integer?

To do we can use the `item()` method.

In [4]:
# Get the Python number within a tensor (only works with one-element tensors)
scalar.item()

7

.item() pada tensor PyTorch digunakan untuk mengakses nilai yang terdapat dalam tensor jika tensor tersebut hanya memiliki satu elemen. Pada kasus penggunaan skalar sebelumnya (torch.tensor(7)), karena skalar hanya memiliki satu nilai tunggal, Anda dapat menggunakan .item() untuk mengambil nilai Python (bukan tensor) dari skalar tersebut.

Okay, now let's see a **vector**.

A vector is a single dimension tensor but can contain many numbers.

As in, you could have a vector `[3, 2]` to describe `[bedrooms, bathrooms]` in your house. Or you could have `[3, 2, 2]` to describe `[bedrooms, bathrooms, car_parks]` in your house.

The important trend here is that a vector is flexible in what it can represent (the same with tensors).

In [5]:
# Vector
vector = torch.tensor([7, 7])
vector

tensor([7, 7])


Kode ini membuat variabel yang disebut vector menggunakan pustaka PyTorch. Variabel ini merupakan sebuah vektor yang berisi dua elemen, yaitu 7 dan 7. Dalam matematika dan pemrograman, vektor adalah suatu struktur data yang terdiri dari sekumpulan nilai atau elemen yang tersusun dalam urutan tertentu.

Wonderful, `vector` now contains two 7's, my favourite number.

How many dimensions do you think it'll have?

In [6]:
# Check the number of dimensions of vector
vector.ndim

1

Pada PyTorch, properti .ndim digunakan untuk mengetahui jumlah dimensi dari sebuah tensor. Pada vektor yang telah Anda definisikan sebelumnya (torch.tensor([7, 7])), karena vektor tersebut memiliki elemen yang disusun dalam satu dimensi (yaitu berupa daftar satu dimensi [7, 7]), properti .ndim akan mengembalikan nilai 1. Artinya, vektor tersebut memiliki satu dimensi karena elemennya disusun dalam satu baris atau satu kolom.

Hmm, that's strange, `vector` contains two numbers but only has a single dimension.

I'll let you in on a trick.

You can tell the number of dimensions a tensor in PyTorch has by the number of square brackets on the outside (`[`) and you only need to count one side.

How many square brackets does `vector` have?

Another important concept for tensors is their `shape` attribute. The shape tells you how the elements inside them are arranged.

Let's check out the shape of `vector`.

In [7]:
# Check shape of vector
vector.shape

torch.Size([2])

Fungsi .shape pada tensor PyTorch digunakan untuk menampilkan ukuran atau bentuk dari tensor tersebut. Pada vektor yang telah Anda definisikan sebelumnya (torch.tensor([7, 7])), hasil dari .shape akan menunjukkan (2,). Artinya, vektor tersebut memiliki panjang satu dimensi sebesar 2, menunjukkan bahwa vektor ini memiliki dua elemen dalam satu dimensi saja.

The above returns `torch.Size([2])` which means our vector has a shape of `[2]`. This is because of the two elements we placed inside the square brackets (`[7, 7]`).

Let's now see a **matrix**.

In [8]:
# Matrix
MATRIX = torch.tensor([[7, 8],
                       [9, 10]])
MATRIX

tensor([[ 7,  8],
        [ 9, 10]])

Dalam potongan kode tersebut, Anda membuat sebuah variabel yang disebut MATRIX menggunakan PyTorch. Variabel ini mewakili sebuah matriks, yang didefinisikan sebagai kumpulan nilai atau elemen yang disusun dalam baris dan kolom.

Wow! More numbers! Matrices are as flexible as vectors, except they've got an extra dimension.



In [9]:
# Check number of dimensions
MATRIX.ndim

2

Properti .ndim pada tensor PyTorch digunakan untuk mengetahui jumlah dimensi dari sebuah tensor. Pada matriks yang telah Anda definisikan sebelumnya (torch.tensor([[7, 8], [9, 10]])), karena matriks tersebut memiliki struktur dua dimensi dengan baris dan kolom, properti .ndim akan mengembalikan nilai 2. Artinya, matriks tersebut memiliki dua dimensi karena tersusun dalam baris dan kolom.

`MATRIX` has two dimensions (did you count the number of square brakcets on the outside of one side?).

What `shape` do you think it will have?

In [10]:
MATRIX.shape

torch.Size([2, 2])

Fungsi .shape pada tensor PyTorch digunakan untuk menampilkan ukuran atau bentuk dari tensor tersebut. Pada matriks yang telah Anda definisikan sebelumnya (torch.tensor([[7, 8], [9, 10]])), hasil dari .shape akan menunjukkan (2, 2).

Artinya, matriks tersebut memiliki dimensi dua, dengan dimensi pertama menunjukkan jumlah baris (2) dan dimensi kedua menunjukkan jumlah kolom (2).

We get the output `torch.Size([2, 2])` because `MATRIX` is two elements deep and two elements wide.

How about we create a **tensor**?

In [11]:
# Tensor
TENSOR = torch.tensor([[[1, 2, 3],
                        [3, 6, 9],
                        [2, 4, 5]]])
TENSOR

tensor([[[1, 2, 3],
         [3, 6, 9],
         [2, 4, 5]]])

Pada potongan kode tersebut, Anda membuat sebuah variabel yang disebut TENSOR menggunakan pustaka PyTorch. Variabel ini merupakan sebuah tensor multidimensi yang terdiri dari tiga dimensi. Tensor adalah struktur data yang mirip dengan matriks, namun dapat memiliki lebih dari dua dimensi.

Dalam kasus ini, tensor yang Anda definisikan memiliki tiga dimensi yang dituliskan dalam format [[][][]], yang berarti:

Dimensi pertama: Terdiri dari satu elemen yang menyimpan seluruh tensor.
Dimensi kedua: Memiliki tiga sublist yang masing-masing berisi tiga angka.
Dimensi ketiga: Tiap sublist di dimensi kedua memiliki tiga elemen yang merepresentasikan nilai-nilai di dalam tensor.

Woah! What a nice looking tensor.

I want to stress that tensors can represent almost anything.

The one we just created could be the sales numbers for a steak and almond butter store (two of my favourite foods).

![a simple tensor in google sheets showing day of week, steak sales and almond butter sales](https://raw.githubusercontent.com/mrdbourke/pytorch-deep-learning/main/images/00_simple_tensor.png)

How many dimensions do you think it has? (hint: use the square bracket counting trick)

In [12]:
# Check number of dimensions for TENSOR
TENSOR.ndim

3

.ndim pada tensor PyTorch digunakan untuk mengetahui jumlah dimensi dari sebuah tensor. Pada tensor yang telah Anda definisikan sebelumnya (torch.tensor([[[1, 2, 3], [3, 6, 9], [2, 4, 5]]])), properti .ndim akan mengembalikan nilai 3.

And what about its shape?

In [13]:
# Check shape of TENSOR
TENSOR.shape

torch.Size([1, 3, 3])

Fungsi .shape pada tensor PyTorch digunakan untuk menampilkan ukuran atau bentuk dari tensor tersebut. Pada tensor yang telah Anda definisikan sebelumnya (torch.tensor([[[1, 2, 3], [3, 6, 9], [2, 4, 5]]])), hasil dari .shape akan menunjukkan (1, 3, 3).

Artinya, tensor tersebut memiliki tiga dimensi:

Dimensi pertama menunjukkan bahwa terdapat satu kelompok dari tensor tersebut.
Dimensi kedua menunjukkan bahwa tensor memiliki tiga sublist di dalamnya.
Dimensi ketiga menunjukkan bahwa setiap sublist memiliki tiga elemen di dalamnya.

Alright, it outputs `torch.Size([1, 3, 3])`.

The dimensions go outer to inner.

That means there's 1 dimension of 3 by 3.

![example of different tensor dimensions](https://raw.githubusercontent.com/mrdbourke/pytorch-deep-learning/main/images/00-pytorch-different-tensor-dimensions.png)

> **Note:** You might've noticed me using lowercase letters for `scalar` and `vector` and uppercase letters for `MATRIX` and `TENSOR`. This was on purpose. In practice, you'll often see scalars and vectors denoted as lowercase letters such as `y` or `a`. And matrices and tensors denoted as uppercase letters such as `X` or `W`.
>
> You also might notice the names martrix and tensor used interchangably. This is common. Since in PyTorch you're often dealing with `torch.Tensor`s (hence the tensor name), however, the shape and dimensions of what's inside will dictate what it actually is.

Let's summarise.

| Name | What is it? | Number of dimensions | Lower or upper (usually/example) |
| ----- | ----- | ----- | ----- |
| **scalar** | a single number | 0 | Lower (`a`) |
| **vector** | a number with direction (e.g. wind speed with direction) but can also have many other numbers | 1 | Lower (`y`) |
| **matrix** | a 2-dimensional array of numbers | 2 | Upper (`Q`) |
| **tensor** | an n-dimensional array of numbers | can be any number, a 0-dimension tensor is a scalar, a 1-dimension tensor is a vector | Upper (`X`) |

![scalar vector matrix tensor and what they look like](https://raw.githubusercontent.com/mrdbourke/pytorch-deep-learning/main/images/00-scalar-vector-matrix-tensor.png)

### Random tensors

We've established tensors represent some form of data.

And machine learning models such as neural networks manipulate and seek patterns within tensors.

But when building machine learning models with PyTorch, it's rare you'll create tensors by hand (like what we've being doing).

Instead, a machine learning model often starts out with large random tensors of numbers and adjusts these random numbers as it works through data to better represent it.

In essence:

`Start with random numbers -> look at data -> update random numbers -> look at data -> update random numbers...`

As a data scientist, you can define how the machine learning model starts (initialization), looks at data (representation) and updates (optimization) its random numbers.

We'll get hands on with these steps later on.

For now, let's see how to create a tensor of random numbers.

We can do so using [`torch.rand()`](https://pytorch.org/docs/stable/generated/torch.rand.html) and passing in the `size` parameter.

In [14]:
# Create a random tensor of size (3, 4)
random_tensor = torch.rand(size=(3, 4))
random_tensor, random_tensor.dtype

(tensor([[0.9455, 0.8789, 0.5498, 0.9052],
         [0.7351, 0.6799, 0.8798, 0.4124],
         [0.0963, 0.0341, 0.4040, 0.9879]]),
 torch.float32)

Kode ini membuat sebuah tensor acak dengan ukuran 3 baris dan 4 kolom menggunakan PyTorch. Fungsi torch.rand(size=(3, 4)) menghasilkan sebuah tensor dengan nilai-nilai yang diisi secara acak dari distribusi seragam (semua nilai memiliki probabilitas yang sama untuk muncul) antara 0 dan 1.

The flexibility of `torch.rand()` is that we can adjust the `size` to be whatever we want.

For example, say you wanted a random tensor in the common image shape of `[224, 224, 3]` (`[height, width, color_channels`]).

In [15]:
# Create a random tensor of size (224, 224, 3)
random_image_size_tensor = torch.rand(size=(224, 224, 3))
random_image_size_tensor.shape, random_image_size_tensor.ndim

(torch.Size([224, 224, 3]), 3)

Kode ini membuat sebuah tensor acak dengan ukuran (224, 224, 3) menggunakan PyTorch. Namun, PyTorch tidak secara langsung mendukung pembuatan tensor tiga dimensi dalam format ini.

PyTorch mengharapkan urutan dimensi dari sebuah tensor dalam bentuk (channel, height, width) untuk data citra, tetapi dalam kasus Anda, urutan dimensi yang diinginkan adalah (height, width, channel). Ini dapat menyebabkan kesalahan dalam pembuatan tensor.

Dalam kasus data citra, dimensi pertama (biasanya diwakili oleh 'channel') merujuk pada saluran warna (seperti merah, hijau, dan biru pada citra RGB), sedangkan dimensi kedua dan ketiga adalah tinggi dan lebar citra.

### Zeros and ones

Sometimes you'll just want to fill tensors with zeros or ones.

This happens a lot with masking (like masking some of the values in one tensor with zeros to let a model know not to learn them).

Let's create a tensor full of zeros with [`torch.zeros()`](https://pytorch.org/docs/stable/generated/torch.zeros.html)

Again, the `size` parameter comes into play.

In [16]:
# Create a tensor of all zeros
zeros = torch.zeros(size=(3, 4))
zeros, zeros.dtype

(tensor([[0., 0., 0., 0.],
         [0., 0., 0., 0.],
         [0., 0., 0., 0.]]),
 torch.float32)

Kode yang Anda berikan membuat sebuah tensor yang berisi semua nilai nol dengan ukuran 3 baris dan 4 kolom menggunakan PyTorch. Fungsi torch.zeros(size=(3, 4)) menghasilkan tensor dengan semua elemen diisi dengan nilai nol.

We can do the same to create a tensor of all ones except using [`torch.ones()` ](https://pytorch.org/docs/stable/generated/torch.ones.html) instead.

In [17]:
# Create a tensor of all ones
ones = torch.ones(size=(3, 4))
ones, ones.dtype

(tensor([[1., 1., 1., 1.],
         [1., 1., 1., 1.],
         [1., 1., 1., 1.]]),
 torch.float32)

Kode yang Anda berikan membuat sebuah tensor yang berisi semua nilai satu dengan ukuran 3 baris dan 4 kolom menggunakan PyTorch. Fungsi torch.ones(size=(3, 4)) menghasilkan tensor dengan semua elemen diisi dengan nilai satu.

### Creating a range and tensors like

Sometimes you might want a range of numbers, such as 1 to 10 or 0 to 100.

You can use `torch.arange(start, end, step)` to do so.

Where:
* `start` = start of range (e.g. 0)
* `end` = end of range (e.g. 10)
* `step` = how many steps in between each value (e.g. 1)

> **Note:** In Python, you can use `range()` to create a range. However in PyTorch, `torch.range()` is deprecated and may show an error in the future.

In [18]:
# Use torch.arange(), torch.range() is deprecated
zero_to_ten_deprecated = torch.range(0, 10) # Note: this may return an error in the future

# Create a range of values 0 to 10
zero_to_ten = torch.arange(start=0, end=10, step=1)
zero_to_ten

  zero_to_ten_deprecated = torch.range(0, 10) # Note: this may return an error in the future


tensor([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

Kode yang Anda berikan memiliki dua bagian yang melakukan hal yang serupa, yaitu menciptakan urutan nilai dari 0 hingga 10 menggunakan PyTorch. Namun, metode yang pertama menggunakan fungsi torch.range() yang sudah dinyatakan usang (deprecated), dan meskipun masih dapat berfungsi saat ini, mungkin akan menyebabkan kesalahan di masa depan.

Metode yang kedua menggunakan fungsi torch.arange() untuk membuat urutan nilai dari 0 hingga 9 (bukan 10, karena end tidak termasuk dalam hasil) dengan langkah (step) sebesar 1. Fungsi torch.arange() ini merupakan cara yang direkomendasikan untuk membuat urutan nilai dengan PyTorch.

Sometimes you might want one tensor of a certain type with the same shape as another tensor.

For example, a tensor of all zeros with the same shape as a previous tensor.

To do so you can use [`torch.zeros_like(input)`](https://pytorch.org/docs/stable/generated/torch.zeros_like.html) or [`torch.ones_like(input)`](https://pytorch.org/docs/1.9.1/generated/torch.ones_like.html) which return a tensor filled with zeros or ones in the same shape as the `input` respectively.

In [19]:
# Can also create a tensor of zeros similar to another tensor
ten_zeros = torch.zeros_like(input=zero_to_ten) # will have same shape
ten_zeros

tensor([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

Kode torch.zeros_like(input=zero_to_ten) membuat sebuah tensor yang berisi nilai-nilai nol dengan ukuran yang sama seperti tensor zero_to_ten yang sudah ada sebelumnya.

Hasilnya adalah tensor yang memiliki bentuk atau ukuran yang sama dengan zero_to_ten (yang merupakan tensor dengan urutan nilai dari 0 hingga 9), namun seluruh elemennya diisi dengan nilai nol.

### Tensor datatypes

There are many different [tensor datatypes available in PyTorch](https://pytorch.org/docs/stable/tensors.html#data-types).

Some are specific for CPU and some are better for GPU.

Getting to know which is which can take some time.

Generally if you see `torch.cuda` anywhere, the tensor is being used for GPU (since Nvidia GPUs use a computing toolkit called CUDA).

The most common type (and generally the default) is `torch.float32` or `torch.float`.

This is referred to as "32-bit floating point".

But there's also 16-bit floating point (`torch.float16` or `torch.half`) and 64-bit floating point (`torch.float64` or `torch.double`).

And to confuse things even more there's also 8-bit, 16-bit, 32-bit and 64-bit integers.

Plus more!

> **Note:** An integer is a flat round number like `7` whereas a float has a decimal `7.0`.

The reason for all of these is to do with **precision in computing**.

Precision is the amount of detail used to describe a number.

The higher the precision value (8, 16, 32), the more detail and hence data used to express a number.

This matters in deep learning and numerical computing because you're making so many operations, the more detail you have to calculate on, the more compute you have to use.

So lower precision datatypes are generally faster to compute on but sacrifice some performance on evaluation metrics like accuracy (faster to compute but less accurate).

> **Resources:**
  * See the [PyTorch documentation for a list of all available tensor datatypes](https://pytorch.org/docs/stable/tensors.html#data-types).
  * Read the [Wikipedia page for an overview of what precision in computing](https://en.wikipedia.org/wiki/Precision_(computer_science)) is.

Let's see how to create some tensors with specific datatypes. We can do so using the `dtype` parameter.

In [20]:
# Default datatype for tensors is float32
float_32_tensor = torch.tensor([3.0, 6.0, 9.0],
                               dtype=None, # defaults to None, which is torch.float32 or whatever datatype is passed
                               device=None, # defaults to None, which uses the default tensor type
                               requires_grad=False) # if True, operations performed on the tensor are recorded

float_32_tensor.shape, float_32_tensor.dtype, float_32_tensor.device

(torch.Size([3]), torch.float32, device(type='cpu'))

Potongan kode yang Anda berikan membuat sebuah tensor dengan nilai [3.0, 6.0, 9.0] menggunakan PyTorch. Secara default, jika tidak ada tipe data yang diatur secara eksplisit, tipe data yang digunakan adalah torch.float32.

Hasilnya adalah sebuah tensor dengan bentuk atau ukuran (3,), artinya terdiri dari tiga elemen, serta memiliki tipe data (dtype) torch.float32. Ini berarti bahwa setiap elemen dalam tensor tersebut dianggap sebagai bilangan pecahan (float) dengan presisi 32-bit.

Parameter device yang diatur ke None membuat tensor tersebut menggunakan tipe tensor default yang ada di sistem, biasanya CPU. Sedangkan, requires_grad yang diatur ke False menandakan bahwa tensor ini tidak akan merekam operasi yang dilakukan padanya untuk tujuan perhitungan gradien dalam proses training jaringan neural.

Aside from shape issues (tensor shapes don't match up), two of the other most common issues you'll come across in PyTorch are datatype and device issues.

For example, one of tensors is `torch.float32` and the other is `torch.float16` (PyTorch often likes tensors to be the same format).

Or one of your tensors is on the CPU and the other is on the GPU (PyTorch likes calculations between tensors to be on the same device).

We'll see more of this device talk later on.

For now let's create a tensor with `dtype=torch.float16`.

In [21]:
float_16_tensor = torch.tensor([3.0, 6.0, 9.0],
                               dtype=torch.float16) # torch.half would also work

float_16_tensor.dtype

torch.float16


Potongan kode tersebut membuat sebuah tensor dengan nilai [3.0, 6.0, 9.0] menggunakan PyTorch, tetapi kali ini, tipe data (dtype) yang ditetapkan secara eksplisit adalah torch.float16.

Hasilnya adalah tensor dengan tipe data torch.float16. Tipe data ini dikenal juga sebagai torch.half yang merepresentasikan bilangan pecahan dengan presisi 16-bit (half precision). Tipe data ini menyimpan nilai dengan presisi lebih rendah dibandingkan dengan torch.float32, namun membutuhkan ruang memori yang lebih sedikit.

## Getting information from tensors

Once you've created tensors (or someone else or a PyTorch module has created them for you), you might want to get some information from them.

We've seen these before but three of the most common attributes you'll want to find out about tensors are:
* `shape` - what shape is the tensor? (some operations require specific shape rules)
* `dtype` - what datatype are the elements within the tensor stored in?
* `device` - what device is the tensor stored on? (usually GPU or CPU)

Let's create a random tensor and find out details about it.

In [22]:
# Create a tensor
some_tensor = torch.rand(3, 4)

# Find out details about it
print(some_tensor)
print(f"Shape of tensor: {some_tensor.shape}")
print(f"Datatype of tensor: {some_tensor.dtype}")
print(f"Device tensor is stored on: {some_tensor.device}") # will default to CPU

tensor([[0.0115, 0.7588, 0.5847, 0.5255],
        [0.2871, 0.2703, 0.8691, 0.1873],
        [0.4984, 0.3682, 0.6310, 0.7498]])
Shape of tensor: torch.Size([3, 4])
Datatype of tensor: torch.float32
Device tensor is stored on: cpu


Kode tersebut membuat sebuah tensor dengan ukuran 3 baris dan 4 kolom yang diisi dengan nilai-nilai acak menggunakan PyTorch.

Hasil cetak dari some_tensor akan menampilkan nilai-nilai tensor yang berbeda setiap kali dijalankan, karena dibuat dengan nilai-nilai acak.

> **Note:** When you run into issues in PyTorch, it's very often one to do with one of the three attributes above. So when the error messages show up, sing yourself a little song called "what, what, where":
  * "*what shape are my tensors? what datatype are they and where are they stored? what shape, what datatype, where where where*"

## Manipulating tensors (tensor operations)

In deep learning, data (images, text, video, audio, protein structures, etc) gets represented as tensors.

A model learns by investigating those tensors and performing a series of operations (could be 1,000,000s+) on tensors to create a representation of the patterns in the input data.

These operations are often a wonderful dance between:
* Addition
* Substraction
* Multiplication (element-wise)
* Division
* Matrix multiplication

And that's it. Sure there are a few more here and there but these are the basic building blocks of neural networks.

Stacking these building blocks in the right way, you can create the most sophisticated of neural networks (just like lego!).

### Basic operations

Let's start with a few of the fundamental operations, addition (`+`), subtraction (`-`), mutliplication (`*`).

They work just as you think they would.

In [23]:
# Create a tensor of values and add a number to it
tensor = torch.tensor([1, 2, 3])
tensor + 10

tensor([11, 12, 13])

Kode tersebut membuat sebuah tensor dengan nilai [1, 2, 3] menggunakan PyTorch, kemudian menambahkan angka 10 ke setiap elemen di dalam tensor menggunakan operasi penambahan (+).

Hasil dari operasi ini akan menghasilkan tensor baru yang elemennya dihasilkan dari penambahan angka 10 ke setiap elemen di dalam tensor awal [1, 2, 3].

In [24]:
# Multiply it by 10
tensor * 10

tensor([10, 20, 30])

Pada kode yang diberikan sebelumnya, ketika operasi penambahan dilakukan terhadap tensor dengan menambahkan angka 10 ke setiap elemennya (tensor + 10), hasilnya tidak disimpan atau ditugaskan ke dalam variabel baru.

Dalam konteks tensor pada PyTorch, operasi seperti ini tidak mengubah nilai-nilai asli dalam tensor tensor. Yang terjadi hanyalah pembuatan tensor baru yang berisi hasil operasi tersebut, namun tidak ada perubahan yang diterapkan ke tensor asli.

Notice how the tensor values above didn't end up being `tensor([110, 120, 130])`, this is because the values inside the tensor don't change unless they're reassigned.

In [25]:
# Tensors don't change unless reassigned
tensor

tensor([1, 2, 3])

Pada PyTorch, ketika Anda melakukan operasi pada sebuah tensor seperti penambahan, pengurangan, atau operasi lain, nilai tensor tersebut tidak berubah secara langsung kecuali hasil operasi tersebut disimpan atau ditugaskan kembali ke tensor yang sama atau variabel baru.

Jadi, jika Anda melakukan operasi matematika seperti penambahan atau pengurangan pada tensor, nilai tensor asli tetap tidak berubah kecuali Anda menugaskan kembali hasil operasi tersebut ke tensor yang sama.

Let's subtract a number and this time we'll reassign the `tensor` variable.

In [26]:
# Subtract and reassign
tensor = tensor - 10
tensor

tensor([-9, -8, -7])

Potongan kode tersebut melakukan pengurangan angka 10 dari setiap elemen dalam tensor yang disebut tensor, dan kemudian menugaskan hasil pengurangan tersebut kembali ke tensor.

Jadi, jika nilai awal dari tensor adalah [1, 2, 3], operasi tensor = tensor - 10 akan mengurangkan 10 dari setiap elemen dan menugaskan hasilnya kembali ke tensor.

In [27]:
# Add and reassign
tensor = tensor + 10
tensor

tensor([1, 2, 3])

kode yang Anda berikan melakukan penambahan angka 10 ke setiap elemen dalam tensor yang disebut tensor, kemudian menugaskan hasil penambahan tersebut kembali ke variabel tensor.

Jika nilai tensor sebelumnya adalah [-9, -8, -7], operasi tensor = tensor + 10 akan menambahkan 10 ke setiap elemen dalam tensor tersebut dan menugaskan hasilnya kembali ke tensor.

PyTorch also has a bunch of built-in functions like [`torch.mul()`](https://pytorch.org/docs/stable/generated/torch.mul.html#torch.mul) (short for multiplication) and [`torch.add()`](https://pytorch.org/docs/stable/generated/torch.add.html) to perform basic operations.

In [28]:
# Can also use torch functions
torch.multiply(tensor, 10)

tensor([10, 20, 30])

torch.multiply(tensor, 10) mencoba untuk mengalikan setiap elemen dalam tensor yang disebut tensor dengan angka 10 menggunakan fungsi torch.multiply().

Namun, pada PyTorch, tidak ada fungsi torch.multiply() yang langsung dapat digunakan untuk melakukan perkalian elemen-wise pada tensor. Fungsi yang sesuai untuk melakukan perkalian elemen-wise dalam PyTorch adalah torch.mul(). Jadi, jika Anda ingin mengalikan setiap elemen dalam tensor dengan angka 10, Anda dapat melakukannya dengan menggunakan torch.mul()

In [29]:
# Original tensor is still unchanged
tensor

tensor([1, 2, 3])


Ketika Anda menggunakan fungsi atau operasi pada tensor di PyTorch, nilai tensor asli tidak berubah kecuali hasil operasi tersebut ditugaskan kembali ke tensor yang sama atau variabel lain.

Dalam kasus ini, setelah Anda menggunakan fungsi torch.multiply() (atau torch.mul()) untuk mengalikan setiap elemen dalam tensor dengan angka 10, jika hasilnya tidak ditugaskan kembali ke variabel yang sesuai, nilai dari tensor asli (tensor) tetap tidak berubah.

Jadi, ketika Anda mencetak tensor setelah menggunakan fungsi torch.multiply() (atau torch.mul()), Anda akan melihat nilai-nilai asli dari tensor yang masih sama seperti sebelumnya, karena hasil operasi tersebut tidak disimpan atau ditugaskan kembali ke variabel tensor.

However, it's more common to use the operator symbols like `*` instead of `torch.mul()`

In [30]:
# Element-wise multiplication (each element multiplies its equivalent, index 0->0, 1->1, 2->2)
print(tensor, "*", tensor)
print("Equals:", tensor * tensor)

tensor([1, 2, 3]) * tensor([1, 2, 3])
Equals: tensor([1, 4, 9])


kode yang Anda berikan melakukan perkalian setiap elemen dalam tensor dengan elemen pada posisi yang setara atau indeks yang sama dalam tensor yang sama.

Jika nilai tensor adalah [1, 2, 3], dan operasi tensor * tensor dilakukan, hasilnya akan mengalikan setiap elemen pada indeks yang sama. Ini dilakukan secara elemen-wise, di mana setiap elemen pada posisi yang sama di kedua tensor dikalikan bersama untuk menghasilkan tensor baru.

### Matrix multiplication (is all you need)

One of the most common operations in machine learning and deep learning algorithms (like neural networks) is [matrix multiplication](https://www.mathsisfun.com/algebra/matrix-multiplying.html).

PyTorch implements matrix multiplication functionality in the [`torch.matmul()`](https://pytorch.org/docs/stable/generated/torch.matmul.html) method.

The main two rules for matrix multiplication to remember are:

1. The **inner dimensions** must match:
  * `(3, 2) @ (3, 2)` won't work
  * `(2, 3) @ (3, 2)` will work
  * `(3, 2) @ (2, 3)` will work
2. The resulting matrix has the shape of the **outer dimensions**:
 * `(2, 3) @ (3, 2)` -> `(2, 2)`
 * `(3, 2) @ (2, 3)` -> `(3, 3)`

> **Note:** "`@`" in Python is the symbol for matrix multiplication.

> **Resource:** You can see all of the rules for matrix multiplication using `torch.matmul()` [in the PyTorch documentation](https://pytorch.org/docs/stable/generated/torch.matmul.html).

Let's create a tensor and perform element-wise multiplication and matrix multiplication on it.



In [31]:
import torch
tensor = torch.tensor([1, 2, 3])
tensor.shape

torch.Size([3])

Kode tersebut menggunakan pustaka PyTorch untuk membuat sebuah tensor dengan nilai [1, 2, 3]. Kemudian, dengan menggunakan properti .shape, kode tersebut menampilkan bentuk atau ukuran dari tensor yang telah dibuat.

The difference between element-wise multiplication and matrix multiplication is the addition of values.

For our `tensor` variable with values `[1, 2, 3]`:

| Operation | Calculation | Code |
| ----- | ----- | ----- |
| **Element-wise multiplication** | `[1*1, 2*2, 3*3]` = `[1, 4, 9]` | `tensor * tensor` |
| **Matrix multiplication** | `[1*1 + 2*2 + 3*3]` = `[14]` | `tensor.matmul(tensor)` |


In [32]:
# Element-wise matrix multiplication
tensor * tensor

tensor([1, 4, 9])

Operasi tensor * tensor pada tensor dalam PyTorch melibatkan perkalian elemen-wise (perkalian satu per satu) antara tensor yang sama dengan dirinya sendiri.

Jika kita memiliki tensor dengan nilai [1, 2, 3], dan kita melakukan operasi tensor * tensor, ini akan mengalikan setiap elemen pada indeks yang sama.

In [33]:
# Matrix multiplication
torch.matmul(tensor, tensor)

tensor(14)

Operasi torch.matmul(tensor, tensor) pada PyTorch melakukan perkalian matriks antara tensor yang diberikan dengan dirinya sendiri. Namun, dalam kasus ini, tensor yang diberikan merupakan sebuah tensor satu dimensi.

Dalam operasi perkalian matriks, kedua matriks harus memiliki dimensi yang sesuai, yaitu matriks pertama harus memiliki dimensi (m x n) dan matriks kedua harus memiliki dimensi (n x p) agar dapat melakukan operasi perkalian matriks.

In [34]:
# Can also use the "@" symbol for matrix multiplication, though not recommended
tensor @ tensor

tensor(14)

Dalam PyTorch, operator @ digunakan untuk melakukan operasi perkalian matriks atau tensor dalam kasus tensor dua dimensi. Namun, ketika operator @ digunakan pada tensor satu dimensi seperti yang kita miliki (tensor @ tensor), secara konseptual, ini lebih diarahkan pada operasi perkalian matriks.

You can do matrix multiplication by hand but it's not recommended.

The in-built `torch.matmul()` method is faster.

In [35]:
%%time
# Matrix multiplication by hand
# (avoid doing operations with for loops at all cost, they are computationally expensive)
value = 0
for i in range(len(tensor)):
  value += tensor[i] * tensor[i]
value

CPU times: user 627 µs, sys: 0 ns, total: 627 µs
Wall time: 673 µs


tensor(14)

Potongan kode yang Anda tunjukkan merupakan implementasi dari operasi perhitungan kuadrat dari setiap elemen dalam tensor tensor dan kemudian menjumlahkan hasilnya secara berurutan.

Pada setiap iterasi dari loop for, nilai dari value ditambahkan dengan hasil perkalian antara elemen tensor pada indeks i yang dipangkatkan dua, yaitu tensor[i] * tensor[i]. Ini menghasilkan operasi perhitungan kuadrat dari setiap elemen dalam tensor tensor.

Setelah iterasi selesai, nilai value akan berisi hasil penjumlahan dari operasi kuadrat semua elemen dalam tensor tensor.



In [36]:
%%time
torch.matmul(tensor, tensor)

CPU times: user 28 µs, sys: 4 µs, total: 32 µs
Wall time: 35.8 µs


tensor(14)

Kode yang diberikan menggunakan fungsi torch.matmul() untuk melakukan operasi perkalian matriks atau tensor antara tensor tensor dengan dirinya sendiri.

Pada blok kode dengan %%time, perintah %time digunakan untuk mengukur waktu eksekusi dari sel kode di atasnya.

## One of the most common errors in deep learning (shape errors)

Because much of deep learning is multiplying and performing operations on matrices and matrices have a strict rule about what shapes and sizes can be combined, one of the most common errors you'll run into in deep learning is shape mismatches.

In [38]:
# Shapes need to be in the right way
tensor_A = torch.tensor([[1, 2],
                         [3, 4],
                         [5, 6]], dtype=torch.float32)

tensor_B = torch.tensor([[7, 10],
                         [8, 11],
                         [9, 12]], dtype=torch.float32)

torch.matmul(tensor_A, tensor_B) # (this will error)

RuntimeError: mat1 and mat2 shapes cannot be multiplied (3x2 and 3x2)

Kode tersebut mencoba melakukan operasi perkalian matriks antara dua tensor, tensor_A dan tensor_B, menggunakan torch.matmul(). Namun, operasi ini akan menghasilkan kesalahan karena ketidakcocokan bentuk atau ukuran (shape) antara kedua tensor.

We can make matrix multiplication work between `tensor_A` and `tensor_B` by making their inner dimensions match.

One of the ways to do this is with a **transpose** (switch the dimensions of a given tensor).

You can perform transposes in PyTorch using either:
* `torch.transpose(input, dim0, dim1)` - where `input` is the desired tensor to transpose and `dim0` and `dim1` are the dimensions to be swapped.
* `tensor.T` - where `tensor` is the desired tensor to transpose.

Let's try the latter.

In [39]:
# View tensor_A and tensor_B
print(tensor_A)
print(tensor_B)

tensor([[1., 2.],
        [3., 4.],
        [5., 6.]])
tensor([[ 7., 10.],
        [ 8., 11.],
        [ 9., 12.]])


Dua tensor yang telah Anda definisikan, tensor_A dan tensor_B, memiliki bentuk (shape) yang berbeda.

tensor_A memiliki bentuk (3, 2), yang berarti memiliki 3 baris dan 2 kolom.

In [40]:
# View tensor_A and tensor_B.T
print(tensor_A)
print(tensor_B.T)

tensor([[1., 2.],
        [3., 4.],
        [5., 6.]])
tensor([[ 7.,  8.,  9.],
        [10., 11., 12.]])


Ketika kita mencetak tensor_A dan tensor_B.T, kita melihat isi dari kedua tensor.

tensor_A memiliki bentuk (shape) (3, 2) dan isinya

In [41]:
# The operation works when tensor_B is transposed
print(f"Original shapes: tensor_A = {tensor_A.shape}, tensor_B = {tensor_B.shape}\n")
print(f"New shapes: tensor_A = {tensor_A.shape} (same as above), tensor_B.T = {tensor_B.T.shape}\n")
print(f"Multiplying: {tensor_A.shape} * {tensor_B.T.shape} <- inner dimensions match\n")
print("Output:\n")
output = torch.matmul(tensor_A, tensor_B.T)
print(output)
print(f"\nOutput shape: {output.shape}")

Original shapes: tensor_A = torch.Size([3, 2]), tensor_B = torch.Size([3, 2])

New shapes: tensor_A = torch.Size([3, 2]) (same as above), tensor_B.T = torch.Size([2, 3])

Multiplying: torch.Size([3, 2]) * torch.Size([2, 3]) <- inner dimensions match

Output:

tensor([[ 27.,  30.,  33.],
        [ 61.,  68.,  75.],
        [ 95., 106., 117.]])

Output shape: torch.Size([3, 3])


kita melakukan operasi perkalian matriks antara tensor_A dan tensor_B.T yang merupakan hasil dari transpose dari tensor_B.

Bentuk (shape) dari tensor_A adalah (3, 2), yang artinya memiliki 3 baris dan 2 kolom.
Bentuk dari tensor_B.T adalah (2, 3), yang berarti memiliki 2 baris dan 3 kolom setelah dilakukan operasi transpose.
Operasi perkalian matriks membutuhkan kesesuaian jumlah kolom dari matriks pertama dengan jumlah baris dari matriks kedua. Dalam hal ini, bentuk tensor_A adalah (3, 2), dan bentuk tensor_B.T setelah operasi transpose menjadi (2, 3). Jumlah kolom dari tensor_A (2) sama dengan jumlah baris dari tensor_B.T (2), sehingga memungkinkan untuk melakukan operasi perkalian matriks yang valid.

You can also use [`torch.mm()`](https://pytorch.org/docs/stable/generated/torch.mm.html) which is a short for `torch.matmul()`.

In [42]:
# torch.mm is a shortcut for matmul
torch.mm(tensor_A, tensor_B.T)

tensor([[ 27.,  30.,  33.],
        [ 61.,  68.,  75.],
        [ 95., 106., 117.]])

Fungsi torch.mm() adalah singkatan dari torch.matmul() yang dioptimalkan khusus untuk melakukan operasi perkalian matriks pada tensor dua dimensi.

Dalam konteks kasus ini, torch.mm(tensor_A, tensor_B.T) dilakukan untuk melakukan perkalian matriks antara tensor_A dan hasil dari transpose dari tensor_B. Operasi ini dilakukan untuk mencapai hasil yang sama dengan operasi torch.matmul(tensor_A, tensor_B.T) sebelumnya.

Ketika kita menggunakan torch.mm() untuk melakukan operasi perkalian matriks antara tensor_A dan tensor_B.T, secara esensial, kita melakukan perkalian matriks dengan memanfaatkan fungsi yang dioptimalkan khusus untuk tensor dua dimensi.

Without the transpose, the rules of matrix mulitplication aren't fulfilled and we get an error like above.

How about a visual?

![visual demo of matrix multiplication](https://github.com/mrdbourke/pytorch-deep-learning/raw/main/images/00-matrix-multiply-crop.gif)

You can create your own matrix multiplication visuals like this at http://matrixmultiplication.xyz/.

> **Note:** A matrix multiplication like this is also referred to as the [**dot product**](https://www.mathsisfun.com/algebra/vectors-dot-product.html) of two matrices.



Neural networks are full of matrix multiplications and dot products.

The [`torch.nn.Linear()`](https://pytorch.org/docs/1.9.1/generated/torch.nn.Linear.html) module (we'll see this in action later on), also known as a feed-forward layer or fully connected layer, implements a matrix multiplication between an input `x` and a weights matrix `A`.

$$
y = x\cdot{A^T} + b
$$

Where:
* `x` is the input to the layer (deep learning is a stack of layers like `torch.nn.Linear()` and others on top of each other).
* `A` is the weights matrix created by the layer, this starts out as random numbers that get adjusted as a neural network learns to better represent patterns in the data (notice the "`T`", that's because the weights matrix gets transposed).
  * **Note:** You might also often see `W` or another letter like `X` used to showcase the weights matrix.
* `b` is the bias term used to slightly offset the weights and inputs.
* `y` is the output (a manipulation of the input in the hopes to discover patterns in it).

This is a linear function (you may have seen something like $y = mx+b$ in high school or elsewhere), and can be used to draw a straight line!

Let's play around with a linear layer.

Try changing the values of `in_features` and `out_features` below and see what happens.

Do you notice anything to do with the shapes?

In [43]:
# Since the linear layer starts with a random weights matrix, let's make it reproducible (more on this later)
torch.manual_seed(42)
# This uses matrix multiplication
linear = torch.nn.Linear(in_features=2, # in_features = matches inner dimension of input
                         out_features=6) # out_features = describes outer value
x = tensor_A
output = linear(x)
print(f"Input shape: {x.shape}\n")
print(f"Output:\n{output}\n\nOutput shape: {output.shape}")

Input shape: torch.Size([3, 2])

Output:
tensor([[2.2368, 1.2292, 0.4714, 0.3864, 0.1309, 0.9838],
        [4.4919, 2.1970, 0.4469, 0.5285, 0.3401, 2.4777],
        [6.7469, 3.1648, 0.4224, 0.6705, 0.5493, 3.9716]],
       grad_fn=<AddmmBackward0>)

Output shape: torch.Size([3, 6])


Kode di atas menggunakan PyTorch untuk membuat sebuah lapisan linear (linear layer) menggunakan fungsi torch.nn.Linear. Lapisan linear ini sering digunakan dalam jaringan neural untuk melakukan transformasi linier pada input.

Dalam contoh ini:

in_features=2 menentukan jumlah fitur (features) pada input. Ini menyesuaikan dengan dimensi dalam tensor input tensor_A, yang memiliki 2 fitur.
out_features=6 menentukan jumlah fitur pada output. Ketika operasi linear dilakukan, ini akan menghasilkan tensor dengan 6 fitur sebagai output.
Selanjutnya, kita menggunakan tensor tensor_A sebagai input untuk lapisan linear yang telah dibuat. Operasi ini melakukan perkalian matriks antara tensor_A dan bobot (weights) yang secara otomatis diinisialisasi secara acak oleh PyTorch saat kita membuat lapisan linear. Penggunaan fungsi torch.manual_seed(42) di awal bertujuan untuk mengatur seed (benih) secara manual agar inisialisasi bobot yang acak ini dapat direproduksi konsisten.

Setelah melakukan operasi lapisan linear, kita mencetak output yang dihasilkan dan bentuknya (output.shape).

> **Question:** What happens if you change `in_features` from 2 to 3 above? Does it error? How could you change the shape of the input (`x`) to accomodate to the error? Hint: what did we have to do to `tensor_B` above?

If you've never done it before, matrix multiplication can be a confusing topic at first.

But after you've played around with it a few times and even cracked open a few neural networks, you'll notice it's everywhere.

Remember, matrix multiplication is all you need.

![matrix multiplication is all you need](https://raw.githubusercontent.com/mrdbourke/pytorch-deep-learning/main/images/00_matrix_multiplication_is_all_you_need.jpeg)

*When you start digging into neural network layers and building your own, you'll find matrix multiplications everywhere. **Source:** https://marksaroufim.substack.com/p/working-class-deep-learner*

### Finding the min, max, mean, sum, etc (aggregation)

Now we've seen a few ways to manipulate tensors, let's run through a few ways to aggregate them (go from more values to less values).

First we'll create a tensor and then find the max, min, mean and sum of it.





In [44]:
# Create a tensor
x = torch.arange(0, 100, 10)
x

tensor([ 0, 10, 20, 30, 40, 50, 60, 70, 80, 90])

Kode tersebut membuat sebuah tensor menggunakan fungsi torch.arange().

Pada kode x = torch.arange(0, 100, 10), fungsi torch.arange() digunakan untuk membuat tensor yang berisi deret bilangan dari 0 hingga kurang dari 100 dengan interval (langkah) antara nilai-nilai tersebut sebesar 10. Dalam hal ini, argumen pertama adalah nilai awal (start) dari deret (0), argumen kedua adalah nilai akhir (stop) sebelum mencapai 100, dan argumen ketiga adalah nilai langkah (step) atau interval antar nilai (10).

Hasilnya adalah tensor yang berisi deret bilangan mulai dari 0, kemudian ditambahkan dengan interval 10 untuk setiap elemen, hingga mencapai nilai sebelum 100. Jadi, tensor x akan berisi nilai-nilai berikut: [0, 10, 20, 30, 40, 50, 60, 70, 80, 90].

Now let's perform some aggregation.

In [45]:
print(f"Minimum: {x.min()}")
print(f"Maximum: {x.max()}")
# print(f"Mean: {x.mean()}") # this will error
print(f"Mean: {x.type(torch.float32).mean()}") # won't work without float datatype
print(f"Sum: {x.sum()}")

Minimum: 0
Maximum: 90
Mean: 45.0
Sum: 450


Tentu! Kode tersebut melakukan operasi statistik sederhana pada tensor x, yang berisi deret bilangan.

x.min() digunakan untuk mendapatkan nilai minimum dari tensor x, yaitu nilai terkecil dalam tensor tersebut. Outputnya adalah nilai minimum dari tensor x.
x.max() mengembalikan nilai maksimum dalam tensor x, yaitu nilai terbesar dalam tensor tersebut.
x.mean() pada awalnya mencoba untuk menghitung rata-rata dari semua elemen dalam tensor x. Namun, karena tensor x memiliki tipe data integer (bilangan bulat), operasi ini akan menghasilkan kesalahan karena PyTorch memerlukan tipe data float untuk menghitung rata-rata. Untuk mengatasinya, dilakukan konversi tipe data tensor x menjadi float menggunakan .type(torch.float32) sebelum melakukan operasi mean().
x.sum() akan menjumlahkan semua elemen dalam tensor x dan menghasilkan nilai total dari semua elemen dalam tensor tersebut.
Sebagai tambahan, saat menggunakan operasi mean()

> **Note:** You may find some methods such as `torch.mean()` require tensors to be in `torch.float32` (the most common) or another specific datatype, otherwise the operation will fail.

You can also do the same as above with `torch` methods.

In [46]:
torch.max(x), torch.min(x), torch.mean(x.type(torch.float32)), torch.sum(x)

(tensor(90), tensor(0), tensor(45.), tensor(450))

Baris kode tersebut melakukan beberapa operasi statistik pada tensor x menggunakan fungsi-fungsi PyTorch:

torch.max(x) digunakan untuk menemukan nilai maksimum dalam tensor x. Outputnya adalah nilai terbesar yang terdapat dalam tensor tersebut.
torch.min(x) mengembalikan nilai minimum dari tensor x, yaitu nilai terkecil yang terdapat dalam tensor.
torch.mean(x.type(torch.float32)) terlebih dahulu mengubah tipe data tensor x menjadi tipe data float menggunakan .type(torch.float32) untuk kemudian menghitung rata-rata dari semua elemen dalam tensor. Outputnya adalah nilai rata-rata dari semua elemen dalam tensor.
torch.sum(x) akan menjumlahkan semua elemen dalam tensor x dan menghasilkan nilai total dari semua elemen dalam tensor tersebut. Outputnya adalah hasil penjumlahan dari semua elemen dalam tensor.

### Positional min/max

You can also find the index of a tensor where the max or minimum occurs with [`torch.argmax()`](https://pytorch.org/docs/stable/generated/torch.argmax.html) and [`torch.argmin()`](https://pytorch.org/docs/stable/generated/torch.argmin.html) respectively.

This is helpful incase you just want the position where the highest (or lowest) value is and not the actual value itself (we'll see this in a later section when using the [softmax activation function](https://pytorch.org/docs/stable/generated/torch.nn.Softmax.html)).

In [47]:
# Create a tensor
tensor = torch.arange(10, 100, 10)
print(f"Tensor: {tensor}")

# Returns index of max and min values
print(f"Index where max value occurs: {tensor.argmax()}")
print(f"Index where min value occurs: {tensor.argmin()}")

Tensor: tensor([10, 20, 30, 40, 50, 60, 70, 80, 90])
Index where max value occurs: 8
Index where min value occurs: 0


Kode di atas membuat sebuah tensor menggunakan torch.arange() yang berisi deret bilangan dari 10 hingga kurang dari 100 dengan interval 10, sehingga nilai-nilai dalam tensor adalah [10, 20, 30, 40, 50, 60, 70, 80, 90].

tensor.argmax() mengembalikan indeks dari nilai maksimum dalam tensor tensor, yaitu indeks di mana nilai maksimum dalam tensor tersebut ditemukan. Outputnya adalah indeks dari elemen dengan nilai maksimum di dalam tensor.

tensor.argmin() mengembalikan indeks dari nilai minimum dalam tensor tensor, yaitu indeks di mana nilai minimum dalam tensor tersebut ditemukan. Outputnya adalah indeks dari elemen dengan nilai minimum di dalam tensor.

Dengan menggunakan kedua fungsi ini, kita bisa mendapatkan informasi tentang di mana posisi (indeks) dari nilai maksimum dan nilai minimum dalam tensor tersebut.

### Change tensor datatype

As mentioned, a common issue with deep learning operations is having your tensors in different datatypes.

If one tensor is in `torch.float64` and another is in `torch.float32`, you might run into some errors.

But there's a fix.

You can change the datatypes of tensors using [`torch.Tensor.type(dtype=None)`](https://pytorch.org/docs/stable/generated/torch.Tensor.type.html) where the `dtype` parameter is the datatype you'd like to use.

First we'll create a tensor and check it's datatype (the default is `torch.float32`).

In [48]:
# Create a tensor and check its datatype
tensor = torch.arange(10., 100., 10.)
tensor.dtype

torch.float32

Pada potongan kode tersebut, terlebih dahulu sebuah tensor dibuat menggunakan torch.arange() yang berisi deret bilangan dari 10 hingga kurang dari 100 dengan interval 10, namun kali ini dengan tipe data float. Hasilnya adalah tensor dengan nilai-nilai berikut: [10., 20., 30., 40., 50., 60., 70., 80., 90.].

tensor.dtype digunakan untuk memeriksa tipe data (datatype) dari tensor yang telah dibuat. Pada kasus ini, hasilnya adalah tipe data dari tensor tersebut, yang dalam hal ini adalah torch.float32 atau lebih tepatnya tipe data float.
Jadi, tensor.dtype mengembalikan informasi tentang tipe data yang digunakan dalam tensor, yang pada kasus ini adalah tipe data float (torch.float32). Tipe data float digunakan untuk merepresentasikan bilangan riil (angka desimal) dalam tensor.

Now we'll create another tensor the same as before but change its datatype to `torch.float16`.



In [49]:
# Create a float16 tensor
tensor_float16 = tensor.type(torch.float16)
tensor_float16

tensor([10., 20., 30., 40., 50., 60., 70., 80., 90.], dtype=torch.float16)

Dalam potongan kode tersebut, kita mengubah tipe data tensor yang sebelumnya berupa torch.float32 menjadi torch.float16 menggunakan metode .type(torch.float16).

Penggunaan .type(torch.float16) mengubah tipe data dari tensor tensor menjadi torch.float16, yang merupakan tipe data floating point dengan presisi setengah (half-precision floating point). Dalam konteks ini, tensor_float16 akan berisi nilai-nilai yang sama seperti tensor sebelumnya (tensor), namun dengan tipe data yang lebih hemat ruang penyimpanan, meskipun dengan presisi yang lebih rendah dibandingkan dengan torch.float32.

Jadi, tensor_float16 akan memiliki nilai-nilai yang sama dengan tensor, tetapi disimpan dalam format dengan presisi setengah (torch.float16).

And we can do something similar to make a `torch.int8` tensor.

In [50]:
# Create a int8 tensor
tensor_int8 = tensor.type(torch.int8)
tensor_int8

tensor([10, 20, 30, 40, 50, 60, 70, 80, 90], dtype=torch.int8)

Pada potongan kode di atas, kita mencoba mengubah tipe data tensor tensor yang sebelumnya memiliki tipe data torch.float32 menjadi torch.int8 menggunakan metode .type(torch.int8).

Namun, dalam kasus ini, konversi ini tidak akan berhasil secara langsung. Tensor tensor awalnya memiliki tipe data float (torch.float32) yang merepresentasikan bilangan desimal. Mengubahnya langsung ke tipe data torch.int8 yang merepresentasikan bilangan bulat 8-bit tidak mungkin dilakukan tanpa kehilangan informasi, karena informasi desimal akan hilang saat dikonversi menjadi bilangan bulat 8-bit.

Ketika kita mencoba melakukan konversi tersebut, PyTorch akan menghasilkan kesalahan. Operasi ini tidak dapat dilakukan secara langsung karena informasi dari tipe data float tidak dapat secara langsung direpresentasikan dalam tipe data bilangan bulat 8-bit tanpa kehilangan informasi.

> **Note:** Different datatypes can be confusing to begin with. But think of it like this, the lower the number (e.g. 32, 16, 8), the less precise a computer stores the value. And with a lower amount of storage, this generally results in faster computation and a smaller overall model. Mobile-based neural networks often operate with 8-bit integers, smaller and faster to run but less accurate than their float32 counterparts. For more on this, I'd read up about [precision in computing](https://en.wikipedia.org/wiki/Precision_(computer_science)).

> **Exercise:** So far we've covered a fair few tensor methods but there's a bunch more in the [`torch.Tensor` documentation](https://pytorch.org/docs/stable/tensors.html), I'd recommend spending 10-minutes scrolling through and looking into any that catch your eye. Click on them and then write them out in code yourself to see what happens.

### Reshaping, stacking, squeezing and unsqueezing

Often times you'll want to reshape or change the dimensions of your tensors without actually changing the values inside them.

To do so, some popular methods are:

| Method | One-line description |
| ----- | ----- |
| [`torch.reshape(input, shape)`](https://pytorch.org/docs/stable/generated/torch.reshape.html#torch.reshape) | Reshapes `input` to `shape` (if compatible), can also use `torch.Tensor.reshape()`. |
| [`Tensor.view(shape)`](https://pytorch.org/docs/stable/generated/torch.Tensor.view.html) | Returns a view of the original tensor in a different `shape` but shares the same data as the original tensor. |
| [`torch.stack(tensors, dim=0)`](https://pytorch.org/docs/1.9.1/generated/torch.stack.html) | Concatenates a sequence of `tensors` along a new dimension (`dim`), all `tensors` must be same size. |
| [`torch.squeeze(input)`](https://pytorch.org/docs/stable/generated/torch.squeeze.html) | Squeezes `input` to remove all the dimenions with value `1`. |
| [`torch.unsqueeze(input, dim)`](https://pytorch.org/docs/1.9.1/generated/torch.unsqueeze.html) | Returns `input` with a dimension value of `1` added at `dim`. |
| [`torch.permute(input, dims)`](https://pytorch.org/docs/stable/generated/torch.permute.html) | Returns a *view* of the original `input` with its dimensions permuted (rearranged) to `dims`. |

Why do any of these?

Because deep learning models (neural networks) are all about manipulating tensors in some way. And because of the rules of matrix multiplication, if you've got shape mismatches, you'll run into errors. These methods help you make sure the right elements of your tensors are mixing with the right elements of other tensors.

Let's try them out.

First, we'll create a tensor.

In [51]:
# Create a tensor
import torch
x = torch.arange(1., 8.)
x, x.shape

(tensor([1., 2., 3., 4., 5., 6., 7.]), torch.Size([7]))

Potongan kode tersebut menggunakan PyTorch untuk membuat sebuah tensor x dengan menggunakan fungsi torch.arange().

torch.arange(1., 8.) digunakan untuk membuat tensor yang berisi deret bilangan dari 1 hingga kurang dari 8 dengan interval 1.0 (step 1.0). Dalam hal ini, argumen pertama adalah nilai awal (start) dari deret (1.0) dan argumen kedua adalah nilai sebelum mencapai 8 (8.0).
Hasilnya adalah tensor x yang berisi nilai-nilai berikut: [1., 2., 3., 4., 5., 6., 7.], yang merupakan deret bilangan dari 1 hingga kurang dari 8 dengan interval 1.0.

x.shape digunakan untuk mengetahui bentuk atau ukuran dari tensor x, yang pada kasus ini adalah (7,), yang berarti tensor x memiliki satu dimensi dengan panjang atau jumlah elemen sebanyak 7.
Jadi, potongan kode tersebut membuat tensor x yang berisi deret bilangan dari 1 hingga kurang dari 8 dengan interval 1.0, dan bentuk dari tensor tersebut adalah satu dimensi dengan panjang 7 elemen.

Now let's add an extra dimension with `torch.reshape()`.

In [52]:
# Add an extra dimension
x_reshaped = x.reshape(1, 7)
x_reshaped, x_reshaped.shape

(tensor([[1., 2., 3., 4., 5., 6., 7.]]), torch.Size([1, 7]))

Potongan kode tersebut mengubah bentuk (shape) dari tensor x menjadi bentuk baru yang memiliki dimensi tambahan menggunakan metode .reshape(1, 7).

x.reshape(1, 7) digunakan untuk mengubah bentuk tensor x menjadi bentuk yang baru. Dalam hal ini, argumen (1, 7) menunjukkan bahwa kita ingin mengubah tensor menjadi bentuk dengan 1 baris dan 7 kolom.
Hasilnya adalah tensor x_reshaped yang memiliki bentuk baru (shape) yang berbeda dari x, yaitu (1, 7). Ini berarti tensor x_reshaped memiliki satu baris dan tujuh kolom.

x_reshaped.shape digunakan untuk mengetahui bentuk atau ukuran dari tensor x_reshaped, yang pada kasus ini adalah (1, 7), menunjukkan bahwa tensor x_reshaped memiliki satu baris dan tujuh kolom.
Jadi, dengan menggunakan .reshape(1, 7), kita berhasil mengubah bentuk dari tensor x menjadi tensor x_reshaped yang memiliki satu dimensi tambahan dengan satu baris dan tujuh kolom.

We can also change the view with `torch.view()`.

In [53]:
# Change view (keeps same data as original but changes view)
# See more: https://stackoverflow.com/a/54507446/7900723
z = x.view(1, 7)
z, z.shape

(tensor([[1., 2., 3., 4., 5., 6., 7.]]), torch.Size([1, 7]))

Potongan kode z = x.view(1, 7) mengubah tampilan (view) dari tensor x, namun tetap menggunakan data yang sama dengan tensor aslinya tanpa membuat salinan baru dari data tersebut. Perubahan ini adalah pemformatan ulang tampilan tensor yang ada.

x.view(1, 7) meminta tensor x untuk dilihat (view) dalam bentuk yang baru, yaitu dengan bentuk (1, 7). Ini berarti kita ingin melihat ulang tensor x sebagai tensor dengan satu baris dan tujuh kolom.
Hasilnya adalah tensor z yang memiliki tampilan baru (view) dengan bentuk (1, 7), tetapi data yang terkandung di dalamnya masih sama dengan data dari tensor x.

z.shape digunakan untuk mengetahui bentuk atau ukuran dari tensor z, yang pada kasus ini adalah (1, 7), menunjukkan bahwa tensor z memiliki satu baris dan tujuh kolom.

Remember though, changing the view of a tensor with `torch.view()` really only creates a new view of the *same* tensor.

So changing the view changes the original tensor too.

In [54]:
# Changing z changes x
z[:, 0] = 5
z, x

(tensor([[5., 2., 3., 4., 5., 6., 7.]]), tensor([5., 2., 3., 4., 5., 6., 7.]))

Potongan kode z[:, 0] = 5 mengubah nilai dari kolom pertama dari tensor z menjadi 5. Namun, penting untuk dicatat bahwa dalam kasus ini, z adalah tampilan (view) dari tensor x. Ketika Anda mengubah nilai dalam z, perubahan juga akan tercermin dalam tensor aslinya, yaitu x.

z[:, 0] = 5 mengatur nilai 5 pada seluruh baris (indeks :) di kolom pertama (indeks 0) dari tensor z.
Hasilnya adalah perubahan nilai dalam tensor z, namun karena z adalah tampilan dari tensor x, perubahan yang sama juga terjadi pada tensor aslinya, yaitu x.

If we wanted to stack our new tensor on top of itself five times, we could do so with `torch.stack()`.

In [55]:
# Stack tensors on top of each other
x_stacked = torch.stack([x, x, x, x], dim=0) # try changing dim to dim=1 and see what happens
x_stacked

tensor([[5., 2., 3., 4., 5., 6., 7.],
        [5., 2., 3., 4., 5., 6., 7.],
        [5., 2., 3., 4., 5., 6., 7.],
        [5., 2., 3., 4., 5., 6., 7.]])

Potongan kode x_stacked = torch.stack([x, x, x, x], dim=0) digunakan untuk menggabungkan (stack) tensor-tensor yang sama menjadi satu tensor yang lebih besar dengan menempatkannya secara berurutan di sepanjang dimensi yang ditentukan.

torch.stack([x, x, x, x], dim=0) menggabungkan tensor-tensor yang sama, dalam hal ini x, sebanyak empat kali, berdasarkan dimensi 0. Ini berarti tensor-tensor tersebut akan ditumpuk satu per satu secara berurutan pada dimensi yang baru dibuat (dimensi 0).
Hasilnya adalah tensor x_stacked yang memiliki bentuk (4, 7). Angka 4 menunjukkan bahwa ada empat tensor x yang ditumpuk secara berurutan, sementara angka 7 adalah panjang dari masing-masing tensor x yang awalnya memiliki panjang 7 (dari 1 hingga 7).

Ketika dim=0, tensor-tensor ini ditumpuk di sepanjang dimensi pertama baru, sehingga menciptakan tensor baru dengan dimensi tambahan yang menunjukkan jumlah tensor yang ditumpuk.

How about removing all single dimensions from a tensor?

To do so you can use `torch.squeeze()` (I remember this as *squeezing* the tensor to only have dimensions over 1).

In [56]:
print(f"Previous tensor: {x_reshaped}")
print(f"Previous shape: {x_reshaped.shape}")

# Remove extra dimension from x_reshaped
x_squeezed = x_reshaped.squeeze()
print(f"\nNew tensor: {x_squeezed}")
print(f"New shape: {x_squeezed.shape}")

Previous tensor: tensor([[5., 2., 3., 4., 5., 6., 7.]])
Previous shape: torch.Size([1, 7])

New tensor: tensor([5., 2., 3., 4., 5., 6., 7.])
New shape: torch.Size([7])


Dalam potongan kode tersebut, kita melakukan operasi untuk mengubah dimensi tambahan pada tensor x_reshaped menggunakan fungsi .squeeze().

x_reshaped adalah tensor dengan bentuk (shape) (1, 7) yang memiliki dimensi tambahan (dimensi pertama adalah 1).
x_reshaped.squeeze() adalah operasi yang menghapus dimensi yang memiliki panjang 1 dari tensor. Dalam hal ini, karena dimensi pertama adalah 1, fungsi .squeeze() menghapus dimensi tersebut.
Hasilnya adalah x_squeezed, sebuah tensor baru dengan bentuk yang berbeda:

Sebelumnya, x_reshaped memiliki bentuk (1, 7) yang menunjukkan ada satu baris dengan tujuh kolom.
Setelah operasi .squeeze(), x_squeezed memiliki bentuk (7,) yang menunjukkan hanya ada satu dimensi dengan panjang tujuh.

And to do the reverse of `torch.squeeze()` you can use `torch.unsqueeze()` to add a dimension value of 1 at a specific index.

In [57]:
print(f"Previous tensor: {x_squeezed}")
print(f"Previous shape: {x_squeezed.shape}")

## Add an extra dimension with unsqueeze
x_unsqueezed = x_squeezed.unsqueeze(dim=0)
print(f"\nNew tensor: {x_unsqueezed}")
print(f"New shape: {x_unsqueezed.shape}")

Previous tensor: tensor([5., 2., 3., 4., 5., 6., 7.])
Previous shape: torch.Size([7])

New tensor: tensor([[5., 2., 3., 4., 5., 6., 7.]])
New shape: torch.Size([1, 7])


kita menggunakan fungsi .unsqueeze(dim=0) untuk menambah dimensi tambahan pada tensor x_squeezed.

Sebelumnya, x_squeezed adalah tensor dengan bentuk (7,) yang menunjukkan satu dimensi dengan panjang tujuh.
x_squeezed.unsqueeze(dim=0) digunakan untuk menambah dimensi baru pada tensor x_squeezed di sepanjang dimensi 0. Ini akan menciptakan sebuah dimensi baru dengan panjang 1.
Hasilnya adalah x_unsqueezed, sebuah tensor baru dengan bentuk yang berbeda:

Sebelumnya, x_squeezed memiliki bentuk (7,) yang menunjukkan satu dimensi dengan panjang tujuh.
Setelah operasi .unsqueeze(dim=0), x_unsqueezed memiliki bentuk (1, 7) yang menunjukkan ada satu baris dengan tujuh kolom.

You can also rearrange the order of axes values with `torch.permute(input, dims)`, where the `input` gets turned into a *view* with new `dims`.

In [58]:
# Create tensor with specific shape
x_original = torch.rand(size=(224, 224, 3))

# Permute the original tensor to rearrange the axis order
x_permuted = x_original.permute(2, 0, 1) # shifts axis 0->1, 1->2, 2->0

print(f"Previous shape: {x_original.shape}")
print(f"New shape: {x_permuted.shape}")

Previous shape: torch.Size([224, 224, 3])
New shape: torch.Size([3, 224, 224])


Potongan kode di atas membuat sebuah tensor x_original dengan bentuk (shape) (224, 224, 3) menggunakan fungsi torch.rand(size=(224, 224, 3)).

x_original.permute(2, 0, 1) digunakan untuk memodifikasi urutan sumbu (axis) dari tensor x_original. Fungsi .permute() menggeser urutan sumbu berdasarkan indeks yang diberikan. Dalam kasus ini, urutan sumbu diubah menjadi (2, 0, 1), yang berarti sumbu ke-0 menjadi sumbu ke-1, sumbu ke-1 menjadi sumbu ke-2, dan sumbu ke-2 menjadi sumbu ke-0.
Hasilnya adalah tensor x_permuted yang memiliki bentuk baru:

Sebelumnya, x_original memiliki bentuk (224, 224, 3) yang menunjukkan 224 baris, 224 kolom, dan 3 saluran warna (RGB).
Setelah operasi .permute(2, 0, 1), x_permuted memiliki bentuk (3, 224, 224) yang menunjukkan 3 saluran warna (RGB) dengan masing-masing 224 baris dan 224 kolom.

> **Note**: Because permuting returns a *view* (shares the same data as the original), the values in the permuted tensor will be the same as the original tensor and if you change the values in the view, it will change the values of the original.

## Indexing (selecting data from tensors)

Sometimes you'll want to select specific data from tensors (for example, only the first column or second row).

To do so, you can use indexing.

If you've ever done indexing on Python lists or NumPy arrays, indexing in PyTorch with tensors is very similar.

In [59]:
# Create a tensor
import torch
x = torch.arange(1, 10).reshape(1, 3, 3)
x, x.shape

(tensor([[[1, 2, 3],
          [4, 5, 6],
          [7, 8, 9]]]),
 torch.Size([1, 3, 3]))

Potongan kode di atas membuat sebuah tensor x menggunakan fungsi torch.arange() yang diikuti oleh .reshape(1, 3, 3).

torch.arange(1, 10) digunakan untuk membuat deret bilangan dari 1 hingga kurang dari 10. Hasilnya adalah tensor yang berisi nilai-nilai dari 1 hingga 9.
.reshape(1, 3, 3) digunakan untuk mengubah bentuk tensor x menjadi bentuk yang baru. Dalam hal ini, (1, 3, 3) menunjukkan bahwa kita ingin mengubah tensor menjadi tensor tiga dimensi dengan satu saluran, masing-masing memiliki tiga baris dan tiga kolom.
Hasilnya adalah tensor x dengan bentuk baru:

Bentuk (1, 3, 3) menunjukkan bahwa tensor x memiliki satu saluran dengan tiga baris dan tiga kolom.

Indexing values goes outer dimension -> inner dimension (check out the square brackets).

In [60]:
# Let's index bracket by bracket
print(f"First square bracket:\n{x[0]}")
print(f"Second square bracket: {x[0][0]}")
print(f"Third square bracket: {x[0][0][0]}")

First square bracket:
tensor([[1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]])
Second square bracket: tensor([1, 2, 3])
Third square bracket: 1


Pada potongan kode di atas, kita melakukan pengindeksan tensor x dengan menggunakan tanda kurung siku (square brackets) secara bertahap untuk mengekstrak nilai-nilai spesifik dari tensor tersebut.

x[0] merujuk pada pengindeksan pertama dari tensor x. Pada tensor x yang memiliki bentuk (1, 3, 3), pengindeksan pertama ini mengambil elemen pertama, yang juga merupakan satu-satunya saluran dalam tensor tersebut. Hasilnya adalah tensor yang memiliki bentuk (3, 3) karena merupakan saluran tunggal dari tensor tersebut.

x[0][0] adalah pengindeksan kedua dari tensor x. Setelah menggunakan x[0] yang menghasilkan tensor dengan bentuk (3, 3), pengindeksan kedua ini mengambil baris pertama dari tensor ini, yang juga merupakan baris pertama dari saluran tunggal. Hasilnya adalah tensor yang merupakan baris pertama dari saluran tersebut, yaitu [1, 2, 3].

x[0][0][0] adalah pengindeksan ketiga dari tensor x. Setelah menggunakan x[0][0] yang menghasilkan tensor baris pertama [1, 2, 3], pengindeksan ketiga ini mengambil elemen pertama dari baris tersebut. Hasilnya adalah nilai skalar tunggal, yaitu 1.

You can also use `:` to specify "all values in this dimension" and then use a comma (`,`) to add another dimension.

In [61]:
# Get all values of 0th dimension and the 0 index of 1st dimension
x[:, 0]

tensor([[1, 2, 3]])

Potongan kode x[:, 0] merupakan operasi pengindeksan atau slicing yang digunakan pada tensor x untuk mendapatkan semua nilai dari dimensi ke-0 dan indeks ke-0 dari dimensi ke-1.

: pada indeks pertama (:) menunjukkan bahwa kita ingin memilih semua elemen dari dimensi pertama (dimensi ke-0) dari tensor x.
0 pada indeks kedua (0) menunjukkan bahwa kita hanya tertarik pada elemen dengan indeks ke-0 dari dimensi kedua (dimensi ke-1) dari tensor x.

In [62]:
# Get all values of 0th & 1st dimensions but only index 1 of 2nd dimension
x[:, :, 1]

tensor([[2, 5, 8]])

Operasi x[:, :, 1] pada tensor x memungkinkan pengambilan semua nilai dari dimensi pertama dan kedua (dimensi ke-0 dan ke-1) namun hanya memilih nilai dari indeks ke-1 dalam dimensi ketiga (dimensi ke-2). Hasilnya adalah subset tensor yang merupakan saluran dengan indeks ke-1 dari setiap elemen di dalam dimensi pertama dan kedua dari tensor, sehingga jika x memiliki bentuk (1, 3, 3), hasilnya akan menjadi tensor dengan bentuk (1, 3), mengandung nilai-nilai dari saluran dengan indeks ke-1 di setiap elemen di dalam dimensi pertama dan kedua dari tensor.

In [63]:
# Get all values of the 0 dimension but only the 1 index value of the 1st and 2nd dimension
x[:, 1, 1]

tensor([5])

Operasi x[:, 1, 1] pada tensor x memungkinkan pengambilan semua nilai dari dimensi pertama (dimensi ke-0), namun hanya memilih nilai dari indeks ke-1 dalam dimensi kedua (dimensi ke-1) dan indeks ke-1 dalam dimensi ketiga (dimensi ke-2). Hasilnya adalah subset tensor yang merupakan nilai tunggal yang terletak pada indeks ke-1 dari dimensi kedua dan ketiga, namun mempertahankan dimensi pertama yang mengandung semua elemen dari tensor tersebut. Dalam konteks tensor x yang memiliki bentuk (1, 3, 3), hasilnya akan menjadi tensor satu dimensi dengan nilai dari indeks ke-1 di dimensi ke-1 dan ke-2, yaitu nilai tunggal dari elemen dengan indeks (1, 1) dalam setiap saluran.

In [64]:
# Get index 0 of 0th and 1st dimension and all values of 2nd dimension
x[0, 0, :] # same as x[0][0]

tensor([1, 2, 3])

Operasi x[0, 0, :] pada tensor x digunakan untuk mengekstrak nilai dari indeks ke-0 dan ke-1 dalam dimensi pertama dan kedua (dimensi ke-0 dan ke-1), namun mengambil semua nilai dari dimensi ketiga (dimensi ke-2). Hasilnya adalah subset tensor yang merepresentasikan nilai dari indeks ke-0 dan ke-1 dalam dimensi pertama dan kedua, dengan semua nilai dari dimensi ketiga. Dalam konteks tensor x yang memiliki bentuk (1, 3, 3), operasi ini akan menghasilkan tensor satu dimensi yang berisi nilai dari indeks (0, 0) dalam setiap saluran, yaitu nilai dari baris pertama dan saluran pertama dalam tensor tersebut.

Indexing can be quite confusing to begin with, especially with larger tensors (I still have to try indexing multiple times to get it right). But with a bit of practice and following the data explorer's motto (***visualize, visualize, visualize***), you'll start to get the hang of it.

## PyTorch tensors & NumPy

Since NumPy is a popular Python numerical computing library, PyTorch has functionality to interact with it nicely.  

The two main methods you'll want to use for NumPy to PyTorch (and back again) are:
* [`torch.from_numpy(ndarray)`](https://pytorch.org/docs/stable/generated/torch.from_numpy.html) - NumPy array -> PyTorch tensor.
* [`torch.Tensor.numpy()`](https://pytorch.org/docs/stable/generated/torch.Tensor.numpy.html) - PyTorch tensor -> NumPy array.

Let's try them out.

In [65]:
# NumPy array to tensor
import torch
import numpy as np
array = np.arange(1.0, 8.0)
tensor = torch.from_numpy(array)
array, tensor

(array([1., 2., 3., 4., 5., 6., 7.]),
 tensor([1., 2., 3., 4., 5., 6., 7.], dtype=torch.float64))

Potongan kode tersebut mengilustrasikan konversi dari array NumPy menjadi tensor PyTorch menggunakan perpustakaan NumPy dan PyTorch. Fungsi np.arange(1.0, 8.0) dari NumPy digunakan untuk membuat array dengan nilai float dari 1.0 hingga kurang dari 8.0.

> **Note:** By default, NumPy arrays are created with the datatype `float64` and if you convert it to a PyTorch tensor, it'll keep the same datatype (as above).
>
> However, many PyTorch calculations default to using `float32`.
>
> So if you want to convert your NumPy array (float64) -> PyTorch tensor (float64) -> PyTorch tensor (float32), you can use `tensor = torch.from_numpy(array).type(torch.float32)`.

Because we reassigned `tensor` above, if you change the tensor, the array stays the same.

In [66]:
# Change the array, keep the tensor
array = array + 1
array, tensor

(array([2., 3., 4., 5., 6., 7., 8.]),
 tensor([1., 2., 3., 4., 5., 6., 7.], dtype=torch.float64))

Saat kode array = array + 1 dieksekusi, nilai-nilai dalam array NumPy yang awalnya dibuat dari rentang 1.0 hingga kurang dari 8.0 ditingkatkan sebesar 1 untuk setiap elemen. Namun, tensor PyTorch yang sebelumnya telah dibuat menggunakan torch.from_numpy(array) tidak ikut berubah. Ini terjadi karena perubahan yang dilakukan pada array NumPy tidak mempengaruhi tensor PyTorch.

And if you want to go from PyTorch tensor to NumPy array, you can call `tensor.numpy()`.

In [67]:
# Tensor to NumPy array
tensor = torch.ones(7) # create a tensor of ones with dtype=float32
numpy_tensor = tensor.numpy() # will be dtype=float32 unless changed
tensor, numpy_tensor

(tensor([1., 1., 1., 1., 1., 1., 1.]),
 array([1., 1., 1., 1., 1., 1., 1.], dtype=float32))

Potongan kode tersebut membuat tensor PyTorch dengan menggunakan torch.ones(7) untuk menciptakan sebuah tensor yang berisi tujuh elemen bernilai satu dengan tipe data float32 secara default. Kemudian, numpy_tensor = tensor.numpy() digunakan untuk mengonversi tensor PyTorch tersebut menjadi array NumPy. Hasilnya adalah tensor PyTorch yang berisi tujuh elemen bernilai satu dengan tipe data float32, dan array NumPy yang memiliki nilai dan tipe data yang sama seperti tensor PyTorch karena operasi numpy_tensor = tensor.numpy() menciptakan referensi yang sama terhadap data dalam bentuk tensor ke dalam array NumPy.

And the same rule applies as above, if you change the original `tensor`, the new `numpy_tensor` stays the same.

In [68]:
# Change the tensor, keep the array the same
tensor = tensor + 1
tensor, numpy_tensor

(tensor([2., 2., 2., 2., 2., 2., 2.]),
 array([1., 1., 1., 1., 1., 1., 1.], dtype=float32))

Ketika dilakukan operasi tensor = tensor + 1, nilai-nilai dalam tensor PyTorch yang awalnya berisi tujuh elemen bernilai satu, masing-masing diinkrementasi sebesar satu untuk setiap elemen. Namun, array NumPy yang telah dihasilkan sebelumnya melalui numpy_tensor = tensor.numpy() tidak mengalami perubahan. Hal ini terjadi karena meskipun awalnya array NumPy dibuat berdasarkan tensor PyTorch, keduanya bukanlah salinan yang terus-menerus terkait satu sama lain. Modifikasi yang dilakukan pada tensor PyTorch tidak secara langsung mempengaruhi array NumPy yang sebelumnya dihasilkan, karena keduanya memiliki ruang memori yang terpisah.

## Reproducibility (trying to take the random out of random)

As you learn more about neural networks and machine learning, you'll start to discover how much randomness plays a part.

Well, pseudorandomness that is. Because after all, as they're designed, a computer is fundamentally deterministic (each step is predictable) so the randomness they create are simulated randomness (though there is debate on this too, but since I'm not a computer scientist, I'll let you find out more yourself).

How does this relate to neural networks and deep learning then?

We've discussed neural networks start with random numbers to describe patterns in data (these numbers are poor descriptions) and try to improve those random numbers using tensor operations (and a few other things we haven't discussed yet) to better describe patterns in data.

In short:

``start with random numbers -> tensor operations -> try to make better (again and again and again)``

Although randomness is nice and powerful, sometimes you'd like there to be a little less randomness.

Why?

So you can perform repeatable experiments.

For example, you create an algorithm capable of achieving X performance.

And then your friend tries it out to verify you're not crazy.

How could they do such a thing?

That's where **reproducibility** comes in.

In other words, can you get the same (or very similar) results on your computer running the same code as I get on mine?

Let's see a brief example of reproducibility in PyTorch.

We'll start by creating two random tensors, since they're random, you'd expect them to be different right?

In [69]:
import torch

# Create two random tensors
random_tensor_A = torch.rand(3, 4)
random_tensor_B = torch.rand(3, 4)

print(f"Tensor A:\n{random_tensor_A}\n")
print(f"Tensor B:\n{random_tensor_B}\n")
print(f"Does Tensor A equal Tensor B? (anywhere)")
random_tensor_A == random_tensor_B

Tensor A:
tensor([[0.8016, 0.3649, 0.6286, 0.9663],
        [0.7687, 0.4566, 0.5745, 0.9200],
        [0.3230, 0.8613, 0.0919, 0.3102]])

Tensor B:
tensor([[0.9536, 0.6002, 0.0351, 0.6826],
        [0.3743, 0.5220, 0.1336, 0.9666],
        [0.9754, 0.8474, 0.8988, 0.1105]])

Does Tensor A equal Tensor B? (anywhere)


tensor([[False, False, False, False],
        [False, False, False, False],
        [False, False, False, False]])

Potongan kode tersebut menciptakan dua tensor acak, random_tensor_A dan random_tensor_B, masing-masing memiliki ukuran 3x4 yang diisi dengan nilai-nilai acak. Dengan menggunakan operasi perbandingan random_tensor_A == random_tensor_B, kita mencoba untuk memeriksa kesamaan elemen antara kedua tensor tersebut. Hasilnya adalah tensor baru dengan ukuran yang sama (3x4) yang berisi nilai boolean yang menunjukkan apakah setiap elemen di random_tensor_A sama dengan elemen pada posisi yang sesuai di random_tensor_B. Jika hasilnya adalah True, itu berarti kedua tensor memiliki nilai yang sama pada setiap posisi elemen; jika hasilnya adalah False, setidaknya ada satu elemen yang berbeda di antara kedua tensor tersebut.

Just as you might've expected, the tensors come out with different values.

But what if you wanted to created two random tensors with the *same* values.

As in, the tensors would still contain random values but they would be of the same flavour.

That's where [`torch.manual_seed(seed)`](https://pytorch.org/docs/stable/generated/torch.manual_seed.html) comes in, where `seed` is an integer (like `42` but it could be anything) that flavours the randomness.

Let's try it out by creating some more *flavoured* random tensors.

In [70]:
import torch
import random

# # Set the random seed
RANDOM_SEED=42 # try changing this to different values and see what happens to the numbers below
torch.manual_seed(seed=RANDOM_SEED)
random_tensor_C = torch.rand(3, 4)

# Have to reset the seed every time a new rand() is called
# Without this, tensor_D would be different to tensor_C
torch.random.manual_seed(seed=RANDOM_SEED) # try commenting this line out and seeing what happens
random_tensor_D = torch.rand(3, 4)

print(f"Tensor C:\n{random_tensor_C}\n")
print(f"Tensor D:\n{random_tensor_D}\n")
print(f"Does Tensor C equal Tensor D? (anywhere)")
random_tensor_C == random_tensor_D

Tensor C:
tensor([[0.8823, 0.9150, 0.3829, 0.9593],
        [0.3904, 0.6009, 0.2566, 0.7936],
        [0.9408, 0.1332, 0.9346, 0.5936]])

Tensor D:
tensor([[0.8823, 0.9150, 0.3829, 0.9593],
        [0.3904, 0.6009, 0.2566, 0.7936],
        [0.9408, 0.1332, 0.9346, 0.5936]])

Does Tensor C equal Tensor D? (anywhere)


tensor([[True, True, True, True],
        [True, True, True, True],
        [True, True, True, True]])

Potongan kode di atas menggunakan PyTorch dan modul random dari Python untuk membuat dua tensor acak, random_tensor_C dan random_tensor_D, yang memiliki ukuran 3x4 dan diisi dengan nilai-nilai acak. torch.manual_seed(seed=RANDOM_SEED) digunakan untuk menetapkan seed secara global untuk generator nomor acak PyTorch, sementara torch.random.manual_seed(seed=RANDOM_SEED) mengatur seed untuk generator nomor acak khusus yang digunakan oleh fungsi torch.rand(). Dengan pengaturan seed yang sama (RANDOM_SEED), seharusnya kedua tensor tersebut menghasilkan nilai yang sama saat diinisialisasi secara acak. Namun, jika hanya torch.manual_seed(seed=RANDOM_SEED) yang digunakan tanpa torch.random.manual_seed(seed=RANDOM_SEED), nilai di kedua tensor bisa berbeda karena generator nomor acak yang digunakan untuk inisialisasi tidak menggunakan seed yang sama. Operasi perbandingan random_tensor_C == random_tensor_D digunakan untuk memeriksa kesamaan nilai element-wise antara dua tensor tersebut.

Nice!

It looks like setting the seed worked.

> **Resource:** What we've just covered only scratches the surface of reproducibility in PyTorch. For more, on reproducbility in general and random seeds, I'd checkout:
> * [The PyTorch reproducibility documentation](https://pytorch.org/docs/stable/notes/randomness.html) (a good exericse would be to read through this for 10-minutes and even if you don't understand it now, being aware of it is important).
> * [The Wikipedia random seed page](https://en.wikipedia.org/wiki/Random_seed) (this'll give a good overview of random seeds and pseudorandomness in general).

## Running tensors on GPUs (and making faster computations)

Deep learning algorithms require a lot of numerical operations.

And by default these operations are often done on a CPU (computer processing unit).

However, there's another common piece of hardware called a GPU (graphics processing unit), which is often much faster at performing the specific types of operations neural networks need (matrix multiplications) than CPUs.

Your computer might have one.

If so, you should look to use it whenever you can to train neural networks because chances are it'll speed up the training time dramatically.

There are a few ways to first get access to a GPU and secondly get PyTorch to use the GPU.

> **Note:** When I reference "GPU" throughout this course, I'm referencing a [Nvidia GPU with CUDA](https://developer.nvidia.com/cuda-gpus) enabled (CUDA is a computing platform and API that helps allow GPUs be used for general purpose computing & not just graphics) unless otherwise specified.




### 1. Getting a GPU

You may already know what's going on when I say GPU. But if not, there are a few ways to get access to one.

| **Method** | **Difficulty to setup** | **Pros** | **Cons** | **How to setup** |
| ----- | ----- | ----- | ----- | ----- |
| Google Colab | Easy | Free to use, almost zero setup required, can share work with others as easy as a link | Doesn't save your data outputs, limited compute, subject to timeouts | [Follow the Google Colab Guide](https://colab.research.google.com/notebooks/gpu.ipynb) |
| Use your own | Medium | Run everything locally on your own machine | GPUs aren't free, require upfront cost | Follow the [PyTorch installation guidelines](https://pytorch.org/get-started/locally/) |
| Cloud computing (AWS, GCP, Azure) | Medium-Hard | Small upfront cost, access to almost infinite compute | Can get expensive if running continually, takes some time to setup right | Follow the [PyTorch installation guidelines](https://pytorch.org/get-started/cloud-partners/) |

There are more options for using GPUs but the above three will suffice for now.

Personally, I use a combination of Google Colab and my own personal computer for small scale experiments (and creating this course) and go to cloud resources when I need more compute power.

> **Resource:** If you're looking to purchase a GPU of your own but not sure what to get, [Tim Dettmers has an excellent guide](https://timdettmers.com/2020/09/07/which-gpu-for-deep-learning/).

To check if you've got access to a Nvidia GPU, you can run `!nvidia-smi` where the `!` (also called bang) means "run this on the command line".



In [71]:
!nvidia-smi

Fri Jan  5 07:04:09 2024       
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.104.05             Driver Version: 535.104.05   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|   0  Tesla T4                       Off | 00000000:00:04.0 Off |                    0 |
| N/A   55C    P8              10W /  70W |      0MiB / 15360MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+
                                                                    

Perintah !nvidia-smi digunakan untuk menampilkan informasi mengenai penggunaan GPU pada sistem yang menggunakan GPU NVIDIA. Hasilnya akan menampilkan berbagai informasi terkait GPU yang terpasang, seperti model GPU, penggunaan memori, persentase penggunaan GPU, dan daftar proses yang sedang menggunakan GPU pada saat itu.

If you don't have a Nvidia GPU accessible, the above will output something like:

```
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
```

In that case, go back up and follow the install steps.

If you do have a GPU, the line above will output something like:

```
Wed Jan 19 22:09:08 2022       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 495.46       Driver Version: 460.32.03    CUDA Version: 11.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  Tesla P100-PCIE...  Off  | 00000000:00:04.0 Off |                    0 |
| N/A   35C    P0    27W / 250W |      0MiB / 16280MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+
```



### 2. Getting PyTorch to run on the GPU

Once you've got a GPU ready to access, the next step is getting PyTorch to use for storing data (tensors) and computing on data (performing operations on tensors).

To do so, you can use the [`torch.cuda`](https://pytorch.org/docs/stable/cuda.html) package.

Rather than talk about it, let's try it out.

You can test if PyTorch has access to a GPU using [`torch.cuda.is_available()`](https://pytorch.org/docs/stable/generated/torch.cuda.is_available.html#torch.cuda.is_available).


In [72]:
# Check for GPU
import torch
torch.cuda.is_available()

True

Potongan kode menggunakan fungsi torch.cuda.is_available() untuk memeriksa ketersediaan penggunaan GPU dalam sistem. Hasilnya adalah nilai boolean True jika sistem memiliki GPU yang dapat digunakan untuk komputasi oleh PyTorch, dan False jika tidak ada GPU yang tersedia atau jika PyTorch tidak dapat mengaksesnya.

If the above outputs `True`, PyTorch can see and use the GPU, if it outputs `False`, it can't see the GPU and in that case, you'll have to go back through the installation steps.

Now, let's say you wanted to setup your code so it ran on CPU *or* the GPU if it was available.

That way, if you or someone decides to run your code, it'll work regardless of the computing device they're using.

Let's create a `device` variable to store what kind of device is available.

In [73]:
# Set device type
device = "cuda" if torch.cuda.is_available() else "cpu"
device

'cuda'

Potongan kode menggunakan ekspresi ternary if untuk menetapkan nilai variabel device sesuai kondisi ketersediaan GPU dengan bantuan fungsi torch.cuda.is_available(). Jika sistem memiliki GPU yang dapat digunakan untuk komputasi oleh PyTorch, variabel device akan diatur sebagai string "cuda", menandakan penggunaan GPU untuk operasi PyTorch. Jika tidak, device akan diatur sebagai string "cpu", menandakan penggunaan CPU untuk operasi PyTorch.

If the above output `"cuda"` it means we can set all of our PyTorch code to use the available CUDA device (a GPU) and if it output `"cpu"`, our PyTorch code will stick with the CPU.

> **Note:** In PyTorch, it's best practice to write [**device agnostic code**](https://pytorch.org/docs/master/notes/cuda.html#device-agnostic-code). This means code that'll run on CPU (always available) or GPU (if available).

If you want to do faster computing you can use a GPU but if you want to do *much* faster computing, you can use multiple GPUs.

You can count the number of GPUs PyTorch has access to using [`torch.cuda.device_count()`](https://pytorch.org/docs/stable/generated/torch.cuda.device_count.html#torch.cuda.device_count).

In [74]:
# Count number of devices
torch.cuda.device_count()

1

Fungsi torch.cuda.device_count() digunakan untuk menghitung jumlah perangkat GPU yang tersedia pada sistem saat menggunakan PyTorch. Hasilnya adalah bilangan bulat yang menunjukkan jumlah perangkat GPU yang terdeteksi dan dapat digunakan oleh PyTorch untuk komputasi.

Knowing the number of GPUs PyTorch has access to is helpful incase you wanted to run a specific process on one GPU and another process on another (PyTorch also has features to let you run a process across *all* GPUs).

### 3. Putting tensors (and models) on the GPU

You can put tensors (and models, we'll see this later) on a specific device by calling [`to(device)`](https://pytorch.org/docs/stable/generated/torch.Tensor.to.html) on them. Where `device` is the target device you'd like the tensor (or model) to go to.

Why do this?

GPUs offer far faster numerical computing than CPUs do and if a GPU isn't available, because of our **device agnostic code** (see above), it'll run on the CPU.

> **Note:** Putting a tensor on GPU using `to(device)` (e.g. `some_tensor.to(device)`) returns a copy of that tensor, e.g. the same tensor will be on CPU and GPU. To overwrite tensors, reassign them:
>
> `some_tensor = some_tensor.to(device)`

Let's try creating a tensor and putting it on the GPU (if it's available).

In [75]:
# Create tensor (default on CPU)
tensor = torch.tensor([1, 2, 3])

# Tensor not on GPU
print(tensor, tensor.device)

# Move tensor to GPU (if available)
tensor_on_gpu = tensor.to(device)
tensor_on_gpu

tensor([1, 2, 3]) cpu


tensor([1, 2, 3], device='cuda:0')

Potongan kode menciptakan sebuah tensor dengan nilai [1, 2, 3] yang secara default ditempatkan pada CPU, ditandai dengan informasi perangkat tensor.device yang menunjukkan bahwa tensor tersebut berada di CPU. Langkah selanjutnya menggunakan metode to() untuk memindahkan tensor ke perangkat yang ditentukan oleh variabel device, yang sebelumnya telah ditetapkan berdasarkan ketersediaan GPU atau CPU.

If you have a GPU available, the above code will output something like:

```
tensor([1, 2, 3]) cpu
tensor([1, 2, 3], device='cuda:0')
```

Notice the second tensor has `device='cuda:0'`, this means it's stored on the 0th GPU available (GPUs are 0 indexed, if two GPUs were available, they'd be `'cuda:0'` and `'cuda:1'` respectively, up to `'cuda:n'`).



### 4. Moving tensors back to the CPU

What if we wanted to move the tensor back to CPU?

For example, you'll want to do this if you want to interact with your tensors with NumPy (NumPy does not leverage the GPU).

Let's try using the [`torch.Tensor.numpy()`](https://pytorch.org/docs/stable/generated/torch.Tensor.numpy.html) method on our `tensor_on_gpu`.

In [76]:
# If tensor is on GPU, can't transform it to NumPy (this will error)
tensor.cpu()

tensor([1, 2, 3])

Potongan kode tensor.cpu() digunakan untuk memindahkan tensor dari GPU kembali ke CPU. Namun, dalam kasus ini, tensor telah ditempatkan pada GPU menggunakan metode to(device) sebelumnya. Ketika kita mencoba memanggil tensor.cpu() untuk memindahkan tensor dari GPU ke CPU, ini akan menghasilkan kesalahan. Hal ini disebabkan oleh fakta bahwa operasi cpu() tidak dapat diterapkan pada tensor yang sudah berada di CPU; ia dirancang untuk memindahkan tensor dari GPU ke CPU.

Instead, to get a tensor back to CPU and usable with NumPy we can use [`Tensor.cpu()`](https://pytorch.org/docs/stable/generated/torch.Tensor.cpu.html).

This copies the tensor to CPU memory so it's usable with CPUs.

In [77]:
# Instead, copy the tensor back to cpu
tensor_back_on_cpu = tensor_on_gpu.cpu().numpy()
tensor_back_on_cpu

array([1, 2, 3])

Potongan kode tensor_on_gpu.cpu().numpy() digunakan untuk mengembalikan tensor yang sudah berada di GPU ke CPU dengan menggunakan metode cpu() untuk memindahkan tensor dari GPU ke CPU, dan kemudian menggunakan metode numpy() untuk mengonversi tensor PyTorch menjadi array NumPy.

The above returns a copy of the GPU tensor in CPU memory so the original tensor is still on GPU.

In [78]:
tensor_on_gpu

tensor([1, 2, 3], device='cuda:0')

Variabel tensor_on_gpu merupakan tensor PyTorch yang sebelumnya telah dipindahkan dari CPU ke GPU dengan menggunakan metode to(device) untuk memanfaatkan sumber daya komputasi GPU jika tersedia. Tensor ini berisi nilai yang sama seperti tensor awalnya, tetapi sekarang ditempatkan di GPU. Penggunaan sumber daya GPU dapat meningkatkan kinerja dan kecepatan komputasi pada operasi PyTorch tertentu, terutama pada tugas-tugas yang memerlukan komputasi yang intensif seperti pelatihan model neural network.

## Exercises

All of the exercises are focused on practicing the code above.

You should be able to complete them by referencing each section or by following the resource(s) linked.

**Resources:**

* [Exercise template notebook for 00](https://github.com/mrdbourke/pytorch-deep-learning/blob/main/extras/exercises/00_pytorch_fundamentals_exercises.ipynb).
* [Example solutions notebook for 00](https://github.com/mrdbourke/pytorch-deep-learning/blob/main/extras/solutions/00_pytorch_fundamentals_exercise_solutions.ipynb) (try the exercises *before* looking at this).

1. Documentation reading - A big part of deep learning (and learning to code in general) is getting familiar with the documentation of a certain framework you're using. We'll be using the PyTorch documentation a lot throughout the rest of this course. So I'd recommend spending 10-minutes reading the following (it's okay if you don't get some things for now, the focus is not yet full understanding, it's awareness). See the documentation on [`torch.Tensor`](https://pytorch.org/docs/stable/tensors.html#torch-tensor) and for [`torch.cuda`](https://pytorch.org/docs/master/notes/cuda.html#cuda-semantics).
2. Create a random tensor with shape `(7, 7)`.
3. Perform a matrix multiplication on the tensor from 2 with another random tensor with shape `(1, 7)` (hint: you may have to transpose the second tensor).
4. Set the random seed to `0` and do exercises 2 & 3 over again.
5. Speaking of random seeds, we saw how to set it with `torch.manual_seed()` but is there a GPU equivalent? (hint: you'll need to look into the documentation for `torch.cuda` for this one). If there is, set the GPU random seed to `1234`.
6. Create two random tensors of shape `(2, 3)` and send them both to the GPU (you'll need access to a GPU for this). Set `torch.manual_seed(1234)` when creating the tensors (this doesn't have to be the GPU random seed).
7. Perform a matrix multiplication on the tensors you created in 6 (again, you may have to adjust the shapes of one of the tensors).
8. Find the maximum and minimum values of the output of 7.
9. Find the maximum and minimum index values of the output of 7.
10. Make a random tensor with shape `(1, 1, 1, 10)` and then create a new tensor with all the `1` dimensions removed to be left with a tensor of shape `(10)`. Set the seed to `7` when you create it and print out the first tensor and it's shape as well as the second tensor and it's shape.

## Extra-curriculum

* Spend 1-hour going through the [PyTorch basics tutorial](https://pytorch.org/tutorials/beginner/basics/intro.html) (I'd recommend the [Quickstart](https://pytorch.org/tutorials/beginner/basics/quickstart_tutorial.html) and [Tensors](https://pytorch.org/tutorials/beginner/basics/tensorqs_tutorial.html) sections).
* To learn more on how a tensor can represent data, see this video: [What's a tensor?](https://youtu.be/f5liqUk0ZTw)