# How LLMs Work
This notebook will provide an overview of how language models (LLMs) work. We'll cover the key components and processes involved in generating text, including encoding, decoding, and attention mechanisms.

Innanzitutto partiamo dalle reti neurali classiche, usate principalmente per classificazione e regressione.

![classificazione](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/1.png)
[image credit: https://www.youtube.com/watch?v=RDMwSAZwn8I]

![regressione](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/2.png)


Ma ora vediamo cosa è di fatto la regressione con un semplice esempio a 2 dimensioni

# New Section

In [None]:
!pip uninstall -y numpy matplotlib
!pip install numpy
!pip install matplotlib --force-reinstall
!pip install  ipywidgets scikit-learn


In [None]:
import numpy as np
import matplotlib.pyplot as plt
import ipywidgets as widgets
from IPython.display import display

# Set random seed for reproducibility
np.random.seed(42)

# Generate data points once (and keep them fixed)
num_points = 40
x_data = np.random.uniform(0.2, 10, num_points)
# Generate y values with some default slope, intercept and noise
default_slope = 1.0
default_intercept = 0.5
noise = 0.7
y_data = default_slope * x_data + default_intercept + np.random.normal(0, noise, num_points)

# Create a function to generate the plot with fixed data points
def create_regression_plot(slope=1.0, intercept=0.5):
    """
    Create a linear regression visualization with customizable line parameters
    but fixed data points.

    Parameters:
    -----------
    slope : float
        The slope of the line (default: 1.0)
    intercept : float
        The y-intercept of the line (default: 0.5)
    """
    # Create figure with black background
    plt.figure(figsize=(12, 8), facecolor='black')
    ax = plt.subplot(111)
    ax.set_facecolor('black')

    # Plot the fixed data points
    ax.scatter(x_data, y_data, color='#FFD700', s=50, alpha=0.8)

    # Create x values for the line
    line_x = np.array([0, 12])

    # Calculate y values for the line using the current slope and intercept
    line_y = slope * line_x + intercept

    # Plot the line
    ax.plot(line_x, line_y, color='#90EE90', linewidth=2)

    # Set axis colors to white
    ax.spines['bottom'].set_color('white')
    ax.spines['left'].set_color('white')
    ax.spines['top'].set_visible(False)
    ax.spines['right'].set_visible(False)

    # Set tick colors to white
    ax.tick_params(axis='x', colors='white', which='both')
    ax.tick_params(axis='y', colors='white', which='both')

    # Set axis labels with larger font
    ax.set_xlabel('Square footage', color='white', fontsize=20)
    ax.set_ylabel('Output', color='white', fontsize=20)

    # Set title
    ax.set_title('Linear Regression', color='white', fontsize=30)

    # Set axis limits
    ax.set_xlim(0, 12)
    ax.set_ylim(0, 13)

    # Show gridlines
    ax.grid(True, alpha=0.2, color='white')

    plt.tight_layout()
    plt.show()

    # Print the line equation
    print(f"Line equation: y = {slope:.2f}x + {intercept:.2f}")

# Create interactive widgets
slope_slider = widgets.FloatSlider(
    value=1.0,
    min=0.1,
    max=3.0,
    step=0.1,
    description='Slope:',
    continuous_update=False
)

intercept_slider = widgets.FloatSlider(
    value=0.5,
    min=-2.0,
    max=5.0,
    step=0.1,
    description='Intercept:',
    continuous_update=False
)

# Create interactive output
interactive_plot = widgets.interactive_output(
    create_regression_plot,
    {'slope': slope_slider, 'intercept': intercept_slider}
)

# Display the widgets and plot
controls = widgets.VBox([slope_slider, intercept_slider])
output = widgets.VBox([interactive_plot])
display(widgets.HBox([controls, output]))


# Dal Neurone artificiale all'autoencoder

![Neurone artificiale](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/3.png)


![Deep Learning](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/4.png)

![Autoencoder](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/5.png)

![Self Encoder](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/6.png)

# Ora proviamo a giocare un po' con le reti neurali e vedere dove e come conservano l'informazione

Prima una cosa semplice....

[Analyzing our neural network di 3Blue1Brown](https://www.3blue1brown.com/lessons/neural-network-analysis)

----

Poi vediamo una rete neurale moderna di classificazione

[attention visualization](https://huggingface.co/spaces/webml-community/attention-visualization)

# Da qui agli LLM è solo questione di attenzione

![Attention is all you need](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/7.png)

E su questo iniziamo a vedere un video insieme

[3Blue1Brown LLM for beginners](https://youtu.be/LPZh9BOjkQs)

# Con quali dati si fa un training

[datasets](https://huggingface.co/datasets)





# Ma come fa un LLM a decidere qual'è la prossima parola?

![Transformer](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/8.png)


Come abbiamo visto il lavoro è fatto su i token...ma cosa sono questi token?

* Una parola?
* Un insieme di parole?
* una parte di una parola?

[Proviamo...](https://platform.openai.com/tokenizer)

I token (ed il loro significato in uncerto senso) sono rappresentati come vettori multidimensionali (tensori). Questa rappresentazione è detto embedding

![embeddings](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/9.png)

La rappresentazione vettoriale permette di fare calcoli

![vector aritmetics](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/10.png)

![vector aritmetics](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/11.png)

![Vector aritmetics](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/12.png)

![Direction](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/13.png)

------

## Quindi E(gatto) - E(miao) + E(Bau) = ?

------


Viene poi definita una unemdding matrix che permette di passare ad un array unidimensionale....ma che ancora non è una distribuzione di probabilità


![Unembedding](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/14.png)

Quindi si applica una funzione di softmax

![softmax](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/15.png)

Ma come dicevamo del cervello umano serve imprevidibilità...se volete chiamatela creatività e alloro si introducono alcune variabli T, top-k, top-p...vediamone solo uno matematicamente

![Attention is all you need](https://raw.githubusercontent.com/maeste/iis_ai/refs/heads/main/images/16.png)


[a per capire meglio giochiamo con tutte e tre](https://huggingface.co/spaces/genaibook/token_probability_distribution)



##Capire come funzionano questo cose ci fa capire come interagire con gli LLM, ovvero come scrivere prompt migliori





# Ma cosa possono fare questi LLM

Un sacco di cose:

[Leggere un grafico](https://huggingface.co/spaces/ahmed-masry/ChartGemma)

[Creare una immagine](https://huggingface.co/spaces/multimodalart/stable-diffusion-3.5-large-turboX)

[Creare o clonare una voce](https://huggingface.co/spaces/Mobvoi/Offical-Spark-TTS)

Fare applicazioni molto evolute.....così evolute da sembrare super poteri (demo di qualche Big LLM)

Proviamo ad esplorare un po' huggingface [sapces](https://huggingface.co/spaces) and [spaces of the week](https://huggingface.co/spaces/hysts/spaces-of-the-week)