# Machine Learning

Den symboliska AI:n gav oss en stor uppsättning fantastiska verktyg som är relevanta än idag. Men förhoppningar om att nästa stora genombrott inom AI skulle komma från den inriktningen är sedan länge borta.

När intresset för den symboliska AI:n avtog fanns det istället utrymme för en annan idé att växa fram. En idé som faktiskt föddes _innan_ termen "Artificiell Intelligens" ens fanns. Det var idén om att inte programmera intelligens, utan att _träna_ den. Att inte bygga logik, utan att bygga en hjärna som kan lära sig.

## Connectionism

Redan 1943, långt innan AI-fältet fick sitt namn, hade Warren McCulloch och Walter Pitts skapat en matematisk modell av en biologisk neuron. 1958 byggde Frank Rosenblatt **Perceptronen**, en maskin som kunde lära sig känna igen former. New York Times skrev att detta var _embryot till en dator som kommer att kunna gå, prata, se, skriva, reproducera sig själv och vara medveten om sin existens._[^1]

[^1]: https://www.nytimes.com/1958/07/13/archives/electronic-brain-teaches-itself.html

1969 publicerades dock boken _Perceptrons_ av Marvin Minsky och Seymour Papert. I den bevisade de matematiskt att dessa tidiga nätverk hade fundamentala begränsningar (som vi ska se). Finansieringen ströps, forskarna bytte spår, och connectionismen fick klicka på snooze-knappen i bakgrunden i årtionden, medan den symboliska AI:n tog över scenen.

Men när expertsystemen misslyckades, började forskare damma av de gamla idéerna igen. De insåg att felet inte låg i idén om neuroner, utan i att vi hade haft för få av dem och för lite data.

## Neuronen

Nervceller, som också kallas **neuroner** är en del av nervsystemet vars uppgift är att via signaler styra och koordinera kroppens olika funktioner. Vi behöver dem för att kunna reagera på information som skickas från våra sinnen och reagera på dem. Vi behöver dem för att kunna tänka och minnas saker. Över 80 miljarder neuroner uppskattas finnas i en mänsklig hjärna.

Översiktligt består nervcellen av en **cellkropp** och två olika typer av utskott som är högst relevanta för oss: **dendriter**, som tar emot signaler, och en **axon**, som skickar vidare signaler. Slutet av axonen förgrenar sig i flera axonterminaler så att signalen kan skickas vidare i massa olika riktningar.

**Synapser** kallas den struktur som bildas mellan neuroners axoner och andra neuroners dendriter. Synapsen överför signalerna som kommer via axonen, nervtråden, till receptorer på dendriten. Signalen som kommer via axonen är elektrisk och kan antingen skickas vidare som en elektrisk impuls eller omvandlas till en kemisk signal och skickas via neurotransmittorer.

När flera neuroner är sammankopplade kallar vi dem tillsammans ett **neuralt nätverk**.

En **avgörande egenskap** är vår hjärnas **plasticitet**, dess förmåga att skapa nya förbindelser eller på annat sätt ändra sin struktur och funktion. Detta sker som svar på yttre och inre påverkningar och tillåter oss att lära oss nya saker, kompensera för skador, anpassa oss till nya förutsättningar och bilda minner.

Connectionism representerar idén om att vi kanske kan skapa artificiell intelligens genom att bygga system som behandlar och överför information på liknande sätt. Med små sammankopplade, ofta simpla enheter, som tillsammans bildar något oerhört kapabelt.

![Översikt av neuronens komponenter](./images/neural_network.svg)

### Den artificiella neuronen

Tänk dig en neuron som en enkel beslutsmodell. Dess jobb är att väga samman olika informationskällor (inputs) för att fatta ett ja/nej-beslut (output). Låt oss använda en konkret, tvådimensionell analogi: **Ska jag gå på festen?**

För att fatta detta beslut har du två grundläggande frågor:

1. **x1: Är vänner där?** (`1` för Ja, `0` för Nej)
2. **x2: Har jag ett prov imorgon?** (`1` för Ja, `0` för Nej)

Denna artificiella neuronmodell representerar resonemanget med två justerbara "rattar" för varje fråga, kallade **vikter** (`w1`, `w2`), samt en tredje, oberoende ratt kallad **bias** (`b`).

- **Vikterna** representerar hur viktig varje faktor är. En hög positiv vikt för `w1` betyder "det är superviktigt att mina vänner är där". En stor negativ vikt för `w2` betyder "ett prov är en stark anledning att stanna hemma". **Geometriskt bestämmer vikterna lutningen, eller orienteringen, på neuronens beslutsgräns.**
  - Det här sista om geometri kanske lät lite klurigt, vi kommer till det snart, du kommer se att ekvationen vi snart kommer skapa kommer bilda en linje genom ett koordinatsystem som skiljer alla möjliga kombinationer som leder till att du går på festen, från de kombinationer som leder till att du inte går på festen.
- **Bias** representerar neuronens grundinställning. Den fungerar som en **justerbar tröskel** som representerar din grundläggande vilja att gå på fest (positiv bias) eller stanna hemma (negativ bias). Den är alltså **partisk** mot ett visst beslut.
  - **Geometriskt bestämmer biasen positionen på beslutsgränsen; den "knuffar" gränsen bort från origo (nollpunkten), vilket ger den friheten att placeras var som helst.**

Modellens beräkning är enkel: `Summa = (x1*w1) + (x2*w2) + b`.

Geometriskt sett är detta mer än bara en summa; ekvationen `Summa = 0` definierar en perfekt **rak skiljelinje** i ett tvådimensionellt rum. Allt på ena sidan linjen är 'Ja', och allt på andra sidan är 'Nej'. När du sätter Summa = 0 kan du lätt skriva om uttrycket som en simpel `y = kx + m` och rita din raka skiljelinje!

Beslutet fattas sedan av en **aktiveringsfunktion**: om `Summa > 0`, blir output `1` (Gå!). Annars blir den `0` (Stanna hemma!). Aktiveringsfunktionen avgör alltså på vilken sida om skiljelinjen din punkt befinner sig på.

![Gå på festen?](./images/neuron.jpg)

### En Neuron i Python

Innan vi lär en neuron att lära sig själv, låt oss först bygga själva mekanismen i en Python-klass. Denna `Neuron`-klass kommer att ha en `predict`-metod som utför beräkningen. Notera att den inte kan lära sig; istället kommer **vi** att manuellt ställa in dess vikter och bias för att skapa olika beslutsmodeller.

Öppna filen `neuron.py` och fixa koden. Det finns några TODO:s. Du bör kunna lösa dem om du läst ovan avsnitt.

Kör sedan cellen nedan för att testa den.

In [1]:
# Importera vår Neuron-klass
from neuron import Neuron

# Persona 1: Den Studiemotiverade
# Denna person prioriterar studier över allt annat.
# Vänner är trevligt, men ett prov är en deal-breaker.
studious_neuron = Neuron(weights=[0.5, -1.0], bias=-0.2)

# Scenario: Vänner är där (1), men det är ett prov imorgon (1)
inputs = [1, 1]
decision = studious_neuron.predict(inputs)
print(f"Den Studiemotiverade: Input {inputs} -> Beslut: {decision} (Förväntat: 0)")
# Beräkning: (1*0.5) + (1*-1.0) + (-0.2) = -0.7. Resultat: 0 (Stanna hemma)

0.5 1
-1.0 1
Den Studiemotiverade: Input [1, 1] -> Beslut: 1 (Förväntat: 0)


In [2]:
# Persona 2: Sociala Festprissen
# Denna person älskar att umgås och har en mycket mer avslappnad inställning till prov.
social_neuron = Neuron(weights=[1.0, -0.1], bias=0.5)

# Samma scenario: Vänner är där (1), prov imorgon (1)
inputs = [1, 1]
decision = social_neuron.predict(inputs)
print(f"Sociala Festprissen: Input {inputs} -> Beslut: {decision} (Förväntat: 1)")
# Beräkning: (1*1.0) + (1*-0.1) + 0.5 = 1.4. Resultat: 1 (Gå på fest!)

1.0 1
-0.1 1
Sociala Festprissen: Input [1, 1] -> Beslut: 1 (Förväntat: 1)



Detta visar tydligt hur vikter och bias direkt formar neuronens beslutsfattande. Klassen `Neuron` och dess `predict`-metod representerar den grundläggande beräkningsmekanismen.

Men vad händer om vi har 100 inputs istället för 2? Att manuellt hitta de bästa värdena för 100 vikter och en bias blir en omöjlig uppgift. Vi behöver ett sätt för neuronen att _hitta de bästa parametrarna själv_ genom att titta på exempel.

## Perceptronen

På 50-talet tog Frank Rosenblatt neuronmodellen och gav den en enkel **läranderegel**. Kombinationen av neuronmodellen och denna regel är vad som kallas **Perceptronen**. Regeln låter den lära sig från sina misstag genom en trestegsprocess.

Lärandet behöver en uppsättning **träningsdata**, vilket innehållet exempel på inputs med motsvarande output - alltså facit.

### Perceptronens lärande

För varje exempel i träningsdatan, upprepar Perceptronen följande tre steg:

1. **Gissa:** Den tar emot inputs (`x1`, `x2`, ...) och beräknar en output (`0` eller `1`) med hjälp av sina nuvarande vikter och bias.
2. **Beräkna Felet:** Den jämför sin gissning med det korrekta svaret (facit). Felet beräknas enkelt: `Fel = facit - gissning`. Detta kan bara resultera i tre möjliga värden:
   - `0`: Gissningen var korrekt.
   - `1`: Gissningen var `0` men borde ha varit `1`.
   - `-1`: Gissningen var `1` men borde ha varit `0`.
3. **Justera Parametrarna (Lärdom):** Om felet var `0` görs ingenting. Om felet var `1` eller `-1`, justeras alla parametrar för att göra gissningen lite bättre nästa gång. Justeringen följer en enkel formel:

   - `ny_bias = gammal_bias + α * fel`
   - `ny_vikt_x = gammal_vikt_x + α * fel * input_x`


Här är `α` (alfa) en **inlärningsfaktor** (ofta ett litet tal som 0.1), som styr hur stora steg lärandet ska ta.

Genom att upprepa dessa tre steg för många exempel, kommer neuronens vikter och bias gradvis att närma sig värden som löser problemet.

### Exempel: Perceptronens lärande steg för steg

---

**Scenario 1:**
Du står inför ett beslut. Vännerna är på festen (`x1=1`) och du har ett prov imorgon (`x2=1`). Det korrekta beslutet för dig är att stanna hemma och plugga (facit = `0`).

Din Perceptron har precis startat och har slumpmässiga startvärden:
- `w1` (vänner) = `0.5`
- `w2` (prov) = `-0.4`
- `b` (bias) = `0.0`

**1. Gissning:**
Perceptronen räknar:
`Summa = (1 * 0.5) + (1 * -0.4) + 0.0 = 0.5 - 0.4 = 0.1`
Eftersom `0.1 > 0`, blir output `1` (Gå på festen).

**2. Misstag:**
Gissningen (`1`) stämmer inte med facit (`0`). Du borde ha stannat hemma! Felet är `facit - gissning = 0 - 1 = -1`.

**3. Lärdom:**
Eftersom felet är negativt, var summan för hög. Perceptronen måste justera sina vikter för att sänka summan nästa gång den ser en liknande situation. Den använder en enkel uppdateringsregel: `ny_vikt_x = gammal_vikt_x + inlärningsfaktor * fel * input_x`. Vi sätter inlärningsfaktorn `α` till `0.1`.

- `w1_ny = 0.5 + 0.1 * (-1) * 1 = 0.4` (Vikten för "vänner" minskar lite)
- `w2_ny = -0.4 + 0.1 * (-1) * 1 = -0.5` (Vikten för "prov" blir mer negativ)
- `b_ny = 0.0 + 0.1 * (-1) = -0.1` (Biasen justeras också)

Med de nya parametrarna (`w1=0.4, w2=-0.5, b=-0.1`), låt oss testa igen:
`Summa = (1 * 0.4) + (1 * -0.5) - 0.1 = 0.4 - 0.5 - 0.1 = -0.2`
Nu är summan negativ, och outputen blir `0`. Perceptronen har lärt sig!

**Scenario 2:**
Tänk dig en ny situation. Du är en social person vars grundinställning är att man alltid går på fest om man inte har någon information alls.

- **Situation:** Du vet inget om festen. Inga vänner har sagt något (`x1=0`) och du har inget prov (`x2=0`).
- **Facit:** Din grundinställning säger "Gå!" (facit = `1`).

Vi använder de senast inlärda vikterna & bias: `w1=0.4, w2=-0.5, b=-0.1`.

**1. Gissning:**
`Summa = (0 * 0.4) + (0 * -0.5) + (-0.1) = -0.1`
Eftersom summan inte är större än 0, blir output `0` (Stanna hemma).

**2. Misstag:**
Gissningen (`0`) stämmer inte med facit (`1`). Felet är `1 - 0 = 1`.

**3. Försök till lärdom:**
Perceptronen justerar nu sina vikter & bias för att höja summan.

- `w1_ny = 0.4 + 0.1 * (1) * 0 = 0.4` (Ingen ändring!)
- `w2_ny = -0.5 + 0.1 * (1) * 0 = -0.5` (Ingen ändring!)
- `b_ny = -0.1 + 0.1 * (1) = 0.0` (Biasen justeras)

**Här ser vi varför bias är så viktigt!** Biasen är inte beroende av någon input, så den kan alltid justeras om perceptronen beräknat fel svar.

Detta visar hur vikter och bias har två olika men lika viktiga jobb, både mekaniskt och geometriskt.

- **Vikterna** lär sig mönster baserat på den **input** som finns. **Geometriskt justerar de orienteringen (lutningen) på beslutsgränsen.**
- **Biasen** lär sig vad neuronens **standard-svar** ska vara. **Geometriskt frigör den beslutsgränsen från origo, vilket låter den justera sin position för att bäst separera datan.**

Utan en justerbar bias är neuronens beslutsgräns permanent fastlåst vid nollpunkten och kan bara rotera, vilket gör den oförmögen att lösa många problem.

### En Perceptron i Python

Nu när vi förstår teorin är det dags att omsätta den i praktiken. Öppna filen `perceptron.py` och granska hur `Perceptron`-klassen utökar `Neuron` med en `fit`-metod. Det finns några TODO:s i filen. Implementera koden som beskrivits ovan i denna fil.

Låt oss testa perceptronen:

In [3]:
from perceptron import Perceptron

# 1. Definiera vår träningsdata
# inputs = [[vänner, prov], ...]
inputs = [
    [0, 0],  # Inga vänner, inget prov
    [0, 1],  # Inga vänner, prov
    [1, 0],  # Vänner, inget prov
    [1, 1]   # Vänner, prov
]

# Facit: 1 = Gå, 0 = Stanna hemma
targets = [1, 0, 1, 0]

# 2. Skapa en instans av vår Perceptron
perceptron = Perceptron(num_inputs=2, learning_rate=0.1, n_iterations=5)

# 3. Kör träningen
perceptron.fit(inputs, targets)

# 4. Granska resultatet
print(f"Slutgiltiga inlärda vikter: {perceptron.weights}")
print(f"Slutgiltig inlärd bias: {perceptron.bias}")

# 5. Testa den färdigtränade modellen
print("\n--- Testar den tränade modellen ---")
for inp, target in zip(inputs, targets):
    pred = perceptron.predict(inp)
    status = "✓" if pred == target else "✗"
    print(f"Input: {inp} -> Prediktion: {pred}, Förväntat: {target} {status}")

-0.006037449022747943 0
0.029696637239817414 0
-0.006037449022747943 0
0.029696637239817414 1
-0.006037449022747943 1
0.029696637239817414 0
-0.006037449022747943 1
0.029696637239817414 1
-0.006037449022747943 0
0.029696637239817414 0
-0.006037449022747943 0
0.029696637239817414 1
-0.006037449022747943 1
0.029696637239817414 0
-0.006037449022747943 1
0.029696637239817414 1
-0.006037449022747943 0
0.029696637239817414 0
-0.006037449022747943 0
0.029696637239817414 1
-0.006037449022747943 1
0.029696637239817414 0
-0.006037449022747943 1
0.029696637239817414 1
-0.006037449022747943 0
0.029696637239817414 0
-0.006037449022747943 0
0.029696637239817414 1
-0.006037449022747943 1
0.029696637239817414 0
-0.006037449022747943 1
0.029696637239817414 1
-0.006037449022747943 0
0.029696637239817414 0
-0.006037449022747943 0
0.029696637239817414 1
-0.006037449022747943 1
0.029696637239817414 0
-0.006037449022747943 1
0.029696637239817414 1
Slutgiltiga inlärda vikter: [-0.006037449022747943, 0.029696

**Analys av resultatet:**

När du kör koden kommer du se hur vikterna och biasen justeras för varje iteration. Det slutgiltiga resultatet kommer troligen att visa:

- En **negativ vikt** för den andra inputen (`w2`, provet). Detta betyder att ett prov starkt talar _emot_ att gå på fest.
- En vikt nära **noll** för den första inputen (`w1`, vänner). Modellen har lärt sig att denna faktor inte är avgörande för beslutet i detta specifika dataset.
- En **positiv bias**. Detta representerar en grundinställning att "gå på fest" om inga andra starka skäl (som ett prov) finns.

Modellen har alltså framgångsrikt lärt sig den logiska regeln från datan!

### Perceptronen på ett riktigt dataset (Iris)

Nu tar vi steget från ett påhittat problem till ett verkligt. Vi ska använda det berömda **Iris-datasetet**, som innehåller mätningar av tre olika arter av Iris-blommor.

En viktig begränsning med vår enkla Perceptron är att den är en **binär klassificerare**, vilket betyder att den bara kan svara på frågor med två möjliga utfall (som 0 eller 1, Ja eller Nej). Iris-datasetet har tre arter, så vi måste förenkla problemet: **"Är denna blomma en Iris-Setosa, eller inte?"**

Vi kommer också bara att använda två av de fyra tillgängliga måtten (features/inputs) för att hålla det enkelt.

In [4]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 1. Ladda och förbered datan
iris = pd.read_csv('data/iris.csv')

# Välj alla rader, och första 2 kolumnerna (sepal length och width)
X = iris[["sepal_length","sepal_width"]].values

# Skapa facit: 1 om species == "setosa", annars 0
y = (iris["species"] == "setosa").astype(int).values


# 2. DELA UPP DATAN
# 30% blir testdata, 70% träningsdata
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1337)

print(f"Storlek på träningsdata: {len(X_train)} exempel")
print(f"Storlek på testdata: {len(X_test)} exempel")

Storlek på träningsdata: 105 exempel
Storlek på testdata: 45 exempel


In [5]:
# 3. Skapa och träna en Perceptron-instans PÅ TRÄNINGSDATAN
iris_perceptron = Perceptron(num_inputs=2, learning_rate=0.1, n_iterations=10)
iris_perceptron.fit(X_train.tolist(), y_train.tolist())

# 4. Gör prediktioner och utvärdera PÅ TESTDATAN
predictions = [iris_perceptron.predict(inputs) for inputs in X_test.tolist()]
accuracy = accuracy_score(y_test, predictions)

print(f"\n--- Test på Iris-datasetet ---")
print(f"Noggrannhet på testdatan: {accuracy * 100:.2f}%")

-0.26072551034551106 4.9
0.12818425664429556 3.0
-0.26072551034551106 4.8
0.12818425664429556 3.4
-0.26072551034551106 5.0
0.12818425664429556 3.4
-0.26072551034551106 6.9
0.12818425664429556 3.1
-0.26072551034551106 5.5
0.12818425664429556 2.4
-0.26072551034551106 5.7
0.12818425664429556 4.4
-0.26072551034551106 5.2
0.12818425664429556 2.7
-0.26072551034551106 4.8
0.12818425664429556 3.0
-0.26072551034551106 4.5
0.12818425664429556 2.3
-0.26072551034551106 5.7
0.12818425664429556 2.8
-0.26072551034551106 6.0
0.12818425664429556 2.7
-0.26072551034551106 6.6
0.12818425664429556 3.0
-0.26072551034551106 7.1
0.12818425664429556 3.0
-0.26072551034551106 6.3
0.12818425664429556 3.3
-0.26072551034551106 6.1
0.12818425664429556 2.9
-0.26072551034551106 5.9
0.12818425664429556 3.2
-0.26072551034551106 6.6
0.12818425664429556 2.9
-0.26072551034551106 5.6
0.12818425664429556 2.5
-0.26072551034551106 5.5
0.12818425664429556 2.5
-0.26072551034551106 5.4
0.12818425664429556 3.7
-0.26072551034551106

**Analys av resultatet:**

Du kommer att se att vår enkla Perceptron uppnår mycket imponerande noggrannhet på detta problem! Detta beror på att Iris Setosa-blommorna är så pass olika de andra två arterna (baserat på dessa två features) att det går att dra en perfekt rak linje mellan dem. Detta kallas att datan är **linjärt separerbar**, vilket är det ideala scenariot för en Perceptron.

---

## Övning 0: Bevisa Perceptronens Gränser

**Syfte:** Att praktiskt demonstrera varför en enskild Perceptron inte kan lösa icke-linjära problem som XOR, precis som Minsky och Papert argumenterade.

XOR ("exclusive or") är ett klassiskt logiskt problem. Outputen är `1` om **exakt en** av inputarna är `1`, annars är outputen `0`.

| x1 | x2 | XOR |
|----|----|-----|
| 0  | 0  | 0   |
| 0  | 1  | 1   |
| 1  | 0  | 1   |
| 1  | 1  | 0   |

**Din uppgift:** Träna din Perceptron på XOR-data och observera vad som händer.

In [6]:
# Data för XOR
X_xor = [[0, 0], [0, 1], [1, 0], [1, 1]]
y_xor = [0, 1, 1, 0]

# Skapa och träna din Perceptron med många iterationer
xor_perceptron = Perceptron(num_inputs=2, learning_rate=0.1, n_iterations=500)
xor_perceptron.fit(X_xor, y_xor)

# Testa den tränade modellen
print("\nTestar den tränade Perceptronen på XOR-data:")
correct = 0
for inp, target in zip(X_xor, y_xor):
    prediction = xor_perceptron.predict(inp)
    status = "✓" if prediction == target else "✗"
    if prediction == target:
        correct += 1
    print(f"Input: {inp}, Prediktion: {prediction}, Korrekt: {target} {status}")

print(f"\nNoggrannhet: {correct}/{len(X_xor)}")
print(f"Vikter: {xor_perceptron.weights}")
print(f"Bias: {xor_perceptron.bias}")

-0.1382661364011204 0
0.10334146450909654 0
-0.1382661364011204 0
0.10334146450909654 1
-0.1382661364011204 1
0.10334146450909654 0
-0.1382661364011204 1
0.10334146450909654 1
-0.1382661364011204 0
0.10334146450909654 0
-0.1382661364011204 0
0.10334146450909654 1
-0.1382661364011204 1
0.10334146450909654 0
-0.1382661364011204 1
0.10334146450909654 1
-0.1382661364011204 0
0.10334146450909654 0
-0.1382661364011204 0
0.10334146450909654 1
-0.1382661364011204 1
0.10334146450909654 0
-0.1382661364011204 1
0.10334146450909654 1
-0.1382661364011204 0
0.10334146450909654 0
-0.1382661364011204 0
0.10334146450909654 1
-0.1382661364011204 1
0.10334146450909654 0
-0.1382661364011204 1
0.10334146450909654 1
-0.1382661364011204 0
0.10334146450909654 0
-0.1382661364011204 0
0.10334146450909654 1
-0.1382661364011204 1
0.10334146450909654 0
-0.1382661364011204 1
0.10334146450909654 1
-0.1382661364011204 0
0.10334146450909654 0
-0.1382661364011204 0
0.10334146450909654 1
-0.1382661364011204 1
0.10334146

> **Reflektera:** Lyckas din Perceptron lösa XOR-problemet? Varför/varför inte?
>
> Du har nu praktiskt bevisat Perceptronens begränsning. Den kan inte hitta en rak linje som separerar XOR-datan. Detta motiverar varför vi behöver gå vidare till nästa nivå: nätverk av neuroner.

---

## Övning 1: Överlevare från Titanic

**Syfte:** Din perceptron beräknar en matematisk formel. Den kraschar om du matar in text ("male") eller tomma värden (NaN). Här får du öva på rollen som **Data Engineer**: att städa och forma data så att en maskin kan förstå den. Verkligheten för många AI-uppgifter är att detta kan vara en stor del av jobbet.

Målet är binärt: för en given passagerare, gissa om den **överlevde (1) eller dog (0)?**

In [7]:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()

# Ladda datasetet
titanic = pd.read_csv("data/titanic.csv")

# Välj ut relevanta kolumner (Features)
# Survived är vårt FACIT (Target)
df = titanic[["survived", "pclass", "sex", "age", "fare"]]

print("--- Före städning ---")
print(df.head())
print(df.info())  # Notera att 'age' saknar många värden!

--- Före städning ---
   survived  pclass     sex   age     fare
0         0       3    male  22.0   7.2500
1         1       1  female  38.0  71.2833
2         1       3  female  26.0   7.9250
3         1       1  female  35.0  53.1000
4         0       3    male  35.0   8.0500
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 891 entries, 0 to 890
Data columns (total 5 columns):
 #   Column    Non-Null Count  Dtype  
---  ------    --------------  -----  
 0   survived  891 non-null    int64  
 1   pclass    891 non-null    int64  
 2   sex       891 non-null    object 
 3   age       714 non-null    float64
 4   fare      891 non-null    float64
dtypes: float64(2), int64(2), object(1)
memory usage: 34.9+ KB
None


### Data Cleaning (städning)

Vi måste göra tre saker:
1. **Hantera NaN:** Vi kan inte gissa åldern på de som saknar den (just nu). Ta bort rader som saknar data.
2. **Text till siffror:** "male"/"female" måste bli 0/1.
3. **Normalisering:** `age` (0-80) och `fare` (0-500) har helt olika skalor. Vi måste klämma in dem mellan 0-1 så att inte biljettpriset "dränker" all annan info.

In [8]:
# 1. Ta bort rader med saknade värden
df = df.dropna()

# 2. Mappa text till siffror
# Vi gör om 'sex' så att male=0, female=1
df["sex"] = df["sex"].map({"male": 0, "female": 1})

# 3. Normalisera numeriska värden (Min-Max)
df[["age", "fare", "pclass"]] = scaler.fit_transform(df[["age", "fare", "pclass"]])

print("\n--- Efter städning ---")
print(df.head())


--- Efter städning ---
   survived  pclass  sex       age      fare
0         0     1.0    0  0.271174  0.014151
1         1     0.0    1  0.472229  0.139136
2         1     1.0    1  0.321438  0.015469
3         1     0.0    1  0.434531  0.103644
4         0     1.0    0  0.434531  0.015713


### Din uppgift

Träna din Perceptron på Titanic-datan och beräkna noggrannheten.

In [None]:
# Förbered data för träning
X = df[["pclass", "sex", "age", "fare"]].values
y = df["survived"].values

# TODO: Skapa och träna en Perceptron
titanic_perceptron = ... # TODO

# TODO: Beräkna noggrannheten
correct = 0
for inp, target in zip(X, y):
    answer = 0 #TODO
    if round(answer) == target:
        correct += 1

accuracy = correct / len(X)
print(f"Noggrannhet på Titanic: {accuracy * 100:.2f}%")

0.04616005895077058 1.0
-0.31335232010014646 0.0
0.38533820472950553 0.2711736617240512
-0.42415821400603226 0.014151057562208049
0.04616005895077058 0.0
-0.31335232010014646 1.0
0.38533820472950553 0.4722292033174164
-0.42415821400603226 0.13913573538264068
0.04616005895077058 1.0
-0.31335232010014646 1.0
0.38533820472950553 0.32143754712239253
-0.42415821400603226 0.015468569817999833
0.04616005895077058 0.0
-0.31335232010014646 1.0
0.38533820472950553 0.4345312892686604
-0.42415821400603226 0.10364429745562033
0.04616005895077058 1.0
-0.31335232010014646 0.0
0.38533820472950553 0.4345312892686604
-0.42415821400603226 0.015712553569072387
0.04616005895077058 0.0
-0.31335232010014646 0.0
0.38533820472950553 0.6732847449107816
-0.42415821400603226 0.10122885832000206
0.04616005895077058 1.0
-0.31335232010014646 0.0
0.38533820472950553 0.01985423473234481
-0.42415821400603226 0.04113566043083236
0.04616005895077058 1.0
-0.31335232010014646 1.0
0.38533820472950553 0.33400351847197784
-0.

---

## Vad har vi lärt oss?

I denna notebook har vi:

1. Förstått hur en **biologisk neuron** fungerar och hur vi kan modellera den matematiskt
2. Byggt en `Neuron`-klass som kan göra prediktioner baserat på vikter och bias
3. Utökat neuronen till en `Perceptron` som kan **lära sig** från data
4. Testat perceptronen på riktiga dataset (Iris, Titanic)
5. **Upptäckt begränsningen:** Perceptronen kan inte lösa XOR!

## Nästa steg

I nästa notebook ska vi försöka lösa ett nytt problem: **multi-class klassificering**. Vad händer om vi inte bara vill säga "ja eller nej", utan klassificera något i flera kategorier?

Spoiler: En enda perceptron räcker inte...