# Mi az a TensorFlow?

A **TensorFlow** egy **nyílt forráskódú programkönyvtár**, amit a **Google fejlesztett**, és leginkább **gépi tanuláshoz** (különösen **mélytanuláshoz**) használnak.

---

## 🤖 Egyszerűen fogalmazva:

A TensorFlow segít a számítógépnek **adatokból tanulni**, például:
- képfelismerést,
- hangfelismerést,
- vagy előrejelzéseket készíteni.

---

## 🧠 Mire jó?

- **Neurális hálók** építésére és futtatására  
- **Adatok feldolgozására**
- **Modellek betanítására és kiértékelésére**

---

## 🧮 Miért hívják így?

- **Tensor** = adat (sokdimenziós tömb)
- **Flow** = adatáramlás (ahogy az adatok végighaladnak a modell különböző részein)

> Tehát a TensorFlow olyan, mint egy „csőrendszer”, amiben az adatok (tenzorok) végigfolynak, és közben „okosodnak”.

---

In [1]:
# Be importáljuk a szükséges könyvtárakat
import numpy as np 
import pandas as pd
import tensorflow as tf

# 📦 Tenzorok

A *tenzor* a vektorok és mátrixok általánosítása, amely lehetővé teszi magasabb dimenziójú adatok kezelését is.  
A TensorFlow belsőleg a tenzorokat **alapadat-típusokból álló n-dimenziós tömbökként (tömb = array)** reprezentálja.

---

## 🧠 Miért fontosak?

A tenzorok a **TensorFlow alapegységei**. Ezek az objektumok azok, amelyeket a program során folyamatosan **továbbadunk** és **manipulálunk**.

Minden tenzor egy részlegesen meghatározott számítást képvisel, amely a végén egy konkrét értéket fog eredményezni.  
A TensorFlow programok úgy működnek, hogy egy **gráfot (hálózatot)** építenek fel tenzor objektumokból, amely meghatározza, hogyan kapcsolódnak egymáshoz ezek a tenzorok.  
A gráf különböző részeinek futtatásával állítható elő a kívánt eredmény.

---

## 🔢 Tenzorok tulajdonságai

Minden tenzornak van:

- **Adat típusa (dtype)** – például:
  - `float32`
  - `int32`
  - `string`
  - és mások

- **Alakja (shape)** – az adat dimenzióit jelenti  
  (pl. hány sor, hány oszlop, vagy többdimenziós struktúra)

---

## ➕ Műveletek

Csakúgy, mint a vektorokkal és mátrixokkal, a tenzorokkal is végezhetünk különféle műveleteket:

- Összeadás
- Kivonás
- Szorzás (dot, cross)
- Transzponálás
- stb.

---

# Diabétesz előrejelzés Neurális Hálóval
Megvizsgáljuk az adathalmazunkat

In [2]:
df = pd.read_csv("adatok/diabetes.csv", header = None)
df.head()

Unnamed: 0,0,1,2,3,4,5,6,7,8
0,6,148,72,35,0,33.6,0.627,50,1
1,1,85,66,29,0,26.6,0.351,31,0
2,8,183,64,0,0,23.3,0.672,32,1
3,1,89,66,23,94,28.1,0.167,21,0
4,0,137,40,35,168,43.1,2.288,33,1


In [3]:
# 1) Adat betöltés arraybe (Olyasmi mint egy Dataframe vagy lista)
dataset = np.loadtxt("adatok/diabetes.csv", delimiter=",")
dataset

array([[  6.   , 148.   ,  72.   , ...,   0.627,  50.   ,   1.   ],
       [  1.   ,  85.   ,  66.   , ...,   0.351,  31.   ,   0.   ],
       [  8.   , 183.   ,  64.   , ...,   0.672,  32.   ,   1.   ],
       ...,
       [  5.   , 121.   ,  72.   , ...,   0.245,  30.   ,   0.   ],
       [  1.   , 126.   ,  60.   , ...,   0.349,  47.   ,   1.   ],
       [  1.   ,  93.   ,  70.   , ...,   0.315,  23.   ,   0.   ]])

# 🧠 Neurális háló, modell és tenzorok – Egyszerű áttekintés

## 🔹 Mi az a neurális háló?

A neurális háló (neural network) egy olyan számítógépes modell, amely képes **adatokból tanulni**.  
A működése nagyvonalakban az emberi agy idegsejtjeihez (neuronjaihoz) hasonlít.

### A neurális háló rétegei:

[Bemeneti réteg] → [Rejtett réteg(ek)] → [Kimeneti réteg]

- **Bemeneti réteg**: Az adatok belépési pontja (pl. életkor, vérnyomás, BMI stb.)
- **Rejtett rétegek**: feldolgozzák az adatokat, megtanulják a mintákat
- **Kimeneti réteg**: válaszadás (pl. "cukorbeteg" vagy "nem cukorbeteg")

---

## 🏗️ Mi az a modell?

A **modell** a neurális háló felépített struktúrája, amely a rétegeket és azok kapcsolatait tartalmazza.

A TensorFlow `tf.keras.models.Sequential()` osztálya lehetővé teszi, hogy a rétegeket **egymás után, sorban** hozzáadjuk a modellhez.

---

In [6]:
# 2) Bemenet (X) = első 8 oszlop, kimenet (Y) = 9. oszlop (0: nem cukorbeteg, 1: cukorbeteg)
X = dataset[:, 0:8]
Y = dataset[:, 8]

# 3) Modell építése – rétegek sorba rendezése
# A Sequential() modell azt jelenti, hogy a rétegek sorban követik egymást:
# az egyik réteg kimenete a következő réteg bemenete lesz.

# Itt még nincsenek neuronok, csak egy keret, amibe majd beleteszed őket.
model = tf.keras.models.Sequential()

# input réteg input_dim = mekkora bemenetet vár (8 jellemző)
model.add(tf.keras.layers.Dense(25, input_dim=8, activation="relu")) # relu --> gyorsan tanul és ha a bemenet pozitív akkor megtartja, amúgy nulla 
# Rejtett réteg – 50 neuron (megj.: 100‑nál ~87 %, 500‑nál ~95 % pontosság)
model.add(tf.keras.layers.Dense(500, activation="relu")) 
# kimeneti réteg
model.add(tf.keras.layers.Dense(1, activation="sigmoid")) # sigmond --> Valószínűségi értékeket ad (0–1 között), így értelmezhető „igen vagy nem” válaszként

In [7]:
# 4) Fordítás – veszteség, optimalizáló, metrika
model.compile(loss="binary_crossentropy", optimizer="adam", metrics=["accuracy"])

# 5) Tanítás – 150 epoch, batch = 10  (back‑propagation) - Hányszor járja be a tanítást
model.fit(X, Y, epochs=500, batch_size=10)

# 6) Kiértékelés teljes adathalmazon
scores = model.evaluate(X, Y)
print("\n%s: %.2f%%" % (model.metrics_names[1], scores[1] * 100))

# ---------------------------------------------------------------------------
# 7) Példa‑előrejelzés (rögzített tesztminta)
# ---------------------------------------------------------------------------
teszt_adatok = np.array([1., 85., 66., 29., 0., 26.6, 0.351, 31.])
predikcio = model.predict(np.array(teszt_adatok, ndmin=2))
print(predikcio)

if predikcio < 0.7:
    print("A páciens nem cukorbeteg")
else:
    print("A páciens cukorbeteg")


Epoch 1/500
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - accuracy: 0.5679 - loss: 3.1099
Epoch 2/500
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.6307 - loss: 0.8079
Epoch 3/500
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.6598 - loss: 1.0058
Epoch 4/500
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.6582 - loss: 0.8159
Epoch 5/500
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 5ms/step - accuracy: 0.6487 - loss: 0.7986
Epoch 6/500
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - accuracy: 0.6736 - loss: 0.7354
Epoch 7/500
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - accuracy: 0.6491 - loss: 1.0235
Epoch 8/500
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.6592 - loss: 0.8286
Epoch 9/500
[1m77/77[0m [32m━━━━━━━━━━━━━━━━━