<img src="../Data/images/ZumiHeader.png" width=700>

# Arcfelismerés

<font size =3> Hogyan működik az arcfelismerés? Kezdd azzal, hogy átgondolod, hogyan is érzékeli az ember az arcokat. Szerinted a számítógép ugyanazt csinálja? </font>


## Haar cascade

<font size =3> Mielőtt megnéznél egy arcot, nézzünk meg egy példát, amely kevesebb függvénnyel rendelkezik. Neked nem probléma az alábbi jelzés stoptáblaként történő azonosítása, de honnan tudod, hogy ez egy stoptábla? Milyen nehézségekkel küzd majd meg a számítógép ugyanazon feladat végrehajtása során?
</font>
<br><br>

<img src="../Data/images/blank_stop_sign.png" width=200>

<font size =3> A stoptábla megállapításának legegyszerűbb módja az, ha meghatározott **jellemzőket**, például színt és alakot azonosítunk. Taníthatod a számítógépet a stoptábla felismerésére azáltal, hogy több képet állítasz össze a stoptáblákról, az úgynevezett pozitív képekről, valamint olyan képekről, amelyeken nincsenek stoptáblák, az úgynevezett negatív képekről. A gyártott modell **Haar cascade** néven ismert. Ez a folyamat hasonló ahhoz, ahogyan az emberek tanulnak. Érthetjük úgy is, hogy olyan jeleknek vagyunk kitéve, amelyek stop jelek, és olyan jeleknek, amelyek nem azok.</font>

### Haar jellemzők
<font size =3> A Haar-cascade egy matematikai függvényről lett elnevezve, de Paul Viola és Michael Jones találta fel 2001-ben (Forrás). Az algoritmusukat arra az elképzelésre alapozták, hogy bizonyos jellemzők, úgynevezett **Haar-jellemzők**, objektumokat ábrázolhatnak. <br>
Gondolj vissza a színosztályozással kapcsolatos leckére. Ne feledd, hogy a kép pixelekből áll, és a színes kép minden egyes pixelét általában három szám halmaz képviseli. Most alakítsd át a stoptábla képét szürkeárnyalatosra.

Source: http://www.willberger.org/cascade-haar-explained/ <br> <br>


<img src="../Data/images/convert_stop_sign.png" width=500>

Szürkeárnyalatos képen a három helyett csak egy számra van szükség az egyes képpontok ábrázolásához. A legalacsonyabb érték 0, ami a feketét jelenti, és a legmagasabb érték: 255, ami a fehér színt jelenti. Közöttük bármelyik érték a szürke egyik árnyalata.

<img src="../Data/images/grayscale_values.png" width=500>

Ezt szem előtt tartva kezdheted megtanulni a Haar jellemzőt. A stoptáblán egy bizonyos mintázat világosabb pixelekből áll, amelyek a "STOP" betűit képviselik, és kissé sötétebb pixelek veszik körül őket. Most alkalmazd ezt a koncepciót egy emberi arcra. Az arcoknak több jellemzője van, beleértve a szemet, az orrot és a szájat. Ha több szürkeárnyalatos képet adsz oda a számítógépnek az arcokról, akkor az az átlagos pixelértékekben elkezdi megtalálni a mintát. Az orron lefelé nagyobb valószínűséggel talál egy világosabb pixel oszlopot, amelyet sötétebb pixelek vesznek körül. A számítógép azt is megállapíthatja, hogy a szemünk és a szemöldökök területe általában sötétebb pixelű, mint az arcunk.

<img src="../Data/images/haar_cascade.png" width=500>

Annak ellenére, hogy a számítógép nincs tisztában azzal, hogy mit néz, bizonyos elrendezésekben képes látni a pixelérték-mintákat (például az orrod nem lehetne a szemed felett), hogy besorolja a képet emberi arcnak. Ezek azok a Haar-jellemzők, amelyeket a program keresni fog, ha új, soha nem látott képet mutatnak neki.</font>

## Kód
<font size =3> A Haar Cascade megtanítása időigényes. Ahhoz, hogy igazán jó osztályozót készíts, több ezer pozitív és negatív képre és némi számítási teljesítményre van szükség. Az arcok észleléséhez a cascade fájlt már biztosítottuk neked! Ez egy fájl, több ezer sornyi kóddal, amely tartalmazza az összes információt annak osztályozásához, amit fel kell tudni ismernie. </font>

### Könyvtárak importálása
<font size =3>Először importálnod kell az összes szükséges könyvtárat. Szükséged lesz a fényképezőgép könyvtárára a képek készítéséhez, a látás könyvtárra az arcok felismerésére és a képernyő könyvtárra a képernyőn történő rajzoláshoz. </font>

In [None]:
from zumi.util.camera import Camera 
from zumi.zumi import Zumi
from zumi.util.screen import Screen
from zumi.util.vision import Vision
import time


zumi = Zumi()
camera = Camera()
screen = Screen()
vision = Vision()

Starting Zumi 
Pi Zero I2C is available
Verified Pi Zero is the same
Gyroscope previously calibrated
Zumi board detected
Compass detected
OLED Screen detected
Gyroscope & Accelerometer detected


### Konvertálás szürkeárnyalatosra és find_face()

<font size=3> Ahhoz, hogy a Haar cascade kiszámítsa a képpont-különbségeket, szürkesképes képre van szüksége. A látáskönyvtárban van egy olyan funkció, amelyet használhatsz, ami elfogadja a képparamétert, és ugyanazt a képet szürkeárnyalatban adja vissza. Például, ha képet készítesz és mented az <font face="Courier">image</font> mappába, a színes képet szürkeárnyalattá alakíthatod. Lásd a 4.1 leckét, ha ismétlésre van szükséged!<br>

<font face="Courier"> image = vision.convert_to_gray(image) </font> <br><br>
   
**Megjegyzés:** A számítógép látás könyvtára mindig szürkeárnyalatossá alakítja át a képet a háttérben, de jó dolog a képet magadtól átalakítani, emlékeztetőül a Haar Cascade működésére. <br><br>
    
Most a kép szürkeárnyalatos változatát használhatod a <font face="Courier">vision.find_face()</font> függvénnyel. Ez a függvény megkeresi a Haar jellemzőket, amelyek egy arcot mutatnak, és négyzetet rajzolnak az algoritmus által talált arcok köré. Így használhatod a függvényt:

<font face="Courier"> vision.find_face(image)</font><br>
    
Végül ne felejtsük el a képet a képernyőn megjeleníteni a <font face="Courier"> camera.show_image()</font> függvénnyel. Ha át szeretnéd nézni a kamera bármely függvényét, olvasd el a 4.1. leckét. </font> 
<br><br>

### Pszeudokód
<font size=3> Tudjuk, hogy ez sok információ, amit meg kell jegyezni, ezért hagytunk neked néhány pszeudokódot! <br> 
    
<font face="Courier"> 
Start camera <br>
take an image<br>
close the camera<br>
convert the image to gray<br>
use find_face() to find a face<br>
show the image

In [None]:
# Írd ide a kódot az arc észleléséhez

## Paraméterek módosítása
<font size=3> Próbálj fényképeket készíteni nagyon közelről és nagyon távolról. Mennyire közel kell lennie az arcodnak ahhoz, hogy a kamera arcnak minősítse? Milyen messze? A Haar cascade-nak vannak olyan alapértelmezett értékei, amelyek meghatározzák, hogy az algoritmusa mennyire lesz képes az arcok észlelésére. Felhasználási eseteitől függően ezek megváltoztathatók.</font>
    
### minSize

<font size=3> A minimális méret beállításánál csak azokat az arcokat adja vissza, amelyeket nagyobbnak talál (x, y) területnél. </font>

### maxSize

<font size=3> A maximális méret beállításánál csak azokat az arcokat adja vissza, amelyeket kisebbnek talál, mint (x, y). </font>

### minNeighbors

<font size=3> Minden jellemző egy téglalap pixel. A szomszédok olyan tulajdonságok, amelyek hasonlóak. Ha növeled ezt a számot, kevesebb arcot érzékel, mivel az arc követelményeinek való megfelelés feltételei több hasonló jellemzőt igényelnek. </font>

### scaleFactor
<font size=3> A Színek és Jelek leckében említettük, hogy a képek méretét gyakran csökkentik a tanulás megkönnyítése érdekében. Ez számítási szempontból nehéz folyamat, ezért alapértelmezés szerint a kép 5%-kal csökken minden skálán.
    
Itt van a teljes függvény az összes alapértelmezett paraméterrel: <br> <br>  
    
<font face="Courier">vision.find_face(image, scale_factor = 1.05, min_neighbors=8, min_size=(40,40))</font><br><br>

Kezdd el lassan megváltoztatni a számokat, és nézd meg, hogyan befolyásolja ez az arcfelismerési algoritmust. Keress olyan tárgyakat, amelyek arcnak tűnhetnek. Ha megváltoztatod a paramétereket, meg tudja különböztetni a számítógép a valós arcot és a tárgyat?
    
Bónusz: Írd be a kódot egy for ismétlődő parancssorba, hogy videóként mutassa meg az arcfelismerést!

In [None]:
# Írd ide a kódot, ami módosítja ezeket a paramétereket.

## Döntéshozatal
<font size = 3> Ebben a tevékenységben Zümi rád fog figyelni. Kódot fogsz írni ahhoz, hogy Zümi szemei ​​kövessék az arcodat, amikor az a keret középső, bal vagy jobb oldalán van. Ha Zümi nem lát téged,