-
Notifications
You must be signed in to change notification settings - Fork 0
/
Detektion_Dirigiermuster.py
244 lines (193 loc) · 11.1 KB
/
Detektion_Dirigiermuster.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
# -*- encoding: utf-8 -*-
# Technische Universität Berlin
# mathematisch-naturwissenschaftliches Labor Mathesis
# die 'Dirigieren'-Gruppe
from __future__ import division
from scipy import misc, ndimage
from mpl_toolkits.mplot3d import Axes3D
import math as m
import random
import time
#from time import *
import matplotlib.pyplot as plt
import numpy as np
import cv2
import sys
from copy import deepcopy
import pickle
import turtle as turtle
def figur_finden(zu_untersuchen, figur): #diese Funktion versucht Figuren im Dirigat zu erkennen. Dafuer bekommt sie die Figurvektoren in richtiger Reihenfolge, sowie die Liste mit den dirigierten Vektoren uebergeben
figurlaenge = len(figur)
zu_untersuchen_kurz = [] #Diese Liste soll die letzten dirigierten Vektoren enthalten, die wichtig sind
for i in range(figurlaenge,0,-1):
zu_untersuchen_kurz.append(zu_untersuchen[-i]) #letzten Eintraege werden ermittelt
zu_untersuchen_kurz = np.array(zu_untersuchen_kurz) #zur weiteren Verarbeitung Konvertierung in Array
figurensammlung = [] #verschiedene Kombinationen werden angelegt, schwierig sich das ohne zeichnung vorzustellen. Bsp.: aus [1,2,3] wird [[1,2,3],[2,3,1],[3,2,1]]
tmp = figur
for i in range(figurlaenge):
tmp.append(tmp[0])
del(tmp[0])
anhaengen = deepcopy(tmp)
figurensammlung.append(anhaengen)
figurensammlung = np.array(figurensammlung) #zur weiteren Verarbeitung Konvertierung in Array
for i in range(figurlaenge): #Der Vergleich findet statt
if np.array_equiv(figurensammlung[i],zu_untersuchen_kurz): #elementweises Vergleichen von letztem Dirigat und verschiedenen Figur-Kombinationen
return True #falls Figur gefunden
return False #falls Figur nicht gefunden
def zeichne_rechteck(frame, position, farbe, dicke=2): #Funktion, welche ein Rechteck zeichnet
x, y, w, h = position
cv2.rectangle(frame, (x, y), (x+w, y+h), farbe, dicke)
def color_rec(frame): #Funktion, welche eine nach Farbe definierte Stelle ermittelt
hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV) #konvertiert frame in hsv
lower = np.array([hue_min, sat_min, val_min]) #legt untere schranke fest
upper = np.array([hue_max, sat_max, val_max]) # legt obere schranke fest
#Die Wert aus den Schranken werden aus globalen Variablen gezogen
mask = cv2.inRange(hsv, lower, upper) #erstellt maske, welche für werte innerhalb des intervalls
#den wert 1 annimmt, sonst 0
y_werte, x_werte = np.where(mask == 255) #Es werden die x- und y-Werte ausgelesen, welche ein True (255) bekomen haben
if len(x_werte) != 0 and len(y_werte) != 0:
y_mittel = int(np.mean(y_werte)) #Es wird der Mittelwert aus allen y-Werten gebildet
x_mittel = int(np.mean(x_werte)) #Es wird der Mittelwert aus allen x-Werten gebildet
position = (x_mittel, y_mittel) #Die Mittlere Position aller Trues entspricht dem Tupel beider Mittelwerte
else:
position = (0,0)
if position == (0,0): #Sollten keine Trues gefunden werden (Gesamtmittelwert = (0,0))
x_shape, y_shape, _ = frame.shape #Es werden die Bildmaße ausgelesen
position = (x_shape//2,y_shape//2) #Als Position wird der Bildmittelpunkt gewählt
return position #Ergebnis wird zurückgegeben
def zeichne_kreis(frame, position): #Funktion, welche einen Kreis zeichnet
cv2.circle(frame,position, 25, (0,0,255), 4)
def vektor_berechnung(old, new, schwellenwert):
diff = new-old #Differenz alte und neue Position
if abs(diff) <= schwellenwert: #unterhalb des Schwellenwertes werden keine Veraenderungen detektiert
return 0
if diff < -schwellenwert: #Veränderung Richtung negativ
return -1
if diff > schwellenwert: #Veränderung Richtung positiv
return 1
def schwellenwerte_festlegen(cap):
erfolgt = False #wurde b schon gedrückt?
while(erfolgt == False): #Schleife während des Zurechtrückens des Benutzers
ret, frame = cap.read()
y_shape, x_shape, z_shape = frame.shape
zeichne_kreis(frame, (x_shape//2, y_shape//2)) #Kreis wird in der Bildmitte angezeigt
frame = cv2.flip(frame,1) #Spiegelung des frames an der Horizontalen
cv2.putText(frame, 'Bitte halten Sie das Objekt hinter der Kreis und druecken Sie dann b.',(5, y_shape-5), 1, 1, (0, 0, 0), 1) #Hinweis für den Benutzer
cv2.imshow('frame', frame)
if cv2.waitKey(1) & 0xFF == ord('b'): #Signal, dass in Position, über das Drücken von b
break
ret, frame = cap.read() #frame ohne Kreis wird geholt
zu_unt = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV) #Konvertierung in hsv
radius = 25 #Radius des zu untersuchenden Kreises
liste_kreisinhalt = [] #diese Liste soll alle Pixel enthalten, die innerhalb des Kreises liegen
for i in range(x_shape): #das Bild wird pixelweise durchgegangen. Wenn der Pixel im Bild liegt, wir dieser registriert
for j in range(y_shape):
if np.sqrt((x_shape//2-i)**2+(y_shape//2-j)**2) < radius: #Hier Satz des Pythagoras zur Entfernungsbestimmung Pixel--Kreismittelpunkt
liste_kreisinhalt.append(zu_unt[j][i])
array_kreisinhalt = np.array(liste_kreisinhalt) #Konvertierung in Array zur weiteren Verarbeitung
hue = array_kreisinhalt[:,0] #Liste mit allen hue-Werten wird angelegt
sat = array_kreisinhalt[:,1] #Liste mit allen sat-Werten wird angelegt
val = array_kreisinhalt[:,2] #Liste mit allen val-Werten wird angelegt
#Berechung der Grenzen erfolgt, wie folgt. Zuerst wird der Mittelwert aller Werte einer Eigenschaft gebildet.
#Als nächstes wird jeweils die Standartabweichung ermittelt.
#Die untere Schranke ist dann einfach der Mittelwert - die Standartabweichun
#Die obere Schranke ist einfach der Mittelwert + die Standartabweichung.
#Die Ergebnisse werden zur direkten Weiterverwendung in globale Variablen geschrieben.
#Zur verwendung nach einem Programmneustart werden sie in eine datei ausgelagert.
global hue_min #globale Variable wird angelegt
hue_min = int(np.mean(hue) - np.std(hue)) #Wert wird ermittelt
global hue_max
hue_max = int(np.mean(hue) + np.std(hue))
global sat_min
sat_min = int(np.mean(sat) - np.std(sat))
global sat_max
sat_max = int(np.mean(sat) + np.std(sat))
global val_min
val_min = int(np.mean(val) - np.std(val))
global val_max
val_max = int(np.mean(val) + np.std(val))
sicherung = (hue_min,hue_max,sat_min,sat_max,val_min,val_max) #erzeuge Datensatztupel zur Abspeicherung für Pickle
output = open('hsv_werte.pkl', 'w') #die Ausgabedatei wird vorbereitet
pickle.dump(sicherung, output) #die Daten werden geschrieben
output.close() #der Output wird geschlossenr
def schwellenwerte_einlesen():
global hue_min #die Schwellenwerte werden als global definiert
global hue_max
global sat_min
global sat_max
global val_min
global val_max
try: #es wird versucht / festgestellt, ob es bereits eine Datei mit gespeicherten Schwellenwerten gibt
f = open("hsv_werte.pkl") #falls ja wird diese geoeffnet
sicherung = pickle.load(f)
hue_min, hue_max, sat_min, sat_max, val_min, val_max = sicherung #und die Daten entpackt
except: #falls nein, werden sehr komische Werte festgelegt, damit der Benutzter das Programm kalibriert
val_max = 1
val_min = 0
sat_max = 1
sat_min = 0
hue_max = 1
hue_min = 0
###============Beginn eigentliches Programm===================###
def main():
schwellenwerte_einlesen() #Schwellenwerte werden zu beginn festgelegt (für hsv)
global position #Variable, welche die Frames durchläuft
position = 0
cap = cv2.VideoCapture(0) #Angeschlossene Kamera wird geöffnet
ret, frame = cap.read() #Erster Frame wird abgerufen
y_shape, x_shape, z_shape = frame.shape #Videomaße für den Kopfentwicklungspunkt werden ausgelesen
global stab #Liste der Taktstockpositionen
stab = []
global figuren_anz
figuren_anz = 0
versch_vec = [(0,0),(0,0)] #Liste der vollzogenen Bewegungsvektoren
koordinaten = [(0,0),(0,0)] # Liste mit Koordinaten der Eckpunkte
lautstaerke = 0
while(True):
ret, frame = cap.read() #Holt Frame
stab.append(color_rec(frame)) #Ermittelte Taktstockposition wird registriert
zeichne_kreis(frame,stab[position]) #Kreis wird an aktueller Taktstockposition gezeichnet
stab_x, stab_y = stab[position-1] #die aktuellen Daten werden aus der Taktstockposition extrahiert
dynamik_aufruf = 0 # Variable die, 1 ist, wenn eine Ecke erkannt wurde (versch_vec-aenderung), und 0, wenn keine Ecke erkannt wurde
if position > 1: #ab dieser Position gibt es verwendbare Daten zur Vektorberechnung
stab_x_old, stab_y_old = stab[position-2] #Letzte Positon
x_vec = vektor_berechnung(stab_x_old,stab_x,30) #die beiden eindimensionalen Vektoren werden ermittelt (mit der Zeit zweidim)
y_vec = vektor_berechnung(stab_y_old,stab_y,30)
vektor = (x_vec,y_vec) #aus diesen wird ein zweidimensionaler gemacht (mit der Zeit dreidim)
if vektor != versch_vec[-1] and vektor != (0,0): #zur letzten Posiion identische Vektoren und Nullvektoren werden nicht registriert
versch_vec.append(vektor)
if figuren_anz >=2:
ort = (stab_x,stab_y)
koordinaten.append(ort)
dynamik_aufruf = 1
frame = cv2.flip(frame,1) #Spiegelung des frames an der Horizonatalen
if len(versch_vec) > 4: #Die Figuranalyse startet, wenn genügend Vektoren zum Vergleichen abgespeichert sind
if figur_finden(versch_vec, [(0, -1), (1, 0), (0, 1), (-1, 0)]): #Es wird nach der übergebenen Figur gesucht
cv2.rectangle(frame,(x_shape-30,y_shape-30),(x_shape-60,y_shape-60),(255,225,0),4) #Falls die Figur gefunden wurde wird ein Rechteck gezeichnet
figuren_anz = figuren_anz +1
if figur_finden(versch_vec, [(-1, 0), (0, 1), (1, 0),(0, -1)]): #Hier das Rechteck nochmal in anderer Drehrichtung
cv2.rectangle(frame,(x_shape-30,y_shape-30),(x_shape-60,y_shape-60),(255,0,225),4)
figuren_anz = figuren_anz +1
if figur_finden(versch_vec, [(1,1),(-1,0),(0,-1)]): # rechter Winkel unten rechts, von rechts oben
cv2.putText(frame, 'Dreieck', (5, y_shape - 5), 1,1, (255,255,0), 1)
if figur_finden(versch_vec, [(-1,-1),(0,1),(1,0)]): # rechter Winkel unten rechts, von rechts unten
cv2.putText(frame, 'Dreieck', (5, y_shape - 5), 1,1, (255,0,225), 1)
if figur_finden(versch_vec, [(1,-1),(-1,0),(0,1)]): # rechter Winkel unten links, von links unten
cv2.putText(frame, 'Dreieck', (5, y_shape - 5), 1,1, (255,0,225), 1)
if figur_finden(versch_vec, [(-1,1),(0,-1),(1,0)]):
cv2.putText(frame, 'Dreieck', (5, y_shape - 5), 1,1, (255,0,225), 1) # rechter Winkel unten links, von links oben
if figur_finden(versch_vec, [(0,1),(0,-1)]):
cv2.putText(frame, 'Strich', (5, y_shape - 5), 1,1, (255,0,225), 1)
if position < 120: #Benutzerinstruktionen in den ersten 120 frames
cv2.putText(frame, 'zum kalibrieren s druecken und zum beenden q.', (5, y_shape - 5), 1,1, (0, 0, 0), 1)
position +=1 #Framenummer wird um 1 erhöht
cv2.imshow('frame',frame) #Ergebnis wird angezeigt
if cv2.waitKey(1) & 0xFF == ord('q'): #'q' zum Beenden drücken
break
if cv2.waitKey(1) & 0xFF == ord('s'): # schwellenwerte festlegen
schwellenwerte_festlegen(cap)
cap.release()
cv2.destroyAllWindows()
#THE ENDE
if __name__ == "__main__":
main()