# Bildanalyse mit dem Dienst für maschinelles Sehen

![Ein Roboter, der ein Bild hält](./images/computer_vision.jpg)

*Maschinelles Sehen* ist ein Teilbereich der künstlichen Intelligenz (KI) für die Entwicklung von KI-Systemen, die die Welt „sehen“ können, entweder in Echtzeit durch eine Kamera oder durch die Analyse von Bildern und Video. Dies ist dadurch möglich, dass Bilder im Grunde genommen nur Arrays von numerischen Pixelwerten sind. Mit diesen Pixelwerten als *Merkmale* können wir Machine Learning-Modelle trainieren, die Bilder klassifizieren, einzelne Objekte in einem Bild erkennen und sogar textbasierte Zusammenfassungen von Fotos generieren.

## Verwenden des Cognitive Service für maschinelles Sehen

Microsoft Azure enthält verschiedene *Cognitive Services*, die gängige KI-Funktionen kapseln, mit denen Sie unter anderem auch Lösungen für maschinelles Sehen entwickeln können.

Der Cognitive Service für *maschinelles Sehen* dient als offensichtlicher Ausgangspunkt für unsere Erkundung von maschinellem Sehen in Azure. Er verwendet vorab trainierte Machine Learning-Modelle, um Bilder zu analysieren und Informationen zu extrahieren.

Angenommen, Northwind Traders möchte einen „Smart Store“ implementieren, der von KI überwacht wird, um zu identifizieren, welche Kunden Unterstützung benötigen, und Mitarbeiter zu diesen Kunden zu schicken. Der Dienst für maschinelles Sehen kann Bilder von den Kameras im Geschäft analysieren und aussagekräftige Beschreibungen der Bilder generieren.

### Erstellen einer Cognitive Services-Ressource

Erstellen Sie zunächst eine **Cognitive Services**-Ressource in Ihrem Azure-Abonnement:

1. Öffnen Sie das Azure-Portal unter „https://portal.azure.com“ in einer neuen Browserregisterkarte, und melden Sie sich mit Ihrem Microsoft-Konto an.
2. Klicken Sie auf die Schaltfläche **&#65291;Ressource erstellen**, suchen Sie nach *Cognitive Services*, und erstellen Sie eine **Cognitive Services**-Ressource mit den folgenden Einstellungen:
    * **Abonnement**: *Ihr Azure-Abonnement*
    * **Ressourcengruppe**: *Wählen Sie eine Ressourcengruppe aus, oder erstellen Sie eine Ressourcengruppe mit einem eindeutigen Namen.*
    * **Region**: *Wählen Sie eine verfügbare Region aus*:
    * **Name**: *Geben Sie einen eindeutigen Namen ein.*
    * **Tarif**: S0
    * **Ich bestätige, dass ich die Hinweise gelesen und verstanden habe**: Ausgewählt
3. Warten Sie, bis die Bereitstellung abgeschlossen ist. Öffnen Sie anschließend Ihre Cognitive Services-Ressource, und klicken Sie auf der Seite **Übersicht** auf den Link zur Schlüsselverwaltung für den Dienst. Sie benötigen den Endpunkt und Schlüssel, um sich aus Clientanwendungen heraus mit Ihrer Cognitive Services-Ressource zu verbinden.

### Abrufen des Schlüssels und Endpunkts für Ihre Cognitive Services-Ressource

Um Ihre Cognitive Services-Ressource verwenden zu können, benötigen Clientanwendungen deren Endpunkt und Authentifizierungsschlüssel:

1. Kopieren Sie im Azure-Portal auf der Seite **Schlüssel und Endpunkt** für Ihre Cognitive Service-Ressource den **Schlüssel1** für Ihre Ressource, und fügen Sie ihn im unten stehenden Code anstelle von **YOUR_COG_KEY** ein.
2. Kopieren Sie den **Endpunkt** für Ihre Ressource, und fügen Sie ihn unten im Code anstelle von **YOUR_COG_ENDPOINT** ein.
3. Führen Sie den unten stehenden Code aus, indem Sie die Zelle auswählen und auf die Schaltfläche **Zelle ausführen** (&#9655;) links neben der Zelle klicken.

In [None]:
cog_key = 'YOUR_COG_KEY'
cog_endpoint = 'YOUR_COG_ENDPOINT'

print('Ready to use cognitive services at {} using key {}'.format(cog_endpoint, cog_key))

Nachdem Sie Schlüssel und Endpunkt eingerichtet haben, können Sie den Dienst für maschinelles Sehen verwenden, um Bilder zu analysieren.

Führen Sie die folgende Zelle aus, um eine Beschreibung des Bilds in der Datei */data/vision/store_cam1.jpg* zu erhalten.

In [None]:
from azure.cognitiveservices.vision.computervision import ComputerVisionClient
from msrest.authentication import CognitiveServicesCredentials
from python_code import vision
import os
%matplotlib inline

# Get the path to an image file
image_path = os.path.join('data', 'vision', 'store_cam1.jpg')

# Get a client for the computer vision service
computervision_client = ComputerVisionClient(cog_endpoint, CognitiveServicesCredentials(cog_key))

# Get a description from the computer vision service
image_stream = open(image_path, "rb")
description = computervision_client.describe_image_in_stream(image_stream)

# Display image and caption (code in helper_scripts/vision.py)
vision.show_image_caption(image_path, description)


Diese Beschreibung erscheint halbwegs brauchbar.

Probieren Sie ein anderes Bild aus.

In [None]:
# Get the path to an image file
image_path = os.path.join('data', 'vision', 'store_cam2.jpg')

# Get a description from the computer vision service
image_stream = open(image_path, "rb")
description = computervision_client.describe_image_in_stream(image_stream)

# Display image and caption (code in helper_scripts/vision.py)
vision.show_image_caption(image_path, description)

Die vorgeschlagene Beschreibung scheint ebenfalls recht genau zu sein.

## Analysieren von Bildmerkmalen

Bisher haben Sie mit dem Dienst für maschinelles Sehen eine Beschreibung für einige Bilder generiert, aber Sie können noch viel mehr erreichen. Mit den Analysefunktionen des Diensts für maschinelles Sehen können Sie ausführliche Informationen extrahieren, wie etwa:

* Die Positionen bestimmter Objekte, die im Bild erkannt wurden.
* Ort und geschätztes Alter von menschlichen Gesichtern im Bild.
* Angabe, ob ein Bild nicht jugendfreie, freizügige oder gewalttätige Inhalte enthält.
* Relevante Tags, die in einer Datenbank dem Bild zugeordnet werden können, um es leichter auffindbar zu machen.

Führen Sie den folgenden Code aus, um ein Bild eines Käufers zu analysieren.

In [None]:
# Get the path to an image file
image_path = os.path.join('data', 'vision', 'store_cam1.jpg')

# Specify the features we want to analyze
features = ['Description', 'Tags', 'Adult', 'Objects', 'Faces']

# Get an analysis from the computer vision service
image_stream = open(image_path, "rb")
analysis = computervision_client.analyze_image_in_stream(image_stream, visual_features=features)

# Show the results of analysis (code in helper_scripts/vision.py)
vision.show_image_analysis(image_path, analysis)

## Weitere Informationen

Neben den in diesem Notebook behandelten Funktionen haben Sie mit dem Cognitive Service für maschinelles Sehen auch die folgenden Möglichkeiten:

* Berühmtheiten in Bildern erkennen.
* Markenlogos in einem Bild erkennen.
* Text in einem Bild mit optischer Zeichenerkennung (Optical Character Recognition, OCR) lesen.

Weitere Informationen zum Cognitive Service für maschinelles Sehen finden Sie in der [Dokumentation zum maschinellen Sehen](https://docs.microsoft.com/azure/cognitive-services/computer-vision/).
