# Watson IBM API

Watson ist ein Computerprogramm aus dem Bereich der Künstlichen Intelligenz. Es wurde von IBM entwickelt, um Antworten auf Fragen zu geben, die in digitaler Form in natürlicher Sprache eingegeben werden. Mittlerweile bietet IBM verschiedenste Künstliche Intelligenz Algorithmen an, welche man mit einer API "relativ" einfach abfragen kann.

Es gibt eine Python Bibliothek die eine Schnittstelle zu den Services von Watson bereitstellt. Hier der direkte [Link](https://github.com/watson-developer-cloud/python-sdk). Am besten installiert man sie im Terminal mit:

```
pip install --upgrade watson-developer-cloud
```

Nach der Installation, muss man das Jupyter Notebook schliessen bzw. beenden (CTRL+C) und den Terminal ebenso. Danach wieder das Terminal Programm starten und stellt sicher dass eure Python Umgebung korrekt ist.

```
source activate blockwoche
```


## Gesichtserkennung

Bei der Gesichtserkennung kann man ein Bild an den Watson Server schicken, welcher es mit einem Gesichtserkennungs-Algorithmus interpretiert und die Resultate in Textform zurückgibt. 

Zunächst müssen einige Bibliotheken in Python importiert werden:

In [3]:
import json
from os.path import join, dirname
from os import environ
from watson_developer_cloud import VisualRecognitionV3

Danach muss eine Variable initialisert werden, welche als Objekt/Interface zum Watson verschiedenste Methoden anbietet. Dabei muss auch der Developer Key angegeben werden.

In [4]:
visual_recognition = VisualRecognitionV3('2016-05-20', api_key='a5c120b7f1e3c757f64b0ba87af00b2d8283c8f6')

Falls der API key ungültig ist, dann bekommt ihr eine Fehlermeldung in der oberen Zeile. Ihr müsst in eurem [Bluemix](https://console.bluemix.net) nachsehen, ob ihr eine Applikation für Image Recognition angemeldet habt.

Das Objekt **visual_recognition** bietet nun verschiedene Funktionen an.

In [7]:
print (visual_recognition.version)


2016-05-20


Nun kann man eine Funktion **detect_faces** abrufen. Man muss ihr aber einen Link zu einem File schicken mit dem Parameter **images_url**. Das ganze wird in der Variable resultat gespeichert:

{u'images': [{u'source_url': u'https://www.trend.at/_storage/asset/5523414/storage/vgnat:twocolumn_930:575/file/76775962/merkel-roboter.jpg', u'resolved_url': u'https://www.trend.at/_storage/asset/5523414/storage/vgnat:twocolumn_930:575/file/76775962/merkel-roboter.jpg', u'faces': [{u'gender': {u'gender': u'FEMALE', u'score': 0.0179862}, u'age': {u'score': 0.492712, u'min': 65}, u'face_location': {u'width': 209, u'top': 103, u'left': 530, u'height': 215}}]}], u'images_processed': 1}


Das Ergebnis ist nun wieder im JSON Format. Mit der Funktion **json** kann man die Textausgable etwas übersichtlicher gestalten:

In [20]:
print(json.dumps(resultat, indent=2))

{
  "images": [
    {
      "source_url": "https://www.trend.at/_storage/asset/5523414/storage/vgnat:twocolumn_930:575/file/76775962/merkel-roboter.jpg", 
      "resolved_url": "https://www.trend.at/_storage/asset/5523414/storage/vgnat:twocolumn_930:575/file/76775962/merkel-roboter.jpg", 
      "faces": [
        {
          "gender": {
            "gender": "FEMALE", 
            "score": 0.0179862
          }, 
          "age": {
            "score": 0.492712, 
            "min": 65
          }, 
          "face_location": {
            "width": 209, 
            "top": 103, 
            "left": 530, 
            "height": 215
          }
        }
      ]
    }
  ], 
  "images_processed": 1
}


Bei der Antwort handelt es sich um Pyhton Dictionary. Bei einem Dictionary gibt es immer ein Key/Value Pair. Der Key ist "images" und der Value besteht eigentlich aus einem Array. Um nun nur das Gender anzeigen zu lassen, muss man das Ergebnis etwas filtern. 

In [30]:
print resultat["images"][0]["faces"][0]["gender"]

{u'gender': u'FEMALE', u'score': 0.0179862}


Um tatsächlich nur das Geschlecht anzuzuzeigen braucht man folgendes:

In [31]:
print resultat["images"][0]["faces"][0]["gender"]["gender"]

FEMALE


Oder das Alter:

In [34]:
print resultat["images"][0]["faces"][0]["age"]["min"]

65


Hier der ganze Code um das Geschlecht bzw. Alter der Person zu ermitteln:

In [35]:
import json
from os.path import join, dirname
from os import environ
from watson_developer_cloud import VisualRecognitionV3

visual_recognition = VisualRecognitionV3('2016-05-20', api_key='a5c120b7f1e3c757f64b0ba87af00b2d8283c8f6')

resultat = visual_recognition.detect_faces(images_url="https://www.trend.at/_storage/asset/5523414/storage/vgnat:twocolumn_930:575/file/76775962/merkel-roboter.jpg")
print(json.dumps(resultat, indent=2))

{
  "images": [
    {
      "source_url": "https://www.trend.at/_storage/asset/5523414/storage/vgnat:twocolumn_930:575/file/76775962/merkel-roboter.jpg", 
      "resolved_url": "https://www.trend.at/_storage/asset/5523414/storage/vgnat:twocolumn_930:575/file/76775962/merkel-roboter.jpg", 
      "faces": [
        {
          "gender": {
            "gender": "FEMALE", 
            "score": 0.0179862
          }, 
          "age": {
            "score": 0.492712, 
            "min": 65
          }, 
          "face_location": {
            "width": 209, 
            "top": 103, 
            "left": 530, 
            "height": 215
          }
        }
      ]
    }
  ], 
  "images_processed": 1
}


## Image Classification

Hier wird Maschinelles Lernen (machine learning) angewendet, um sogenannte Keywords aus einem Bild herauszulesen. Der Computer "sieht" das Bild und gibt kontextspezifische Keywords zurück. Der Watson Computer wurde mit einer riesigen Menge an Bildern gefüttert. Man kann nun ein Bild an die Watson API schicken und der Computer (mit extrem hoher Rechenkraft) versucht es zu analysieren und danach mit einem neuralen Netzwerk zu interpretieren.  

Man muss wie gehabt zunächst die Bibliotheken importieren:

In [None]:
import json
from os.path import join, dirname
from os import environ
from watson_developer_cloud import VisualRecognitionV3

Danach erzeuge wir wieder die Schnittstelle mit der Watson API

In [None]:
visual_recognition = VisualRecognitionV3('2016-05-20', api_key='a5c120b7f1e3c757f64b0ba87af00b2d8283c8f6')

Nun kann man die **classify** Funktion aufrufen mit einem Link zu einem Bild:

In [38]:
bildLink = "http://feelectronica.de/wp-content/uploads/2015/07/TechnoViking.jpg"

In [39]:
print(json.dumps(visual_recognition.classify(images_url=bildLink), indent=2))

{
  "images": [
    {
      "classifiers": [
        {
          "classes": [
            {
              "score": 0.572, 
              "class": "Demonstration", 
              "type_hierarchy": "/person/Demonstration"
            }, 
            {
              "score": 0.678, 
              "class": "person"
            }, 
            {
              "score": 0.569, 
              "class": "people", 
              "type_hierarchy": "/person/people"
            }, 
            {
              "score": 0.521, 
              "class": "marcher", 
              "type_hierarchy": "/person/traveler/marcher"
            }, 
            {
              "score": 0.523, 
              "class": "traveler"
            }, 
            {
              "score": 0.52, 
              "class": "shofar (musical horn)", 
              "type_hierarchy": "/horn/shofar (musical horn)"
            }, 
            {
              "score": 0.52, 
              "class": "horn"
            }, 
            {
  

Um die Resultate ein wenig besser auszulesen, müssen wir die JSON Antwort ein wenig filtern. Dazu speichere ich mal die ganze Antwort in einer Variablen:

In [43]:
resultat = visual_recognition.classify(images_url=bildLink)

Danach kann man über die eckigen Klammern, einzelne Werte aus der Antwort herausfiltern.  

In [52]:
resultat["images"][0]["classifiers"][0]["classes"]

[{u'class': u'Demonstration',
  u'score': 0.572,
  u'type_hierarchy': u'/person/Demonstration'},
 {u'class': u'person', u'score': 0.678},
 {u'class': u'people', u'score': 0.569, u'type_hierarchy': u'/person/people'},
 {u'class': u'marcher',
  u'score': 0.521,
  u'type_hierarchy': u'/person/traveler/marcher'},
 {u'class': u'traveler', u'score': 0.523},
 {u'class': u'shofar (musical horn)',
  u'score': 0.52,
  u'type_hierarchy': u'/horn/shofar (musical horn)'},
 {u'class': u'horn', u'score': 0.52},
 {u'class': u'crowd', u'score': 0.5, u'type_hierarchy': u'/people/crowd'},
 {u'class': u'alizarine red color', u'score': 0.801}]

Diesen Output speichere ich auch wieder in einer Variablen (zwecks besserer übersichtlichkeit)

In [56]:
classes = resultat["images"][0]["classifiers"][0]["classes"]

Mit einer Schleife kann ich das ganze wieder auslesen: (Achtung class kann man nicht verwenden, weil es ein spezielles Wort in Python bedeutet):

In [57]:
for beschreibung in classes:
    print beschreibung

{u'score': 0.572, u'class': u'Demonstration', u'type_hierarchy': u'/person/Demonstration'}
{u'score': 0.678, u'class': u'person'}
{u'score': 0.569, u'class': u'people', u'type_hierarchy': u'/person/people'}
{u'score': 0.521, u'class': u'marcher', u'type_hierarchy': u'/person/traveler/marcher'}
{u'score': 0.523, u'class': u'traveler'}
{u'score': 0.52, u'class': u'shofar (musical horn)', u'type_hierarchy': u'/horn/shofar (musical horn)'}
{u'score': 0.52, u'class': u'horn'}
{u'score': 0.5, u'class': u'crowd', u'type_hierarchy': u'/people/crowd'}
{u'score': 0.801, u'class': u'alizarine red color'}


In [None]:
Um jede einzele Beschreibung nun auszulesen, kann man schreiben:

In [58]:
for beschreibung in classes:
    print beschreibung["class"]

Demonstration
person
people
marcher
traveler
shofar (musical horn)
horn
crowd
alizarine red color


Der ganze Code sieht so aus:

In [59]:
import json
from os.path import join, dirname
from os import environ
from watson_developer_cloud import VisualRecognitionV3

# verbinde mit der API
visual_recognition = VisualRecognitionV3('2016-05-20', api_key='a5c120b7f1e3c757f64b0ba87af00b2d8283c8f6')

# definiere das zu untersuchende Bild
bildLink = "http://feelectronica.de/wp-content/uploads/2015/07/TechnoViking.jpg"

# führe die Image Classification durch
resultat = visual_recognition.classify(images_url=bildLink)

# speichere nur die keywords in einer Variablen (-> Liste)
classes = resultat["images"][0]["classifiers"][0]["classes"]

# Lese die Liste mit einer Schleife aus
for beschreibung in classes:
    print beschreibung["class"]

Demonstration
person
people
marcher
traveler
shofar (musical horn)
horn
crowd
alizarine red color


Probiert mal ein anderes Bild und seht eucht die Resultate an.