# Análise de Imagem com o Serviço Computer Vision

![Um robô segurando uma foto](./images/computer_vision.jpg)

***Computer Vision*** é um ramo da Inteligência Artificial (IA) que explora o desenvolvimento de sistemas de IA que conseguem "ver" o mundo, seja em tempo real através de uma câmera ou analisando arquivos de imagens e vídeo. Isso é possível pelo fato de que arquivos de imagens digitais são essencialmente *arrays* de valores numéricos de pixels, e nós podemos usar esses valores de pixels como *features* para treinar modelos de *Machine Learning* que conseguem classificar imagens, detectar objetos, e até gerar resumos em texto do que está presente na fotografia.

## Usando o Serviço Cognitivo Computer Vision

Microsoft Azure oferece um número de *Serviços Cognitivos* que possuem funções comuns de IA, incluindo algumas que podem ajudar você a construir soluções de *computer vision*.

O serviço cognitivo de *Computer Vision* provê um ponto de partida óbvio para a nossa exploração da visão computacional no Azure. Ele usa modelos de *Machine Learning* pré-treinados para analisar imagens e extrair informações sobre elas.

Por exemplo, supnha que a empresa Northwind Traders decidiu implementar uma "loja inteligente", onde um serviço de IA monitra a loja identificando cliente que precisem de assistência, e direcionando empregados para ajudá-los. Usando um serviço de *Computer Vision*, imagens capturadas pelas câmeras instaladas pelas lojas podem ser analisadas para fornecer descrições significativas do que elas retratam.

### Criando um Recurso de Serviço Cognitivo

Vamos começar criando um recurso de  ***Cognitive Services*** na sua assinatura do Azure:

1. Em uma aba do seu navegador, abra o portal Azure em https://portal.azure.com, e faça login com a sua conta Microsoft.
2. Clique no botão **&#65291;Create a resource**, pesquise por *Cognitive Services*, e crie um recurso de **Cognitive Services** seguindo as configurações a seguir:
    - **Subscription**: *Sua assinatura Azure*.
    - **Resource group**: *Selecione um resource group ou crie um com um nome único*.
    - **Region**: *Selecione qualquer região disponível*:
    - **Name**: *Crie um nome único*.
    - **Pricing tier**: S0
    - **I confirm I have read and understood the notices**: Selecionado.
3. Espere até que o *deployment* esteja concluído. Logo, vá para o ser recuros de serviço cognitivo e ná página **Overview** , clique no link para gerenciar as suas chaves (*keys*) para o serviço. Você vai precisar do *endpoint* e *keys* para conectar aos seus recursos de serviços cognitivos da sua aplicação cliente.

### Usando o *Endpoint* e *Key* para o seu recurso de Serviço Cognitivo

Para usar o seu recurso de serviço cognitivo, as aplicações clientes precisam do seu *endpoint* e chave de autenticação (*key*).

1. No portal Azulre, na página **Keys and Endpoint** do seu recurso de serviço cognitivo, copie a **Key1** do seu recurso e cole no código abaixo, substituindo **SUA_COG_KEY**.
2. Copie o **endpoint** do seu recurso e cole no código abaixo, substituindo **SEU_COG_ENDPOINT**.
3. Rode o código abaixo selecionando a célula e então clicando no botão **Run cell** (&#9655) na parte superior esquerda da célula.

In [None]:
cog_key = 'SUA_COG_KEY'
cog_endpoint = 'SEU_COG_ENDPOINT'

print('Pronto para usar os serviços cognitivos em {} usando a chave {}'.format(cog_endpoint, cog_key))

Agora que você já configurou o seu *endpoint* e sua *key*, você pode usar o serviço de *Computer Vision* para analisar uma imagem.

Rode a célula abaixo para pegar a descrição de uma imagem no arquivo */data/vision/store_cam1.jpg*.

In [None]:
from azure.cognitiveservices.vision.computervision import ComputerVisionClient
from msrest.authentication import CognitiveServicesCredentials
from python_code import vision
import os
%matplotlib inline

# Pega o path para um arquivo de imagem
image_path = os.path.join('data', 'vision', 'store_cam1.jpg')

# Pega um cliente pro serviço de Computer Vision
computervision_client = ComputerVisionClient(cog_endpoint, CognitiveServicesCredentials(cog_key))

# Pega uma descrição do serviço de Computer Vision
image_stream = open(image_path, "rb")
description = computervision_client.describe_image_in_stream(image_stream)

# Exibe a imagem e a sua legenda (código em python_code/vision.py)
vision.show_image_caption(image_path, description)


Isso parece bem preciso.

Vamos tentar uma outra imagem.

In [None]:
# Pega o path para um arquivo de imagem
image_path = os.path.join('data', 'vision', 'store_cam2.jpg')

# Pega uma descrição do serviço de Computer Vision
image_stream = open(image_path, "rb")
description = computervision_client.describe_image_in_stream(image_stream)

# Exibe a imagem e a sua legenda (código em python_code/vision.py)
vision.show_image_caption(image_path, description)

Novamente, a legenda sugerida parece bem precisa.

## Recursos de análise de imagens

Até agora, você apenas usou o serviço de *Computer Vision* para gerar uma legenda descritiva para algumas imagens; mas tem muito mais que você pode fazer! O serviço de Computer Vision fornece capacidades analíticas que podem extrair informações detalhadas, tais quais:

- A localização de tipos comuns de objetos detectados na imagem.
- Localização e idade aproximada de rostos humanos na imagem.
- Se a imagem possui conteúdo "adulto" (*adult*), "picante" (*racy*) ou "violento" (*gory*).
- Tags relevantes que possam ser associadas à imagem em um banco de dados para fazer com que seja fácil achá-la.

Rode o código abaixo para a analisar a imagem de uma cliente.

In [None]:
# Pega o path para um arquivo de imagem
image_path = os.path.join('data', 'vision', 'store_cam1.jpg')

# Especifica quais recursos nós queremos analisar
features = ['Description', 'Tags', 'Adult', 'Objects', 'Faces']

# Pega uma análise do serviço de Computer Vision
image_stream = open(image_path, "rb")
analysis = computervision_client.analyze_image_in_stream(image_stream, visual_features=features)

# Mostra o resultado da análise (código em python_code/vision.py)
vision.show_image_analysis(image_path, analysis)

## Saiba Mais

Além das capacidades que você explorou neste *notebook*, o serviço cognitivo Computer Vision inclui a habilidade de:

- Identififcar celebridades em imagens.
- Detectar logomarcas em uma imagem.
- Realizar Reconhecimento Óptico de Caracteres (*OCR, Optical Character Recognition*) para ler texto em uma imagem.

Para aprender mais sobre o serviço cognitivo Computer Vision cognitive, veja a [Documentação de Computer Vision](https://docs.microsoft.com/azure/cognitive-services/computer-vision/)
