## Computer Vision com OpenAI

#### Possibilidade de envisar imagens para serem analisadas pela OpenAI

##### Cria o cliente da API do OpenAI

In [1]:
import openai
import os
from dotenv import find_dotenv, load_dotenv

# load the api key
_ = load_dotenv(find_dotenv())
client = openai.Client(api_key=os.getenv("API_KEY"))

##### Com URL da imagem

In [2]:
messages = [
        {"role": "user", "content": [
            {"type": "text", "text": "Descreva a a imagem fornecida?"},
            {"type": "image_url", "image_url": {"url": "https://upload.wikimedia.org/wikipedia/commons/thumb/d/dd/Gfp-wisconsin-madison-the-nature-boardwalk.jpg/2560px-Gfp-wisconsin-madison-the-nature-boardwalk.jpg"}}
        ]}
    ]
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=messages
)

In [4]:
print(response.choices[0].message.content)

A imagem mostra um caminho de madeira que se estende através de uma vasta área de grama verde. O cenário é aberto e natural, com arbustos e árvores visíveis ao fundo, e um céu azul com nuvens brancas esparsas. A luz parece suave, sugerindo uma atmosfera tranquila e serena. O caminho convida a um passeio pela natureza, cercado por vegetação exuberante.


#### Enviando a imagem como Base64

In [None]:
import base64

def encode_image(image_path):
    with open(image_path, "rb") as image_file:
        encoded_string = base64.b64encode(image_file.read()).decode('utf-8')
        encoded_string = f"data:image/jpg;base64,{encoded_string}"
    return encoded_string

path_img = "files/CARROS.jpg"
base_img64 = encode_image(path_img)

messages = [
        {"role": "user", "content": [
            {"type": "text", "text": "Quais textos e números tem a imagem? Me retorne apenas as placass de carros e os possíveis modelos e ano dos veículos. Retorne em formato JSON"},
            {"type": "image_url", "image_url": {"url": base_img64}}
        ]}
    ]

response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=messages,
    max_tokens=1000,
)

print(response.choices[0].message.content)

```json
{
  "veiculos": [
    {
      "placa": "FKH-3708",
      "modelo": "Renault",
      "ano": "desconhecido"
    },
    {
      "placa": "FPL-1067",
      "modelo": "Nissan",
      "ano": "desconhecido"
    }
  ]
}
```


In [16]:
response.usage

CompletionUsage(completion_tokens=83, prompt_tokens=25540, total_tokens=25623, completion_tokens_details=CompletionTokensDetails(accepted_prediction_tokens=0, audio_tokens=0, reasoning_tokens=0, rejected_prediction_tokens=0), prompt_tokens_details=PromptTokensDetails(audio_tokens=0, cached_tokens=24576))