# Consumo de API

Consumir uma API é uma prática fundamental na engenharia de dados porque permite automatizar a coleta de informações de forma segura e padronizada. Com isso, é possível buscar dados atualizados com frequência — diariamente ou até em tempo real — sem depender de processos manuais. As APIs também facilitam a integração com diferentes sistemas, como plataformas de e-commerce, CRMs e bancos de dados públicos. Além disso, fornecem os dados em formatos estruturados, como JSON, que são ideais para alimentar pipelines de processamento, análises e dashboards.

## Instalação das bibliotecas necessárias

In [0]:
pip install pandas requests

Python interpreter will be restarted.
Python interpreter will be restarted.


## Reinicialização do ambiente Python

In [0]:
dbutils.library.restartPython()

## Importação das bibliotecas

In [0]:
import pandas as pd
import requests



## Consumo da API da NYC OpenData

Podemos consumir a API da NYC OpenData para obter dados, por exemplo, do serviço de táxis amarelos (yellow taxi) da cidade de Nova York. Essa API disponibiliza informações públicas de forma estruturada, contendo registros de corridas com detalhes como data, horário, local de embarque e desembarque, distância percorrida e valor da tarifa.

In [0]:
endpoint = 'https://data.cityofnewyork.us/resource/4b4i-vvec.json'

params = {
    '$limit': 10
}

response = requests.get(endpoint, params=params)
response.status_code

Out[2]: 200

In [0]:
if response.status_code == 200:
    dados = response.json()
else:
    print(f"Erro ao consumir a API: {response.status_code}")
    print(response.text)

df = pd.DataFrame(dados)

df_tratado = df[['vendorid', 'tpep_pickup_datetime', 'tpep_dropoff_datetime', 'passenger_count', 'total_amount']]

df_tratado.display()

vendorid,tpep_pickup_datetime,tpep_dropoff_datetime,passenger_count,total_amount
2,2023-01-01T00:32:10.000,2023-01-01T00:40:36.000,1.0,14.3
2,2023-01-01T00:55:08.000,2023-01-01T01:01:27.000,1.0,16.9
2,2023-01-01T00:25:04.000,2023-01-01T00:37:49.000,1.0,34.9
1,2023-01-01T00:03:48.000,2023-01-01T00:13:25.000,0.0,20.85
2,2023-01-01T00:10:29.000,2023-01-01T00:21:19.000,1.0,19.68
2,2023-01-01T00:50:34.000,2023-01-01T01:02:52.000,1.0,27.8
2,2023-01-01T00:09:22.000,2023-01-01T00:19:49.000,1.0,20.52
2,2023-01-01T00:27:12.000,2023-01-01T00:49:56.000,1.0,64.44
2,2023-01-01T00:21:44.000,2023-01-01T00:36:40.000,1.0,28.38
2,2023-01-01T00:39:42.000,2023-01-01T00:50:36.000,1.0,19.9
