In [1]:
# Importando as bibliotecas utilizadas
import requests
import pandas as pd
import plotly.offline as py
import plotly.graph_objs as go
py.init_notebook_mode(connected=True)

low_memory=False

In [2]:
# abrindo a página e coletando os dados através de uma request GET e transformando em formato JSON
r = requests.get('http://teste-inpe.herokuapp.com/').json()

In [3]:
# montando um DataFrame
df = pd.DataFrame(data=r)

In [4]:
# criando um arquivo CSV para melhor visualização dos dados
df.to_csv('dadosINPE.csv', header=['id', 'comp_bx', 'comp_by', 'comp_bz', 'comp_bt', 'lon_gsm', 'lat_gsm', 'density', 'speed', 'temperature'], index=None)

In [5]:
# com base nos valores vistos no arquivo CSV, filtrei os valores aparentemente errados
df = df.query('(comp_bx < 999999999) and (comp_by < 999999999) and (comp_bz < 999999999) and (comp_bt < 999999999) and (lon_gsm < 999999999) and (lat_gsm < 999999999) and (density < 999999999) and (speed < 999999999) and (temperature < 999999999)')[['id', 'comp_bx', 'comp_by', 'comp_bz', 'comp_bt', 'lon_gsm', 'lat_gsm', 'density', 'speed', 'temperature']]

In [6]:
# mostra as 5 primeiras linhas do dataframe 
df.head()

Unnamed: 0,id,comp_bx,comp_by,comp_bz,comp_bt,lon_gsm,lat_gsm,density,speed,temperature
0,"{'date': '2019-11-05', 'time': '00:00:00'}",1.28,2.73,-1.83,3.53,64.95,-31.36,6.18,390.2,71640.0
1,"{'date': '2019-11-05', 'time': '00:01:00'}",1.08,2.77,-1.96,3.56,68.67,-33.5,3.67,372.0,31840.0
2,"{'date': '2019-11-05', 'time': '00:02:00'}",1.03,2.78,-1.91,3.52,69.65,-32.74,6.87,394.1,94546.0
3,"{'date': '2019-11-05', 'time': '00:03:00'}",0.99,2.91,-1.87,3.59,71.13,-31.31,6.06,384.4,63146.0
4,"{'date': '2019-11-05', 'time': '00:04:00'}",1.2,2.72,-2.04,3.6,66.24,-34.5,5.32,370.9,27611.0


In [7]:
# mostra algumas informações estatísticas dos dados
df.describe()

Unnamed: 0,comp_bx,comp_by,comp_bz,comp_bt,lon_gsm,lat_gsm,density,speed,temperature
count,2400.0,2400.0,2400.0,2400.0,2400.0,2400.0,2400.0,2400.0,2400.0
mean,-2.632629,1.278329,-0.360429,4.330379,151.861612,-8.611308,4.546617,398.235,69784.836667
std,2.595091,1.617244,1.559798,1.311903,54.48266,23.189619,4.655961,14.72066,26635.41874
min,-7.03,-4.3,-4.13,1.35,0.4,-75.78,1.75,351.3,13988.0
25%,-4.05,0.18,-1.48,3.23,131.6675,-24.5675,3.68,388.5,51555.75
50%,-2.97,1.33,-0.47,4.01,155.66,-6.555,4.42,396.5,65597.5
75%,-1.79,2.38,0.7925,5.4425,177.1375,9.6975,5.05,408.2,84686.25
max,5.6,5.18,3.82,7.05,359.96,40.05,170.52,450.4,201815.0


A seguir, inicio a criação dos gráficos.

In [8]:
# criando o gráfico da frequência da densidade dos dados
trace = go.Histogram(x = df['density'], xbins=dict(start=0, end=10, size=0.5))
data = [trace]
# Criando Layout
layout = go.Layout(title='Distribuição de densidades', 
                   yaxis={'title':'Frequência'}, 
                   xaxis={'title': 'Densidade (unidade de densidade)'})
# Criando a figura que será exibida
fig = go.Figure(data=data, layout=layout)
# Exibindo figura/gráfico
py.iplot(fig)

In [9]:
# criando o gráfico da frequência da velocidade dos dados
trace = go.Histogram(x = df['speed'], xbins=dict(start=350, end=460, size=5))
data = [trace]
layout = go.Layout(title='Distribuição de velocidades', 
                   yaxis={'title':'Frequência'}, 
                   xaxis={'title': 'Velocidade (unidade de velocidade)'})
fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

In [10]:
# criando o gráfico da frequência da temperatura dos dados
trace = go.Histogram(x = df['temperature'], xbins=dict(start=10000, end=190000, size=5000))
data = [trace]
layout = go.Layout(title='Distribuição de temperaturas', 
                   yaxis={'title':'Frequência'}, 
                   xaxis={'title': 'Temperatura (unidade de temperatura)'})
fig = go.Figure(data=data, layout=layout)
py.iplot(fig)

In [11]:
# criando o gráfico da latitude e longitude dos dados
trace = go.Scatter(x = df['lon_gsm'], y = df['lat_gsm'], mode = 'markers', marker =  {'color' : '#e74c3c',
                              'line' : {'width': 1,
                                        'color': '#c0392b'}}, opacity=.8)
data = [trace]

# Criando Layout
layout = go.Layout(title='Ocorrência dos dados conforme sua latitude e longitude', 
                   yaxis={'title':'Latitude (°)'}, 
                   xaxis={'title': 'Longitude (°)'})
# Criando figura que será exibida
fig = go.Figure(data=data, layout=layout)
# Exibindo figura/gráfico
py.iplot(fig)