# Data from Mars Curiosity - 2012 ~ 2021

Para mais informações acesse o repositório do projeto em meu GitHub: [victoresende19](github.com/victoresende19)

## Importações para o projeto

In [None]:
import json                   #Capturar dados Json
import requests               #Fazer requerimento na API
import pandas as pd           #Tratamento e Modelagem dos dados
import seaborn as sns         #Criação de Gráficos
import sqlalchemy               #Acesso ao BD
import matplotlib.pyplot as plt
from sqlalchemy import create_engine

## Acessando a API (JSON) do robô Curiosity

In [None]:
url = "https://mars.nasa.gov/rss/api/?feed=weather&category=msl&feedtype=json"
data = requests.get(url).json()

#print(json.dumps(data, indent=4))

## Transformando os dados necessários em listas

In [None]:
terraData = []

for earthDate in data['soles']:
    terraData.append(earthDate['terrestrial_date'])
    

In [None]:
maiorTempAr = []

for marsMaxTempAir in data['soles']:
    maiorTempAr.append(marsMaxTempAir['max_temp'])

In [None]:
maiorTempSolo = []

for marsMaxTempGround in data['soles']:
    maiorTempSolo.append(marsMaxTempGround['max_gts_temp'])

In [None]:
menorTempAr = []

for marsMinTempAir in data['soles']:
    menorTempAr.append(marsMinTempAir['min_temp'])

In [None]:
menorTempSolo = []

for marsMinTempGround in data['soles']:
    menorTempSolo.append(marsMinTempGround['min_gts_temp'])

In [None]:
pressao = []

for marsPress in data['soles']:
    pressao.append(marsPress['pressure'])

In [None]:
marteData = []

for marsDate in data['soles']:
    marteData.append(marsDate['sol'])

In [None]:
radiacaoMarte = []

for marsUV in data['soles']:
    radiacaoMarte.append(marsUV['local_uv_irradiance_index'])

## Criando um DataFrame para as listas dos dados

In [None]:
#Criando um dicionario para as variaveis criadas, entao posteriormente sera feita um data frame usando pandas
dicionario_geral = {'DataTerra': terraData, 'DataMarte': marteData, 'MaxTempAr': maiorTempAr, 
                    'MaxTempSolo': maiorTempSolo,'MinTempAr': menorTempAr, 
                    'MinTempSolo': menorTempSolo,'Pressao': pressao, 'NivelUV': radiacaoMarte}

In [None]:
df = pd.DataFrame.from_dict(dicionario_geral)
df.head()

## Transformando o tipo das variáveis

In [None]:
#Convertendo DataTerra para tipo Data
df['DataTerra'] = pd.to_datetime(df['DataTerra']).dt.tz_localize(None)

#Convertendo DataMarte para tipo Inteiro
df[['DataMarte']] = df[['DataMarte']].astype(int).astype('Int64')

#Convertendo MaxTempSolo para tipo Inteiro
df[['MaxTempSolo']] = df[['MaxTempSolo']].replace('--', None)
df[['MaxTempSolo']] = df[['MaxTempSolo']].astype(int).astype('Int64')

#Convertendo MinTempAr para tipo Inteiro
df[['MinTempSolo']] = df[['MinTempSolo']].replace('--', None)
df[['MinTempSolo']] = df[['MinTempSolo']].astype(int).astype('Int64')

#Convertendo MaxTempAr para tipo Inteiro
df[['MaxTempAr']] = df[['MaxTempAr']].replace('--', None)
df[['MaxTempAr']] = df[['MaxTempAr']].astype(int).astype('Int64')

#Convertendo MinTempAr para tipo Inteiro
df[['MinTempAr']] = df[['MinTempAr']].replace('--', None)
df[['MinTempAr']] = df[['MinTempAr']].astype(int).astype('Int64')

#Convertendo Pressao para tipo Inteiro
df[['Pressao']]= df[['Pressao']].replace('--', None)
df[['Pressao']] = df[['Pressao']].astype(int).astype('Int64')

#Convertendo NivelUV '--' para None
df[['NivelUV']] = df[['NivelUV']].replace('--', None)

#Monitorando
df.dtypes

In [None]:
df.info()

## Testando as variáveis tipo Numéricas

In [None]:
#Médias das variáveis
# print('=================================================')
# print('Marte Temperatura do Ar Máxima Média: {}'.format(round(df.MaxTempAr.mean(), 2)))
# print('Marte Temperatura so Solo Máxima Média: {}'.format(round(df.MaxTempSolo.mean(), 2)))
# print('=================================================')
# print('Marte Temperatura do Ar Mínima Média: {}'.format(round(df.MinTempAr.mean(), 2)))
# print('Marte Temperatura do Solo Mínima Média: {}'.format(round(df.MinTempSolo.mean(), 2)))
# print('=================================================')
# print('Marte Pressao Média: {}'.format(round(df.Pressao.mean(), 2)))
# print('Marte UV mais comum: {}'.format(df.NivelUV.mode()))
# print('=================================================')

# Adicionando dados SQLite

In [None]:
db = create_engine('sqlite:///projetoIntegrador4_Final.sqlite', echo = False)
conn = db.connect()

In [None]:
schema_marte = '''
CREATE TABLE curiosity(
    DataTerra                text,
    DataMarte               Integer,
    MaxTempAr               Integer,
    MaxTempSolo             Integer,
    MinTempAr               Integer,
    MinTempSolo             Integer,
    Pressao                 Integer,
    NivelUV                    text
)
'''

conn.execute(schema_marte)

In [None]:
df.to_sql('curiosity', con = conn, if_exists = 'append', index = False)

In [None]:
df.tail()

## Acessando os dados SQLite

In [None]:
db = create_engine('sqlite:///projetoIntegrador4_Final.sqlite', echo = False)
conn = db.connect()

df = pd.read_sql_query( '''SELECT * FROM curiosity''', conn )
df

In [None]:
df['DataTerra'] = pd.to_datetime(df['DataTerra']).dt.tz_localize(None)
df = df[(df.DataTerra >= '2012-08-07') & (df.DataTerra <= '2021-04-07')].reset_index()

In [None]:
df.head()

In [None]:
conn.close()

# Adicionando dados PostegreSQL

In [None]:

engine = sqlalchemy.create_engine('postgresql://postgres:senha@localhost/projetoIntegrador4')
con = engine.connect()
#print(engine.table_names())


table_name = 'marte'
df.to_sql(table_name, con, if_exists = 'append', index = False)
#print(engine.table_names())


## Acessando os dados PostegreSQL

In [None]:
engine = sqlalchemy.create_engine('postgresql://postgres:senha@localhost/projetoIntegrador4')
df = pd.read_sql_query("SELECT  * FROM marte", engine)

In [None]:
df.tail()

## Análise Exploratoria

In [None]:
df.shape

In [None]:
df['DataTerra'] = pd.to_datetime(df['DataTerra']).dt.tz_localize(None)
df.info()

In [None]:
df.describe()

## Configurações gráficas

In [None]:
sns.set(rc={'figure.figsize':(12,4)})
sns.set_theme(style="darkgrid")

## Temperaturas Maximas

In [None]:
df = df.loc[(df['MaxTempAr'] > -35) & (df['MaxTempAr'] < 10)]

In [None]:
sns.lineplot(data = df, x="DataMarte", y="MaxTempAr").set(title='Temperatura Ar Máxima', 
                                                          xlabel='Sol Marte', ylabel='Temperatura Ar Máxima')
plt.savefig("maxTempAr.png")

In [None]:
df = df.loc[(df['MaxTempSolo'] > -25) & (df['MaxTempSolo'] < 30)]

In [None]:
sns.lineplot(data = df, x="DataMarte", y="MaxTempSolo").set(title='Temperatura Solo Máxima', 
                                                            xlabel='Sol Marte', ylabel='Temperatura Solo Máxima')
plt.savefig("maxTempSolo.png")

In [None]:
sns.displot(df, x="MaxTempAr").set(title='Histograma Temperatura Ar Máxima', 
                                   xlabel='Temperatura Ar Máxima', ylabel='Frequência')
plt.savefig("maxTempArHist.png")

In [None]:
sns.displot(df, x="MaxTempSolo").set(title='Histograma Temperatura Solo Máxima', 
                                     xlabel='Temperatura Solo Máxima', ylabel='Frequência')
plt.savefig("maxTempSoloHist.png")

## Temperaturas Mínimas

In [None]:
df = df.loc[(df['MinTempAr'] > -95) & (df['MinTempAr'] < -55)]

In [None]:
sns.lineplot(data = df, x="DataMarte", y="MinTempAr").set(title='Temperatura Ar Mínima', 
                                                          xlabel='Sol Marte', ylabel='Temperatura Ar Mínima')
plt.savefig("minTempAr.png")

In [None]:
df = df.loc[(df['MinTempSolo'] < -55)]

In [None]:
sns.lineplot(data = df, x="DataMarte", y="MinTempSolo").set(title='Temperatura Solo Mínima', 
                                                            xlabel='Sol Marte', ylabel='Temperatura Solo Mínima')
plt.savefig("minTempSolo.png")

In [None]:
sns.displot(df, x="MinTempAr").set(title='Histograma Temperatura Ar Mínima', 
                                   xlabel='Temperatura Ar Mínima', ylabel='Frequência')
plt.savefig("minTempArHist.png")

In [None]:
sns.displot(df, x="MinTempSolo").set(title='Histograma Temperatura Solo Mínima', 
                                     xlabel='Temperatura Solo Mínima', ylabel='Frequência')
plt.savefig("minTempSoloHist.png")

## Testes - Gráficos

In [None]:
ax = df.plot(x="DataMarte", y="MaxTempAr", legend=False)
ax2 = ax.twinx()
df.plot(x="DataMarte", y="MaxTempSolo", ax=ax2, legend=False, color="r")
ax.figure.legend()
plt.show()

In [None]:
ax = df.plot(x="DataMarte", y="MaxTempSolo", legend=False)
ax2 = ax.twinx()
df.plot(x="DataMarte", y="MinTempSolo", ax=ax2, legend=False, color="r")
ax.figure.legend()
plt.show()

## Pressao

In [None]:
sns.lineplot(data = df, x="DataMarte", y="Pressao").set(title='Pressão Atmosférica por Sol', 
                                                        xlabel='Sol Marte', ylabel='Pressão Atmosférica')
plt.savefig("pressao.png")

In [None]:
sns.displot(data = df, x="Pressao").set(title='Pressão Atmosférica por Sol', 
                                        xlabel='Sol Marte', ylabel='Pressão Atmosférica')
plt.savefig("pressaoHist.png")

## NivelUV

In [None]:
sns.displot(data = df, x="NivelUV").set(title='Quantidade Nivel UV em Marte', 
                                        xlabel='Nivel UV', ylabel='Quantidade')
plt.savefig("NivelUV.png")

In [None]:
sns.displot(data = df, x="MaxTempAr", 
            hue = 'NivelUV').set(title='Temperatura Máxima Ar por Nível UV', 
                                 xlabel='Temperatura Máxima do Ar', 
                                 ylabel='Quantidade')
plt.savefig("maxTempArNivelUV.png")

In [None]:
sns.displot(data = df, x="MaxTempSolo", 
            hue = 'NivelUV').set(title='Temperatura Máxima Solo por Nível UV', 
                                 xlabel='Temperatura Máxima do Solo', 
                                 ylabel='Quantidade')
plt.savefig("maxTempSoloNivelUV.png")

## Correlação

In [None]:
sns.set(rc={'figure.figsize':(12,4)})
sns.heatmap(df.corr(),
            annot = True,
            fmt = '.2f',
            cmap='Reds')
plt.savefig("correlacaoAntes.png")

## Manipulando NivelUV

In [None]:
df.NivelUV.value_counts()

In [None]:
mapping_dictionary = {"NivelUV":{ "Low": 1, "Moderate": 2, "High": 3, "Very_High": 4}}
df = df.replace(mapping_dictionary)

In [None]:
sns.set(rc={'figure.figsize':(12,4)})
sns.heatmap(df.corr(),
            annot = True,
            fmt = '.2f',
            cmap='Reds')
plt.savefig("correlacaoDepois.png")

In [None]:
df.head()

## Regressão Linear Múltipla

In [None]:
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split 
from sklearn.metrics import mean_squared_error
from sklearn.metrics import mean_absolute_error

import numpy as np

X = df[['MaxTempAr', 'MinTempAr', 'MinTempSolo', 'NivelUV']]
Y = df['MaxTempSolo']

model = LinearRegression() #criando a variavel pra usar reg linear

#separando os dados para treino e teste
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = 0.3, random_state=1) 

model.fit(X_train, Y_train)#treinando o modelo
    
y_test_predicted = model.predict(X_test)
#y_test_predicted.shape

print("MSE: {}".format(mean_squared_error(Y_test, y_test_predicted)))

print("RSME: {}".format(mean_squared_error(Y_test, y_test_predicted, squared = False)))

print("MSA: {}".format(mean_absolute_error(Y_test, y_test_predicted)))

print("R2: {}".format(model.score(X,Y)))

print("="*50)

new_array = np.array([-13, -76, -89, 2]).reshape(-1, 4)
print('MARTE: ', model.predict(new_array))


In [None]:
plt.plot(Y_test, y_test_predicted, '.')

x = np.linspace(-40, 47, 9)
y = x
plt.plot(x, y)
plt.show()