<img src="image/Capa.png" alt="ebac-logo">

---

# **Imola** | Python: DataSet Space: Stars and Planets 

Caderno de **Códigos**<br> 
Desenvolvedor [Enzo Schitini](https://enzo-schitini.bubbleapps.io/version-test/)

---

## -> `Definição`

### `Sobre a função do programa`

Olá, meu nome é `Enzo Schtini` e quero compartilhar `Imola` com você. É um algoritmo que revela dados incríveis sobre ‘exoplanetas e a temperatura das estrelas’.

### `Kepler`

##### Contexto

O `Observatório Espacial Kepler` é um satélite construído pela NASA que foi lançado em 2009. O telescópio é dedicado à busca de exoplanetas em sistemas estelares além do nosso, com o objetivo final de possivelmente encontrar planetas habitáveis ​​diferentes do nosso. A missão original terminou em 2013 devido a falhas mecânicas, mas o telescópio está operando desde 2014 em uma missão estendida “K2”.

O Kepler verificou 1.284 novos exoplanetas em maio de 2016. Em outubro de 2017, havia mais de 3.000 exoplanetas confirmados no total (usando todos os métodos de detecção, incluindo os baseados em terra). O telescópio ainda está ativo e continua a recolher novos dados na sua missão expandida.

##### Contente

Este conjunto de dados é um registro cumulativo de todos os `objetos de interesse` observados pelo Kepler – basicamente, todos os `aproximadamente 10.000 candidatos a exoplanetas` dos quais o Kepler fez observações.

In [21]:
from functools import reduce
from tqdm import tqdm
import pandas as pd
import time
import csv

In [22]:
class ArquivoCSV(object):

  def __init__(self, arquivo: str):
    self.arquivo = arquivo
    self.conteudo = self._extrair_conteudo()
    self.colunas = self._extrair_nome_colunas()

  def _extrair_conteudo(self):
    conteudo = None
    with open(file=self.arquivo, mode='r', encoding='utf8') as arquivo:
      conteudo = arquivo.readlines()
    return conteudo

  def _extrair_nome_colunas(self):
    return self.conteudo[0].strip().split(sep=',')

  def extrair_coluna(self, indice_coluna: str):
    coluna = list()
    for linha in self.conteudo:
      conteudo_linha = linha.strip().split(sep=',')
      coluna.append(conteudo_linha[indice_coluna])
    coluna.pop(0)
    return coluna


In [23]:
def analisar_exoplanetas():
    
    def sleep():
        print('-------------------------- \n ')
        for i in tqdm(range(2)):
            time.sleep(0.5)
        print('-------------------------- \n ')

    csv = ArquivoCSV('./satelite.csv')

    num = len(csv.extrair_coluna(0))
    print(num, 'Kepler Exoplanet Search Results')

    yon = csv.extrair_coluna(4)
    conf = 0
    no_confirmed = 0

    for x in yon:
        x = x.strip()
        if x == 'CONFIRMED':
            conf = conf + 1
        else:
            no_confirmed = no_confirmed + 1

    percentuale = lambda x: (x * 100) / num

    sleep()

    print(round(percentuale(conf)), '%', 'Exoplanet confirmed', '->', conf)
    print(round(percentuale(no_confirmed)), '%', 'Exoplanet no confirmed', '->', no_confirmed)

In [24]:
def limp_csv(arquivo_csv : str):
   with open(file=arquivo_csv, mode='w') as file:
      file.write("")

In [25]:
analisar_exoplanetas()

9564 Kepler Exoplanet Search Results
-------------------------- 
 


100%|██████████| 2/2 [00:01<00:00,  1.99it/s]

-------------------------- 
 
24 % Exoplanet confirmed -> 2293
76 % Exoplanet no confirmed -> 7271





In [26]:
def score():

    file = ArquivoCSV('./satelite.csv')
    lista = file.extrair_coluna(6)
    
    # Media Score
    lista_x = []
    for x in lista:
        if x != '':
            x = float(x)
            lista_x.append(x)
    media_score = reduce(lambda x, y: x + y, lista_x) / len(lista_x)
    print(f'Average score: {round(media_score, 2)}, 0 - 1')

    # Scala di accettazione
    lista_conf_score_x = []
    with open(file='./satelite.csv', mode='r', encoding='utf-8') as fp:
        line = fp.readline()
        line = fp.readline()
        while line:
            line = line.strip().split(sep=',')
            if line[4] == 'CONFIRMED':
                lista_conf_score_x.append(line[6])
                line = fp.readline()
            else:
                line = fp.readline()

In [27]:
score()

Average score: 0.48, 0 - 1


### `Stars`

##### Você já se perguntou qual estrela colorida tem a temperatura mais alta?

Então, através deste algoritmo podemos entender que uma estrela que tem a `cor Azul brilha` mais enquanto as `Vermelhas brilham menos`

In [28]:
csv_nome = './Stars.csv'
from adige import ArquivoCSV

In [29]:
csv = ArquivoCSV(csv_nome)
print('--------------------------')
print(len(csv.extrair_coluna(0)))

--------------------------
240


In [30]:
# Category of Stars
from adige import limp
catg = csv.extrair_coluna(4)
catg = limp(catg)
print(catg)
print(len(catg))

['yellowish', 'White-Yellow', 'white', 'Pale yellow orange', 'Yellowish', 'Blue White', 'White', 'Blue-white', 'yellow-white', 'Orange-Red', 'Red', 'Orange', 'Yellowish White', 'Whitish', 'Blue white', 'Blue-White', 'Blue']
17


In [31]:
def cat_val(cat:int, val:int) -> list:
    lista = []
    with open(file=csv_nome, mode='r', encoding='utf-8') as fp:
        line = fp.readline()
        line = fp.readline()
        while line:
            line = line.split(sep=',')
            p1 = line[cat]
            p2 = line[val]
            lista_x = p1 + '; ' + p2
            lista.append(lista_x)
            line = fp.readline()
    return lista

In [32]:
print(cat_val(4, 0))

['Red; 3068', 'Red; 3042', 'Red; 2600', 'Red; 2800', 'Red; 1939', 'Red; 2840', 'Red; 2637', 'Red; 2600', 'Red; 2650', 'Red; 2700', 'Red; 3600', 'Red; 3129', 'Red; 3134', 'Red; 3628', 'Red; 2650', 'Red; 3340', 'Red; 2799', 'Red; 3692', 'Red; 3192', 'Red; 3441', 'Blue White; 25000', 'White; 7740', 'White; 7220', 'White; 8500', 'Blue White; 16500', 'Yellowish White; 12990', 'Blue white; 8570', 'Yellowish White; 7700', 'Yellowish White; 11790', 'Pale yellow orange; 7230', 'Blue; 39000', 'Blue-white; 30000', 'Blue-white; 15276', 'Whitish; 9700', 'yellow-white; 5800', 'Whitish; 8052', 'yellow-white; 6757', 'yellow-white; 6380', 'yellow-white; 5936', 'yellow-white; 5587', 'Red; 3826', 'Red; 3365', 'Red; 3270', 'Red; 3200', 'Red; 3008', 'Red; 3600', 'Red; 3575', 'Red; 3574', 'Red; 3625', 'Blue; 33750', 'Red; 3490', 'Red; 3750', 'Red; 3834', 'Orange; 3749', 'Red; 3650', 'Red; 3450', 'Red; 3660', 'Red; 3450', 'Red; 3752', 'Red; 3535', 'Red; 3341', 'Red; 3432', 'Red; 2983', 'Red; 2835', 'Red; 293

In [33]:
# I tuoi dati
data_str = cat_val(4, 0)

In [34]:
# Elabora ogni stringa per creare una tupla e aggiungila a una nuova lista
data = []
for elemento in data_str:
    colore, temperatura = elemento.split("; ")
    data.append((colore.strip(), int(temperatura)))

In [35]:
# Creiamo un dizionario per sommare le temperature e contare le occorrenze di ciascun colore
somme = {}
conteggi = {}

for colore, temperatura in data:
    if colore not in somme:
        somme[colore] = 0
        conteggi[colore] = 0
    somme[colore] += temperatura
    conteggi[colore] += 1

In [36]:
# Calcoliamo la media per ciascun colore
medie = {colore: somma / conteggi[colore] for colore, somma in somme.items()}

In [37]:
cor_temperatura = []
# Stampiamo le medie
for colore, media in medie.items():
    media = round(media)
    print(f'La media per {colore} è {media}')
    linha = str(colore) + ';' + str(media)
    cor_temperatura.append(linha)


La media per Red è 3292
La media per Blue White è 14639
La media per White è 8546
La media per Yellowish White è 10827
La media per Blue white è 10576
La media per Pale yellow orange è 7230
La media per Blue è 21918
La media per Blue-white è 18670
La media per Whitish è 8876
La media per yellow-white è 6466
La media per Orange è 4018
La media per White-Yellow è 7100
La media per white è 12461
La media per yellowish è 4302
La media per Yellowish è 4980
La media per Orange-Red è 5112
La media per Blue-White è 8945


In [38]:
csv = ArquivoCSV('./Stars.csv')
catg = csv.extrair_coluna(4)

In [39]:
data = []
with open(file='./base.csv', mode='a', encoding='utf8') as fp:
  for x in cor_temperatura:
    x = x.split(sep=';')
    linha = str(x[0]) + ',' + str(x[1]) + '\n'
    fp.write(linha)
    data.append(linha.strip())

In [40]:
# Ordina i dati in base alla temperatura (dal più alto al più basso)
data.sort(key=lambda x: int(x.split(',')[1]), reverse=True)

def smistando(data:list):
   ordem = 0
   print('-------------------------- \n ')
   for x in data:
      x = x.strip().split(sep=',')
      ordem = ordem + 1
      print(f'{ordem}°  {x[0]}  --> Average temperature {x[1]} K')
smistando(data)

-------------------------- 
 
1°  Blue  --> Average temperature 21918 K
2°  Blue-white  --> Average temperature 18670 K
3°  Blue White  --> Average temperature 14639 K
4°  white  --> Average temperature 12461 K
5°  Yellowish White  --> Average temperature 10827 K
6°  Blue white  --> Average temperature 10576 K
7°  Blue-White  --> Average temperature 8945 K
8°  Whitish  --> Average temperature 8876 K
9°  White  --> Average temperature 8546 K
10°  Pale yellow orange  --> Average temperature 7230 K
11°  White-Yellow  --> Average temperature 7100 K
12°  yellow-white  --> Average temperature 6466 K
13°  Orange-Red  --> Average temperature 5112 K
14°  Yellowish  --> Average temperature 4980 K
15°  yellowish  --> Average temperature 4302 K
16°  Orange  --> Average temperature 4018 K
17°  Red  --> Average temperature 3292 K
