# Tratamento de Dados de Satélite
**Equipe:** Daniel, Jones, Kleberson, Murilo

## Apresentação
### O Telescópio Kepler e a Descoberta de Exoplanetas

#### Introdução
- O Telescópio Espacial Kepler, lançado pela NASA em 2009, foi projetado para descobrir exoplanetas,
  ou seja, planetas que orbitam estrelas fora do nosso sistema solar.
- A missão Kepler teve como objetivo principal explorar a estrutura e a diversidade dos sistemas
planetários, contribuindo significativamente para a nossa compreensão do universo.

#### Objetivos da Missão Kepler
- **Exploração da Diversidade Planetária**: Investigar a variedade de planetas e suas características.
- **Identificação de Exoplanetas**: Detectar planetas em zonas habitáveis, onde a vida poderia existir.
- **Coleta de Dados**: Fornecer dados extensivos que apoiem futuras missões da NASA e pesquisas científicas.

#### O Conjunto de Dados
- O conjunto de dados contém informações sobre aproximadamente **3.373 exoplanetas confirmados**.
- Inclui dados coletados durante as missões Kepler e K2, abrangendo vários anos de observação.
- **Informações Disponíveis**:
  - Nome da estrela hospedeira
  - Características dos planetas (tamanho, massa, composição)
  - Parâmetros orbitais (período orbital, distância da estrela)
  - Métodos de descoberta (transito, velocidade radial)
  - Propriedades estelares (tipo de estrela, temperatura)

#### Importância dos Dados
- Os dados do Kepler são cruciais para entender a formação e evolução dos sistemas planetários.
- Permitem a análise estatística da distribuição de exoplanetas em diferentes tipos de estrelas e suas características.
- A pesquisa com esses dados pode revelar padrões que ajudam a identificar quais sistemas planetários têm maior probabilidade de abrigar vida.



## Análise dos Dados

**Bibliotecas necessárias**

In [1]:
import pandas as pd

**Resultados obtidos**

In [4]:
# 1) Lê o CSV para um DataFrame
df = pd.read_csv('data/planets.csv')

# Suponha que a coluna que você quer checar se chama 'col_importante'

# 2) Máscara para filtrar os dados mantendo só as linhas onde 'col_importante' NÃO é NaN
mask = (
    (df['pl_hostname'] != '') &
    (df['pl_dens'].notna()) &
    (df['pl_bmassj'] != '') &
    (df['pl_radj'].notna()) &
    (df['pl_orbper'].notna()) &
    (df['st_teff'].notna())
)

"""
Alternativa usando dropna para as colunas numéricas e filtragem específica para as strings:

python

Copiar código
# 1) remove linhas com NaN nas colunas numéricas
df2 = df.dropna(subset=['pl_dens','pl_radj','pl_orbper','st_teff'])

# 2) filtra as colunas de string para não-vazias
mask_str = (df2['pl_hostname'].str.strip() != '') & (df2['pl_bmassj'].str.strip() != '')
df_filtrado = df2[mask_str]
Assim você garante que só sobram linhas em que todas as colunas que você listou estejam efetivamente preenchidas.
"""

df_filtrado = df[mask]

# Alternativamente, você também pode "dropar" as linhas faltantes diretamente:
# df.dropna(subset=['col_importante'], inplace=True)

# 3) A partir daqui use df_filtrado para suas análises
print(df_filtrado.head(15))

    rowid pl_hostname pl_letter    pl_discmethod  pl_pnum  pl_orbper  \
26     27      55 Cnc         e  Radial Velocity        5   0.736539   
46     47   BD+20 594         b          Transit        1  41.685500   
60     61     CoRoT-1         b          Transit        1   1.508956   
61     62    CoRoT-10         b          Transit        1  13.240600   
62     63    CoRoT-11         b          Transit        1   2.994330   
63     64    CoRoT-12         b          Transit        1   2.828042   
64     65    CoRoT-13         b          Transit        1   4.035190   
65     66    CoRoT-14         b          Transit        1   1.512140   
66     67    CoRoT-16         b          Transit        1   5.352270   
67     68    CoRoT-17         b          Transit        1   3.768100   
68     69    CoRoT-18         b          Transit        1   1.900069   
69     70    CoRoT-19         b          Transit        1   3.897130   
70     71     CoRoT-2         b          Transit        1   1.74

## Conclusão
- O Telescópio Kepler revolucionou nossa compreensão dos exoplanetas e da diversidade dos sistemas planetários.
- O conjunto de dados disponível oferece uma rica fonte de informações para pesquisas futuras e análises estatísticas.
- Através do uso de ferramentas como Jupyter Notebooks, podemos explorar e visualizar esses dados, contribuindo para o avanço da astronomia e da astrobiologia.