# Brouillon

Dans cette étude, nous nous pencherons sur l'analyse des différentes caractéristiques des étoiles de notre galaxie. Les étoiles, objets célestes fascinants, possèdent des propriétés physiques variées telles que la température, la luminosité, la taille et la couleur, qui permettent de les classer en différentes catégories et types spectraux. À partir de l'échantillon de données disponible, nous analyserons comment ces caractéristiques interagissent et influencent la classification des étoiles, tout en explorant leur distribution et leur relation au sein de l'univers. Cette exploration vise à enrichir notre compréhension des étoiles et à offrir un aperçu détaillé de leurs propriétés essentielles.

In [23]:
# Import necessary libraries
import os
import numpy as np
import pandas as pd
import seaborn as sb
import matplotlib.pyplot as plt
from datetime import datetime
from scipy.stats import linregress

from plotly.offline import init_notebook_mode, iplot, plot
import plotly as py
import plotly.express as px
import plotly.graph_objects as go

In [5]:
star = pd.read_csv ('https://github.com/YBIFoundation/Dataset/raw/main/Stars.csv')

In [14]:
print('Shape :', np.shape(star))

print('Value counts :', '\n', star['Star category'].value_counts())

Shape : (240, 8)
Value counts : 
 Star category
Brown Dwarf      40
Red Dwarf        40
White Dwarf      40
Main Sequence    40
Supergiant       40
Hypergiant       40
Name: count, dtype: int64


In [6]:
star.head()

Unnamed: 0,Temperature (K),Luminosity (L/Lo),Radius (R/Ro),Absolute magnitude (Mv),Star type,Star category,Star color,Spectral Class
0,3068,0.0024,0.17,16.12,0,Brown Dwarf,Red,M
1,3042,0.0005,0.1542,16.6,0,Brown Dwarf,Red,M
2,2600,0.0003,0.102,18.7,0,Brown Dwarf,Red,M
3,2800,0.0002,0.16,16.65,0,Brown Dwarf,Red,M
4,1939,0.000138,0.103,20.06,0,Brown Dwarf,Red,M


In [22]:
star.describe()

Unnamed: 0,Temperature (K),Luminosity (L/Lo),Radius (R/Ro),Absolute magnitude (Mv),Star type
count,240.0,240.0,240.0,240.0,240.0
mean,10497.4625,107188.361635,237.157781,4.382396,2.5
std,9552.425037,179432.24494,517.155763,10.532512,1.711394
min,1939.0,8e-05,0.0084,-11.92,0.0
25%,3344.25,0.000865,0.10275,-6.2325,1.0
50%,5776.0,0.0705,0.7625,8.313,2.5
75%,15055.5,198050.0,42.75,13.6975,4.0
max,40000.0,849420.0,1948.5,20.06,5.0


In [24]:
# Calcul de la régression linéaire avec scipy
x = star['Temperature (K)']
y = star['Luminosity (L/Lo)']
slope, intercept, r_value, p_value, std_err = linregress(x, y)

# Calcul des valeurs de la ligne de régression
x_line = np.linspace(min(x), max(x), 100)
y_line = slope * x_line + intercept

# Créer le graphique
fig = go.Figure()

# Ajouter le scatter plot des points de données
fig.add_trace(go.Scatter(
    x=x,
    y=y,
    mode='markers',
    name='Données',
    marker=dict(color='blue')
))

# Ajouter la ligne de régression avec l'équation et R^2
fig.add_trace(go.Scatter(
    x=x_line,
    y=y_line,
    mode='lines',
    name=f'Régression linéaire: y={slope:.2f}x + {intercept:.2f}<br>R²={r_value**2:.2f}',
    line=dict(color='green', width=2, dash='dot')
))

# Mise en forme du graphique
fig.update_layout(
    title='Relation entre la température et la luminosité des étoiles avec régression linéaire',
    xaxis_title='Température (K)',
    yaxis_title='Luminosité (L/Lo)',
    template='plotly_white',
    legend=dict(
        x=0.02,
        y=0.98,
        title_text='Légende'
    )
)

# Afficher le graphique
fig.show()

R^2 = 0.15 très éloigné de 1 donc pas du tout pertinent de faire une régression linéaire. Donc pas de corrélation entre la luminosité et la température.

In [None]:
# Dictionnaire des couleurs
color_map = {
    'Red': 'red',
    'Blue White': 'dodgerblue',
    'White': 'white',
    'Yellowish White': 'lightyellow',
    'Orange': 'orange',
    'Blue': 'blue',
    'Pale yellow orange': '#FFD580',
    'Blue-white': '#ADD8E6',
    'Whitish': '#F5F5F5',
    'yellow-white': '#FFFFE0',
    'White-Yellow': '#FFFACD'
}

# Graphique avec la palette de couleurs
fig = px.scatter(
    star,
    x='Luminosity (L/Lo)',
    y=[1] * len(star),  # Une valeur constante pour l'axe y
    color='Star color',
    color_discrete_map=color_map,
    size='Luminosity (L/Lo)',
    labels={'y': 'Stars'},
    title='Couleur des étoiles en fonction de leur luminosité'
)

fig.show()

In [26]:
# Dictionnaire des couleurs
color_map = {
    'Red': 'red',
    'Blue': 'blue',
    'White': 'white',
    'Orange': 'orange',
    'Yellow': 'yellow',
    'Blue White': 'lightblue',
    'Blue-white': '#ADD8E6',
    'Orange-Red': '#FF4500',
    'White-Yellow': '#FFFACD',
    'Yellowish': '#FFFF00',
    'Pale yellow orange': '#FFD580',
    'Whitish': '#F5F5F5'
}

# Créer le graphique de dispersion avec les couleurs personnalisées
fig = px.scatter(
    star,
    x='Temperature (K)',
    y=[1] * len(star),  # Valeur constante pour l'axe des ordonnées
    color='Star color',
    color_discrete_map=color_map,
    title='Couleur des étoiles en fonction de leur température',
    labels={'Temperature (K)': 'Température (K)', 'Star color': 'Couleur des étoiles'},
    template='plotly_white'
)

# Modifier l'apparence pour rendre le graphe plus intuitif
fig.update_yaxes(visible=False)  # Masquer l'axe des ordonnées

# Afficher le graphique
fig.show()