In [15]:
import os
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import pandas as pd

#T5

"""
Proiect: Vizualizare date

Descriere:
Acest script genereaza trei grafice interactive pentru analizarea unui set de date despre elevi. 
Datele includ informatii precum varsta elevilor, sexul acestora, mediile finale (G3) si timpul de studiu saptamanal.
Graficele construite sunt:
1. Distributia varstei elevilor - Histograma ce prezinta frecvenata varstelor.
2. Mediile finale (G3) in functie de sex - Grafic de bara ce compara mediile notelor finale între fete (F) si baieti (M).
3. Timpul de studiu vs Nota finala (G3) - Scatter plot ce analizeaza relatia dintre timpul de studiu si notele finale.

Observatii:
- Cei mai multi elevi au varste intre 15 și 18 ani.
- Mediile finale sunt usor mai mari în rândul baietilor comparativ cu fetele.
- Timpul mai mare de studiu tinde să fie corelat cu note mai bune, dar exista si cateva exceptii.

Rezultatul:
- Graficele sunt salvate in fisiere `report.html` si `report.png`, local în directorul specificat.

Documentatie: https://dash.plotly.com/

"""


# Incarcarea setului de date
# Setul de date trebuie sa contina coloane precum 'age', 'sex', 'G3' si 'studytime'
data = pd.read_csv(r"C:\Users\Andreea\student-mat.csv")

# Crearea unui subplot cu 3 coloane si titluri pentru fiecare grafic
fig = make_subplots(
    rows=1, cols=3,
    subplot_titles=("Distributia varstei elevilor",
                    "Mediile finale (G3) in functie de sex",
                    "Timpul de studiu vs Nota finala (G3)")
)

# 1. Histogram pentru distributia varstei elevilor
# Acest grafic arata numarul de elevi pentru fiecare categorie de varsta
fig.add_trace(
    go.Histogram(
        x=data['age'],  # Datele pentru varsta
        nbinsx=8,       # Numarul de intervale
        name='Distributie varsta',
        marker_color='rgb(99, 110, 250)',
        opacity=0.75,
        hovertemplate='Varsta: %{x}<br>Numar elevi: %{y}<extra></extra>'
    ),
    row=1, col=1
)
# Actualizarea axelor pentru primul grafic
fig.update_xaxes(title_text="Varsta (ani)", row=1, col=1)
fig.update_yaxes(title_text="Numar de elevi", row=1, col=1)

# 2. Grafic de bara pentru mediile finale (G3) in functie de sex
# Calculam media notelor G3 grupata dupa sex
avg_grades_by_sex = data.groupby('sex')['G3'].mean().reset_index()
fig.add_trace(
    go.Bar(
        x=avg_grades_by_sex['sex'],  # Categoriile (F si M)
        y=avg_grades_by_sex['G3'],   # Mediile calculate
        name='Medie G3',
        marker_color='rgb(255, 161, 90)',
        opacity=0.85,
        hovertemplate='Sex: %{x}<br>Medie G3: %{y:.2f}<extra></extra>'
    ),
    row=1, col=2
)
# Actualizarea axelor pentru al doilea grafic
fig.update_xaxes(title_text="Sex (F: Feminin, M: Masculin)", row=1, col=2)
fig.update_yaxes(title_text="Media finala G3", row=1, col=2)

# 3. Scatter plot pentru timpul de studiu vs nota finala G3
# Acest grafic arata relatia dintre timpul de studiu (ore/saptamana) si notele finale G3
fig.add_trace(
    go.Scatter(
        x=data['studytime'],  # Timpul de studiu
        y=data['G3'],         # Nota finala G3
        mode='markers',       # Stilul punctelor
        marker=dict(size=10, color='rgb(165, 85, 200)', line=dict(width=1, color='DarkSlateGrey'), opacity=0.8),
        name='Studytime vs G3',
        hovertemplate="Timp studiu: %{x} ore/saptamana<br>Nota G3: %{y}<extra></extra>"
    ),
    row=1, col=3
)
# Actualizarea axelor pentru al treilea grafic
fig.update_xaxes(title_text="Timp de studiu (ore/saptamana)", row=1, col=3)
fig.update_yaxes(title_text="Nota finala G3", row=1, col=3)

# Actualizarea layout-ului general al graficelor
fig.update_layout(
    height=1000,  # Inaltimea imaginii (mai mare pentru o vizualizare mai buna)
    width=1600,  # Latimea imaginii
    title_text="Vizualizare date elevi",  # Titlul principal
    title_x=0.5,  # Centrarea titlului principal
    showlegend=True,  # Afisarea legendei
    plot_bgcolor='rgb(240, 240, 240)',
    paper_bgcolor='rgb(245, 245, 245)',
    legend=dict(
        title="Legende",
        orientation="h",  # Asezarea orizontala a legendei
        x=0.3,  # Pozitia pe axa X
        y=-0.2,  # Pozitia pe axa Y
    ),
    margin=dict(l=50, r=50, t=80, b=50)  # Ajustarea marginilor pentru spatiu
)

# Salvarea graficelor in format HTML si PNG
output_dir = r'C:\Users\Andreea'  # Directorul unde vor fi salvate fisierele
html_file = os.path.join(output_dir, 'report.html')
png_file = os.path.join(output_dir, 'report.png')

# Exportul fisierelor HTML si PNG
fig.write_html(html_file)
fig.write_image(png_file)

print(f"Raportul HTML a fost salvat in: {html_file}")
print(f"Imaginea PNG a fost salvata in: {png_file}")


Raportul HTML a fost salvat in: C:\Users\Andreea\report.html
Imaginea PNG a fost salvata in: C:\Users\Andreea\report.png
