<a href="https://colab.research.google.com/github/drfperez/YoungPhotonicsCongress/blob/main/WASP39b.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:

# Aquest codi és un script per a Google Colab que descarrega dades espectrals de WASP-39b des de Zenodo,
# les descomprimeix, llista tots els fitxers extrets per depuració, cerca un fitxer específic d'espectre de transmissió combinat,
# carrega les dades amb pandas i crea un gràfic de l'espectre de transmissió utilitzant matplotlib.
# Si no es troba el fitxer, llista fitxers potencials que contenen 'spectrum' o 'transmission' per ajudar a identificar-lo.
# El codi està dissenyat per executar-se en una única cel·la de Colab.

# Primer, descarreguem l'arxiu ZIP de dades des de Zenodo utilitzant wget.
# L'URL apunta al fitxer ZIP que conté les dades de síntesi ERS per WASP-39b.
# El guardem com a 'data.zip' al directori temporal de Colab.
!wget "https://zenodo.org/records/10161743/files/ERS_DataSynthesis_Zenodo.zip?download=1" -O data.zip

# Descomprimim l'arxiu ZIP en silenci (-q) a un directori anomenat 'wasp39b_data'.
# Això extreu tots els fitxers i subdirectoris continguts en el ZIP.
!unzip -q data.zip -d wasp39b_data

# Importem les llibreries necessàries:
# - os: per navegar pel sistema de fitxers i trobar fitxers.
# - pandas (pd): per carregar i manipular dades tabulars com CSV o fitxers de text.
# - matplotlib.pyplot (plt): per crear gràfics i visualitzacions.
import os
import pandas as pd
import matplotlib.pyplot as plt

# Llista tots els fitxers extrets per depuració, per veure què hi ha al directori.
print("Llista de tots els fitxers extrets a 'wasp39b_data':")
all_files = []
for root, dirs, files in os.walk('wasp39b_data'):
    for file in files:
        file_path = os.path.join(root, file)
        all_files.append(file_path)
        print(file_path)
print(f"Total de fitxers: {len(all_files)}")

# Ara, busquem el fitxer de l'espectre de transmissió combinat dins del directori extret.
# Utilitzem os.walk per recórrer tots els subdirectoris i fitxers.
# Criteris de cerca: ampliem per incloure fitxers amb 'transmission' o 'spectrum' en el nom, i 'combined' o 'benchmark' o 'wasp39b',
# i ha d'acabar en .csv, .txt, .dat (formats comuns per dades espectrals).
# Això és més flexible per trobar el fitxer correcte.
spectrum_file = None
potential_files = []
for root, dirs, files in os.walk('wasp39b_data'):
    for file in files:
        lower_file = file.lower()
        if ('transmission' in lower_file or 'spectrum' in lower_file) and (lower_file.endswith('.csv') or lower_file.endswith('.txt') or lower_file.endswith('.dat')):
            potential_files.append(os.path.join(root, file))
            if ('combined' in lower_file or 'benchmark' in lower_file or 'wasp39b' in lower_file):
                spectrum_file = os.path.join(root, file)
                break
    if spectrum_file:
        break

# Si no hem trobat un fitxer exacte, mostrem els fitxers potencials perquè l'usuari pugui triar i ajustar manualment.
if not spectrum_file:
    print("\nNo s'ha trobat un fitxer d'espectre de transmissió combinat amb els criteris estrictes.")
    if potential_files:
        print("Fitxers potencials que contenen 'transmission' o 'spectrum' en el nom:")
        for p_file in potential_files:
            print(p_file)
        # Pots assignar manualment un fitxer aquí, per exemple:
        # spectrum_file = potential_files[0]  # Triar el primer, o especifica el camí.
    else:
        print("No hi ha fitxers amb 'transmission' o 'spectrum' en el nom. Comprova la llista completa d'arxius.")

# Si hem trobat (o assignat) el fitxer, procedim a l'anàlisi.
if spectrum_file:
    print(f"\nFitxer d'espectre trobat: {spectrum_file}")
    # Carreguem les dades amb pandas.
    # Assumim un format de fitxer delimitat per espais blancs o comes, amb possibles comentaris (#).
    # Les columnes típiques són: wavelength (longitud d'ona en μm), depth o (Rp/Rs)^2 (profunditat de trànsit), error (incertesa).
    # Si el format no coincideix, ajusta les columnes manualment (names=['wavelength', 'depth', 'error']).
    # Pots inspeccionar el fitxer amb pd.read_csv(..., nrows=10) per veure les columnes.
    try:
        df = pd.read_csv(spectrum_file, comment='#', delim_whitespace=True, names=['wavelength', 'depth', 'error'])
    except Exception as e:
        print(f"Error carregant amb noms assumits: {e}")
        try:
            df = pd.read_csv(spectrum_file, comment='#', delim_whitespace=True)
            print("Columnes detectades automàticament:", df.columns)
        except Exception as e2:
            print(f"Error carregant el fitxer: {e2}")
            df = None

    if df is not None:
        # Mostrem una previsualització de les dades per verificar que s'han carregat correctament.
        # Això imprimeix les primeres 5 files del DataFrame.
        print("\nPrevisualització de les dades:")
        print(df.head())

        # Anàlisi bàsica: calcularem estadístiques descriptives de la profunditat de trànsit.
        # Això inclou mitjana, desviació estàndard, mínim, màxim, etc.
        # Assumim que la columna de profunditat és 'depth' o la segona columna.
        depth_col = 'depth' if 'depth' in df.columns else df.columns[1]
        print("\nEstadístiques descriptives de la profunditat de trànsit:")
        print(df[depth_col].describe())

        # Anàlisi addicional: identifiquem possibles característiques d'absorció.
        # Per exemple, cerquem on la profunditat és major que la mitjana + 1 desviació estàndard (possibles pics).
        mean_depth = df[depth_col].mean()
        std_depth = df[depth_col].std()
        absorption_features = df[df[depth_col] > mean_depth + std_depth]
        print("\nPossibles característiques d'absorció (profunditat > mitjana + 1 SD):")
        print(absorption_features)

        # Visualització: traçem l'espectre de transmissió amb barres d'error.
        # Utilitzem un gràfic de punts amb errors (errorbar) per mostrar les dades.
        # Assumim columnes: 'wavelength', depth_col, 'error' si existeix.
        plt.figure(figsize=(10, 6))  # Definim la mida de la figura per millor visibilitat.
        error_col = 'error' if 'error' in df.columns else None
        plt.errorbar(df['wavelength'], df[depth_col], yerr=df[error_col] if error_col else None, fmt='o', label='Espectre de transmissió', color='blue')

        # Afegim una línia horitzontal per la mitjana de profunditat com a referència.
        plt.axhline(y=mean_depth, color='red', linestyle='--', label='Mitjana de profunditat')

        # Etiquetes i títol per fer el gràfic més informatiu.
        plt.xlabel('Longitud d\'ona (μm)')  # Eix X: longitud d'ona en micròmetres.
        plt.ylabel('(Rp/Rs)^2 o profunditat de trànsit')  # Eix Y: ràtio de radi o profunditat.
        plt.title('Espectre de transmissió de WASP-39b (JWST)')  # Títol del gràfic.
        plt.legend()  # Mostrem la llegenda.
        plt.grid(True)  # Afegim una graella per facilitar la lectura.
        plt.show()  # Mostrem el gràfic a Colab.

        # Suggeriments per continuar l'anàlisi:
        # - Ajusta les columnes si no coincideixen (p.ex. df = df.rename(columns={df.columns[0]: 'wavelength', df.columns[1]: 'depth', df.columns[2]: 'error'}))
        # - Per un ajust de model (p.ex. atmosfera amb aigua), pots importar scipy i utilitzar curve_fit.
        # - Per detectar pics, utilitza scipy.signal.find_peaks sobre la columna de profunditat.
        # Exemple: from scipy.signal import find_peaks; peaks, _ = find_peaks(df[depth_col]); print(df.iloc[peaks])
        # - Per anàlisi química, compara amb models teòrics o utilitza paquets com taurex o petitRADTRANS si estan disponibles.
else:
    print("No es pot procedir sense un fitxer d'espectre. Assigna 'spectrum_file' manualment basant-te en la llista.")

--2026-02-10 12:29:33--  https://zenodo.org/records/10161743/files/ERS_DataSynthesis_Zenodo.zip?download=1
Resolving zenodo.org (zenodo.org)... 188.185.48.75, 137.138.52.235, 188.184.98.114, ...
Connecting to zenodo.org (zenodo.org)|188.185.48.75|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 1738391871 (1.6G) [application/octet-stream]
Saving to: ‘data.zip’

data.zip             22%[===>                ] 377.32M  16.2MB/s    eta 85s    