In [None]:
# Dependencias.
import scipy.io
from preprocessing_functions import read_rhd
%matplotlib widget
import h5py
import os
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import probeinterface as pi
import spikeinterface as si
import spikeinterface.widgets as sw
import spikeinterface.sorters as ss
import spikeinterface.exporters as exp
import seaborn as sns # <- Para graficos estadisticos
from preprocessing_functions import read_rhd, get_recording, check_concatenation, process_artifacts, espigas, sorting_analyzer, create_folders

from pathlib import Path
from spikeinterface.extractors import read_intan
import spikeinterface.preprocessing as prep
from probeinterface import Probe, ProbeGroup

# global kwargs for parallel computing
job_kwargs = dict(
    n_jobs=-1,
    chunk_duration='1s',
    progress_bar=True,
)

si.set_global_job_kwargs(**job_kwargs)

### Defición de parametros.
:penci2: para el ejemplo, se almacenan todos los pasos intermedios  :bowtie:

In [None]:
# paso 1
# Nombre base de experimento, se crearán carpetas y archivos con este nombre.
base_name = 'PF11_Day10'
artifact_maze = "selected_"
artifact_sleep = 'selected_'
# Archivo de configuración del probegroup, existente en la carpeta "probes"
probegroup_file = 'probes/anillo_probe.json'

# Configuración de carpetas de procesamiento
preprocess_folder = Path('preprocess/',base_name)

# Archivos de Excel para la información de registros
# como inicio se recomienda solo poner un dia en el excel de información de archivos, este es el punto de inicio para hacer una maquina de salchichas para todos los días del animal
folder_maze = Path(r'D:\ephys\PF11\Maze\Day10')
folder_sleep = Path(r'D:\ephys\PF11\Sleep\Day10')

In [None]:
# paso 2
# Definir carpetas de sorting.
# Single sorting
sorter_folder, analyzer_folder, phy_output_folder = create_folders(base_name)
# Group sorting
group_sorter_folder, group_analyzer_folder, group_phy_output_folder = create_folders(base_name, group=True)

# Procesar archivos
record_maze = get_recording(folder_maze, artifact_maze, probegroup_file)
record_sleep = get_recording(folder_sleep, artifact_sleep, probegroup_file)
recording = check_concatenation(record_maze, record_sleep)

### Inspeccion de los resultados.
Revise:
Se haya realizado el procedimiento de concatenado.
Se removieron los artefactos.
Nombres de los canales.

importante: Con el fin de mejorar la visualización, los datos no estan escalados. Para presentarlos escalados (uV) defina return_scaled=True

In [None]:
# plot and check spikes
mode = "line"
w = sw.plot_traces(recording=recording,  
                   mode=mode, time_range=(0, 105), color_groups=True, return_scaled=False,
                  show_channel_ids=True, order_channel_by_depth=False, backend="ephyviewer")

recording

### Eliminacion de canales.
indique los canales a eliminar, para ello utilice el nombre ("Channel ID") que se le da en Intan. Observe el ejemplo.
Confirme que se haya realizado la eliminación ejecutando la celda anterior.

In [None]:
bad_channels =["A-019", "A-023"]
recording=recording.remove_channels(bad_channels)

### Guardar archivos preprocesados
Guardar archivos preprocesados como binarios.

#### Guardar el registro completo

In [None]:
recording.save(folder=preprocess_folder, overwrite=True, **job_kwargs)
    # rec_artifacts.save(folder=preprocess_artifacts, **job_kwargs) # ejercicio para guardar registro sin la eliminaciòn de artefactos.

#### Guardar un segmento del registro

In [None]:
sliced_rec=recording.time_slice(start_time=0, end_time=2000)
sliced_rec.save(format='binary', folder=Path('preprocess/slic3d'), overwrite=True, **job_kwargs)

#### Leer el registro guardado

In [None]:
recording = si.load_extractor(preprocess_folder)

## Ejecutar un sorter
ejecutar Kilosort

### revisar parametros de entrada (configuracion)
parametros especificos para kilosort (pasables por kwargs):  
https://kilosort.readthedocs.io/en/latest/parameters.html  
https://github.com/MouseLand/Kilosort/blob/main/kilosort/parameters.py

In [None]:
# limpiar la memoria de torch antes de procesar el sorter.
import torch
torch.cuda.empty_cache()

ss.get_default_sorter_params('kilosort4')

## Kilosort 4

In [None]:
params_kilosort4 = {## MAIN_PARAMETERS 
                    'batch_size': 60000,
                    'nblocks': 0,
                    'Th_universal': 7,
                    'Th_learned': 6,
                    ## Preprocessing
                    'artifact_threshold': 1000,
                    ## SPIKE DETECTION
                    'min_template_size': 10,
                    'template_sizes':5,
                    'nearest_chans': 4,
                    'nearest_templates': 15,
                    'max_channel_distance': 60,
                    'templates_from_data': True,   
                    'n_pcs':10,
                    'Th_single_ch': 4,
                    ## Clustering
                        'acg_threshold':0.1,
                        #'cluster_downsampling':10,
                    ## extras
                        #'binning_depth':4,
                        #'drift_smoothing':[0.3, 0.3, 0.3],
                    'skip_kilosort_preprocessing': False,} # se crea un diccionario donde se pueden pasar las variables modificadas al sorter.

### Sorting en bulto

In [None]:
sorter = ss.run_sorter(
                sorter_name='kilosort4',
                recording = recording,
                verbose=True,
                folder = sorter_folder,
                remove_existing_folder=True,  ## CUIDADO, SOBREESCRIBE LOS DATOS EN CASO DE HABER UNA CARPETA, PARA DESHABILITAR PONER =FALSE
                **params_kilosort4)

In [None]:
num_clusters, total_spikes= espigas(sorter)
print(f"Número total de clusters: {num_clusters}")
print(f"Número total de espigas: {total_spikes}")

In [None]:
analyzer=sorting_analyzer(sorter, recording, output_folder=analyzer_folder)

In [None]:
exp.export_to_phy(sorting_analyzer=analyzer, 
                  remove_if_exists=True, 
                  copy_binary=True, 
                  output_folder=phy_output_folder)

El enfoque implementado tiene como objetivo mejorar el rendimiento del spike sorting al segmentar el proceso por grupos de canales o regiones de la grabación. Al realizar el spike sorting por partes, se reduce significativamente la demanda de memoria y el uso de GPU en cada ejecución. Esto es especialmente útil cuando se trabaja con grabaciones de gran tamaño o cuando la capacidad de la GPU es limitada.

Dividiendo el registro en grupos, el sorter puede operar en fragmentos más pequeños, lo que permite manejar mejor los recursos del sistema y evitar problemas como errores de "out of memory" (falta de memoria). Después de realizar el spike sorting por grupos, los resultados se combinan, permitiendo un análisis y exportación global sin sacrificar la eficiencia durante el proceso de clasificación inicial.

Este enfoque balancea el uso de recursos, optimizando el uso de la GPU sin comprometer la calidad del análisis final.

In [None]:
# Dividir la grabación por grupos
split_recording = recording.split_by("group")

# Diccionario para almacenar los resultados de sorting por grupo
sortings = {}

# Ejecutar el sorter en cada grupo
for group, sub_recording in split_recording.items():
    sorting = run_sorter(
        sorter_name='kilosort4',
        recording=sub_recording,  # Usar la subgrabación del grupo
        output_folder=f"fKS4_group{group}"
    )
    sortings[group] = sorting  # Almacenar los resultados del sorter para este grupo

# Combinar los resultados de sorting de todos los grupos
combined_sorting = si.concatenate_sortings(*sortings.values())

# Información de clusters y espigas para cada grupo
num_clusters, total_spikes = espigas(combined_sorting)
print(f"  Número total de clusters: {num_clusters}")
print(f"  Número total de espigas: {total_spikes}")

# Realizar análisis global con el sorting combinado
combined_analyzer = sorting_analyzer(combined_sorting, recording, output_folder='combined_analyzer_folder')

# Exportar los resultados globales a Phy
exp.export_to_phy(sorting=combined_analyzer,  # Sorting combinado
                  recording=recording,        # Grabación completa
                  remove_if_exists=True,
                  copy_binary=True,
                  output_folder='combined_phy_output_folder')


### leer un analisis

In [None]:

folder = 'output/AN/kilosort/analyzer_Rev9'
analyzer = si.load_sorting_analyzer(folder)

In [None]:
exp.export_to_phy(sorting_analyzer=analyzer, 
                  remove_if_exists=True, 
                  copy_binary=True, 
                  output_folder=Path('output/AN/kilosort/phy_rev9v2'))

In [None]:
import spikeinterface.widgets as sw

sw.plot_spikes_on_traces(sorting_analyzer= analyzer, 
                         segment_index=None, 
                         channel_ids=None, 
                         unit_ids=None, 
                         order_channel_by_depth=False, 
                         time_range=None, 
                         unit_colors=None, 
                         sparsity=None, 
                         mode='auto', 
                         return_scaled=False, 
                         cmap='RdBu', 
                         show_channel_ids=False, 
                         color_groups=False, 
                         color=None, 
                         clim=None, 
                         tile_size=512, 
                         seconds_per_row=0.2, 
                         scale=1, 
                         spike_width_ms=4, 
                         spike_height_um=20, 
                         with_colorbar=True, 
                         backend="ipywidgets")


In [None]:
from spikeinterface.postprocessing import compute_principal_components
from spikeinterface.qualitymetrics import compute_quality_metrics, get_quality_metric_list

In [None]:
get_quality_metric_list()

In [None]:
metrics = compute_quality_metrics(analyzer, metric_names=["snr", "isi_violation", "nearest_neighbor", "firing_rate", 'presence_ratio', 'amplitude_cutoff'])

In [None]:
print (metrics)

In [None]:
keep_mask = (metrics["amplitude_cutoff"] < 1e-6)
print(keep_mask)

In [None]:
keep_unit_ids = keep_mask[keep_mask].index.values
keep_unit_ids = [unit_id for unit_id in keep_unit_ids]
print(keep_unit_ids)

In [None]:
from scipy.ndimage.filters import gaussian_filter1d
plt.rcParams.update({'font.size': 14})

def plot_metric(data, bins, x_axis_label, color, max_value=-1):
    
    h, b = np.histogram(data, bins=bins, density=True)

    x = b[:-1]
    y = gaussian_filter1d(h, 1)

    plt.plot(x, y, color=color)
    plt.xlabel(x_axis_label)
    plt.gca().get_yaxis().set_visible(False)
    [plt.gca().spines[loc].set_visible(False) for loc in ['right', 'top', 'left']]
    if max_value < np.max(y) * 1.1:
        max_value = np.max(y) * 1.1
    plt.ylim([0, max_value])
    
    return max_value

In [None]:
ss.get_default_sorter_params('spykingcircus2')


In [None]:
sorter_spykingcircus2 = ss.run_sorter(
                sorter_name='spykingcircus2',
                recording = rec_fil,
                verbose=True,
                folder = 'output/spykingcircus2',
                remove_existing_folder=True  ## CUIDADO, SOBREESCRIBE LOS DATOS EN CASO DE HABER UNA CARPETA, PARA DESHABILITAR PONER =FALSE
                )

In [None]:
log_file = "logs/spike_sorting.log"
experiment_data = recreate_experiment(log_file)

if experiment_data:
    # Cargar grabaciones
    recording = read_rhd(Path(experiment_data["rhd_files"][0]).parent)
    probegroup = pi.read_probeinterface(experiment_data["probegroup_file"])
    
    # Aplicar procesamiento
    recording = prep.bandpass_filter(recording, freq_min=500., freq_max=9000.)
    recording = recording.set_probegroup(probegroup, group_mode='by_probe')
    
    if "triggers" in experiment_data:
        recording = prep.remove_artifacts(
            recording=recording,
            list_triggers=experiment_data["triggers"],
            ms_after=500,
            mode="zeros"
        )
    
    print("Experimento recreado exitosamente.")
else:
    print("No se pudo recrear el experimento.")
