# Obtención de señales

## Adquisición de señales

### Digitalización de señales

<div style="text-align: justify">
La información contenida en una señal analógica se encuentra no sólo en el valor que presenta en determinado momento, sino también en la forma en que varía, en los valores máximos y mínimos que alcanza, así como en las reglas que sigue para modificar su valor en el tiempo. Para extraer esta información se requiere conocerla exactamente durante un intervalo de tiempo, para que sea posible analizarla.

Como en la actualidad el procedimiento de análisis recurre a la asistencia de la computadora y ésta trabaja con un formato completamente distinto del analógico, se hace necesario que esta señal sea transformada al formato digital a fin de que pueda ser compatible con los procesos internos de la computadora. Para lograr esta transformación, se hace uso de dos procedimientos que sirven para reducir a una cantidad finita y manejable los valores infinitos presentados por una función analógica. Estos procedimientos son el muestreo y la cuantización. El muestreo realiza una parte de la transformación o conversión entre los formatos, ya que hace que el tiempo sea discreto. Al muestrear se consigue que la señal original pueda representarse por completo y sin pérdida de información, utilizando únicamente las muestras tomadas.

#### Frecuencia de muestreo

**Teorema de Nyquist**

El teorema de Nyquist fue formulado por el ingeniero electrónico Harry Nyquist. Establece que para evitar la pérdida de información al muestrear una señal analógica y convertirla a una señal digital, la frecuencia de muestreo debe ser al menos el doble de la frecuencia más alta presente en la señal analógica.
$Fs ≥ 2F_{max}$
Donde $FS$ es la frecuencia de muestreo y $F_{max}$ es la frecuencía máxima presente en la señal analógica.

Es importante destacar que si la frecuencia de muestreo no cumple con esta condición, la señal resultante digital puede sufrir de aliasing, que es una distorsión que ocurre cuando no se capturan suficientes puntos para representar adecuadamente la señal original.


#### Ganancia

Para obtener una representación digital precisa de la señal, es necesario ajustar la ganancia adecuadamente para que la amplitud de la señal se ajuste dentro del rango de representación del sistema digital sin llegar a la **saturación**, evitando así la pérdida de información y la **introducción de ruido**. El ajuste adecuado de la ganancia garantiza que la señal se capture de manera óptima y se mantenga la fidelidad en la representación digital.

#### Filtros

El ajustar los filtros al digitalizar una señal es esencial para garantizar una representación digital precisa y libre de distorsiones. Los filtros adecuados ayudan a evitar el aliasing, reducir el ruido y los artefactos, seleccionar la banda de frecuencia relevante y mejorar la eficiencia general del proceso de digitalización. De esta manera, se obtiene una señal digital de mayor calidad y utilidad.

### Dispositivos comerciales

* **B10ware**       https://www.facebook.com/b10ware
* **OpenBCI**       https://shop.openbci.com/collections/frontpage
* **Biopac**        https://www.biopac.com
* **Bitbrain**      https://www.bitbrain.com/es
* **Unicorn**       https://www.unicorn-bi.com/es/

<img src = "../figures/Biowave.png" width = "300" height = "300">
<img src = "../figures/OpenBCI.webp" width = "300" height = "300">
<img src = "../figures/Biopac.jpg" width = "400" height = "300">
<img src = "../figures/Bitbrain.webp" width = "400" height = "300">
<img src = "../figures/Unicorn.jpg" width = "400" height = "300">

## Bases de datos

* Kaggle: https://www.kaggle.com/datasets?topic=healthDataset
* Mendeley Data: https://data.mendeley.com/
* IEEE DataPort: https://ieee-dataport.org/topic-tags/biomedical-and-health-sciences
* PysioNet: https://physionet.org/about/database/
* Data in Brief: https://www.data-in-brief.com/
* Dataset Search: https://datasetsearch.research.google.com/

### Formatos en los que se pueden encontrar

#### .mat

Los archivos .mat son archivos de datos que se utilizan comúnmente en MATLAB, un entorno de programación y software ampliamente utilizado en ciencia e ingeniería. Estos archivos .mat contienen variables y matrices multidimensionales, así como metadatos asociados.

In [None]:
# pip install scipy
from scipy import io

# Cargar el archivo .mat
data = io.loadmat('archivo.mat')

#### .npy o npz

Los archivos de extensión .npy son archivos de datos de NumPy, una biblioteca de Python utilizada para el procesamiento numérico y científico. Estos archivos .npy almacenan matrices y arreglos multidimensionales de datos de forma eficiente.

Los archivos .npz son archivos comprimidos que contienen múltiples archivos .npy de NumPy. Estos archivos .npz son útiles cuando se desea almacenar y cargar varios arreglos o matrices de NumPy de manera eficiente en un solo archivo.

In [None]:
# pip install numpy
from numpy as np

# cargar archivo .npy
data = np.load('archivo.npy')

# cargar archivo .npy
data = np.load('archivo.npy')

#### .edf

Un archivo EDF (European Data Format) es un formato de archivo utilizado para almacenar y compartir datos de señales fisiológicas y bioseñales, como electroencefalogramas (EEG), electrocardiogramas (ECG) y electromiogramas (EMG). Fue desarrollado por la Federación Internacional de Electrofisiología Clínica y está ampliamente utilizado en la comunidad médica y de investigación.

In [None]:
# pip import pyedflib
import pyedflib

# abrir archivo edf
file = pyedflib.EdfReader('archivo.edf')

# obtener información sobre las señales en el archivo
num_signals = file.signals_in_file
signal_labels = file.getSignalLabels()

# leer las señales del archivo
signals = []
for i in range(num_signals):
    signal = file.readSignal(i)
    signals.append(signal)

# cerrar el archivo EDF
file.close()

#### .txt

Un archivo de texto (.txt) es un archivo que contiene texto sin formato, es decir, caracteres y cadenas de texto legibles por humanos sin ninguna estructura específica. Los archivos de texto son comunes y se utilizan para almacenar y compartir datos en forma de texto plano.

In [None]:
# pip install numpy
import numpy as np

# cargar archivo txt
data = np.loadtxt('archivo.txt')

#### .csv, .tsv o .psv

Un archivo CSV (Comma-Separated Values) es un formato de archivo utilizado para almacenar datos tabulares en forma de texto plano. Cada línea del archivo representa una fila de datos, y los valores de cada columna están separados por comas u otros delimitadores.

Un archivo TSV (Tab-Separated Values) es un formato de archivo utilizado para almacenar datos tabulares en forma de texto plano. Al igual que los archivos CSV, cada línea del archivo representa una fila de datos, pero en lugar de usar comas como separador, se utilizan tabulaciones.

Un archivo PSV (Pipe-Separated Values) es un formato de archivo utilizado para almacenar datos tabulares en forma de texto plano. Al igual que los archivos CSV y TSV, cada línea del archivo representa una fila de datos, pero en lugar de utilizar comas o tabulaciones como separadores, se utilizan tuberías verticales (|) como separadores.

In [None]:
# pip install pandas
import pandas as pd 

# cargar archivo csv
df = pd.read_csv('archivo.csv')

# cargar archivo tsv
df = pd.read_csv('archivo.tsv', sep='\t')

# cargar archivo psv
df = pd.read_csv('archivo.psv', sep='|')

#### .wav u otros formatos de audio

Un archivo WAV (Waveform Audio File Format) es un formato de archivo de audio digital estándar utilizado para almacenar datos de audio sin comprimir. Los archivos WAV contienen muestras de audio grabadas a una determinada frecuencia de muestreo y con una precisión determinada.

In [None]:
from pydub import AudioSegment

song = AudioSegment.from_wav("never_gonna_give_you_up.wav")

song = AudioSegment.from_mp3("never_gonna_give_you_up.mp3")

## Fuentes

scipy: https://docs.scipy.org/doc/scipy/
numpy: https://numpy.org/
pyedflib: https://pyedflib.readthedocs.io/en/latest/
pandas: https://pandas.pydata.org/
pydub: https://github.com/jiaaro/pydub