# Analiza zawartości zasad w sekwencjach FASTQ

Ten notebook pokazuje jak:
- sparsować plik FASTQ do DataFrame Polars,
- wywołać funkcję Rust analizującą zawartość zasad na każdej pozycji,
- zwizualizować wynik.

In [None]:
# Importy
import polars as pl
from polars_bio.base_content import base_sequence_content, plot_base_content

## Wczytaj przykładowy plik FASTQ i przygotuj DataFrame

Zakładamy, że plik `example.fastq` znajduje się w katalogu wyżej (`../example.fastq`).

In [None]:
from pathlib import Path

def read_fastq_sequences(path):
    """
    Prosty parser FASTQ: zwraca listę sekwencji nukleotydowych.
    """
    sequences = []
    with open(path) as f:
        while True:
            header = f.readline()
            if not header:
                break
            seq = f.readline().strip()
            plus = f.readline()
            qual = f.readline()
            if seq:
                sequences.append(seq)
    return sequences

fastq_path = Path("../example.fastq")
sequences = read_fastq_sequences(fastq_path)

# Tworzymy DataFrame Polars
df = pl.DataFrame({"sequence": sequences})
df.head()

## Analiza zawartości zasad na każdej pozycji

Wywołujemy funkcję Rust przez Python, która zwraca proporcje zasad A, T, G, C na każdej pozycji.

In [None]:
base_content_df = base_sequence_content(df)
base_content_df.head()

## Wizualizacja zawartości zasad

Wykres pokazuje proporcje zasad na każdej pozycji w odczytach.

In [None]:
plot_base_content(base_content_df)