### Ugrás ide: <a id="top"></a>
    
#### [Adatgenerálás](#data)

#### [Ábrázolás](#plot)

#### [Mintavétel](#sampling)

#### [Eredmények](#result)

In [486]:
import numpy as np
from scipy.signal import hilbert

import pandas as pd

from matplotlib import pyplot as plt
import altair as alt

### Adatgenerálás <a id="data"></a>

#### [vissza](#top)

Az alábbi függvény adott frenkvenciájú, hosszú (másodpercekben megadva) és mintavételezési frekvenciájú, tiszta és zajos színusz hullámokat generál, illetve ezeknek veszi a fázisszögét hilbert transzformáció segítségével. (A zaj normális eloszlású, nulla várhatóértékű, a szórását meg lehet adni paraméterként, a default itt 0.2).

In [493]:
def sinewave(frequency, interval, sampling_frequency, noise_scale=0.2):

    time = np.linspace(0, interval, interval * sampling_frequency)
    sine = np.sin(time * 2 * np.pi * frequency)
    noisy_sine = sine + np.random.normal(0, noise_scale, size=sine.shape[0])
    hilbert_trans = np.angle(hilbert(sine))
    noisy_hilbert = np.angle(hilbert(noisy_sine))

    return pd.DataFrame(
        {
            "time": time * 1000,
            "sine": sine,
            "noisy sine": noisy_sine,
            "hilbert": hilbert_trans,
            "noisy hilbert": noisy_hilbert,
        }
    )

Itt most egy 1080 másodperc (18 perc) hosszúságú szakaszt veszek, így minden trial-re pont egy perc jut.

In [495]:
np.random.seed(0)
data = sinewave(40, 1080, 1000)

Így néz ki az adat:

In [499]:
data.head(5)

Unnamed: 0,time,sine,noisy sine,hilbert,noisy hilbert
0,0.0,0.0,0.35281,-1.570796,-1.180761
1,1.000001,0.24869,0.328722,-1.30877,-1.209424
2,2.000002,0.481754,0.677502,-1.038261,-0.992637
3,3.000003,0.684548,1.132726,-0.802979,-0.588595
4,4.000004,0.844328,1.21784,-0.537555,-0.1033


Az alábbi átalakítás csak az ábrázoláshoz kell. (Egy oszlopba rendezi az eredeti jelet és a transzformáltakat, és hozzárendeli a típusukat egy plusz oszlopban.) A csomag, amit használok (```altair```), ezt az adatformát érti. Ennek a használata kicsit bonyolultabb, meg lehetne sokkal egyszerűbben is oldani a vizualizációt, de így szebbek az ábrák. Ha fontosabb, hogy átláthatóbb legyen a kód, megcsinálom ```matplotlib```-bel.

In [413]:
def format_data(data, index_col):

    return pd.concat(
        [
            data[[index_col, c]].assign(data_type=c).rename(columns={c: "values"})
            for c in data.columns
            if c != index_col
        ]
    ).reset_index(drop=True)

Ez így néz ki:

In [502]:
format_data(data, "time").sample(5)

Unnamed: 0,time,values,data_type
305120,305120.282519,-0.926737,sine
2600733,440733.408086,0.542386,hilbert
3505343,265343.245688,2.721717,noisy hilbert
1252402,172402.159632,0.657285,noisy sine
1764250,684250.633565,0.363012,noisy sine


### Ábrázolás <a id="plot"></a>

#### [vissza](#top)

Az alábbi függvény tetszőleges intervallumon ábrázolja a kért hullámokat.

In [415]:
def sineplot(data, interval, signals):

    filtered = format_data(data, "time").loc[
        lambda df: df["data_type"].isin(signals) & (df["time"] <= interval + 1)
    ]

    base = (
        alt.Chart(
            filtered,
            title="First {} milliseconds of the generated wave\n\n".format(interval),
        )
        .encode(
            alt.X(
                "time",
                title="Time (in milliseconds)",
                scale=alt.Scale(domain=(0, interval), nice=False),
            )
        )
        .properties(width=800, height=400)
    )

    yscale = max(abs(filtered["values"].min()), filtered["values"].max(),) * 2

    lines = base.mark_line().encode(
        alt.Y("values", title=None, scale=alt.Scale(domain=(-yscale, yscale)),),
        color="data_type",
    )

    return lines

In [504]:
sineplot(data, 25, ["sine"])

![alt text](https://github.com/dormanh/gamma-project/blob/master/plots/sine.png)

In [503]:
sineplot(data, 500, ["sine", "noisy hilbert"])

![alt text](https://github.com/dormanh/gamma-project/blob/master/plots/noisy_sine_gamma.png)

### Mintavétel <a id="sampling"></a>

#### [vissza](#top)

Beosztom az adatot 18 trial-re, és mindegyikből random fázisértékről indítva veszek egy 8 $\times$ 48 ms-os mintát.

In [899]:
def sampler(data, phase=25, trials=18, sample_size=8, sample_length=48):

    sections = data.reshape(trials, -1)
    start_from = np.random.choice(
        np.arange(sections.shape[1] - sample_size * sample_length), trials
    )

    return {
        "starting phases": np.array(
            [[(s + 48 * n) % 25 for n in range(sample_size)] for s in start_from]
        ),
        "samples": np.array(
            [
                sections[trial, s : s + sample_size * sample_length].reshape(
                    sample_size, sample_length
                )
                for trial, s in enumerate(start_from)
            ]
        ),
    }

In [900]:
np.random.seed(0)
samples = sampler(data["hilbert"].values)
noisy_samples = sampler(data["noisy hilbert"].values)

Az alábbi két függvény kiválasztja a felismert és nem felismert képekhez tartozó szakaszokat.
- A ```random_split``` véletlenszerűen választ és várható értéken 4-4 (felismert-nem felismert) szakaszra osztja a mintát. Hogy megfeleljen a kísérleti design-nak, ez nem determinisztikus, hanem minden szakasz 50% valószínűséggel kerül a felismertek közé (tehát lehet olyan trial, ahol több, mint 4 vagy kevesebb, mint 4 felismert kép van).
- A ```synced_split``` azokat a szakaszokat sorolja be a felismert képekhez, amelyek kezdőértéke a fázis adott tartományába esik. Ez hivatott szimulálni azt az esetet, mikor a felismert képek egybeesnek a gamma fázisával. Az egybeesés nem teljes, mert úgy nem minden trial-ben lennének mindkét esetre minták, és összességében a felismert képek aránya jóval kisebb lenne, mint az előző esetben.

A függvények ezután minden trial-re kiszámolják a két csoport (felismert és nem felismert) átlagának különbségét. Így egy 18 $\times$ 48-as mátrixot kapunk.

In [885]:
def random_split(samples):

    recognized = np.random.binomial(1, 0.5, size=samples["samples"].shape[:2]).astype(bool)

    return np.array(
        [
            sample[np.where(recognized[trial])].mean(axis=0)
            - sample[np.where(~recognized[trial])].mean(axis=0)
            for trial, sample in enumerate(samples["samples"])
        ]
    )

In [902]:
def synced_split(samples):

    return np.array(
        [
            np.array(
                [
                    s
                    for k, s in enumerate(sample)
                    if samples["starting phases"][trial, k] <= 12
                ]
            ).mean(axis=0)
            - np.array(
                [
                    s
                    for k, s in enumerate(sample)
                    if samples["starting phases"][trial, k] > 12
                ]
            ).mean(axis=0)
            for trial, sample in enumerate(samples["samples"])
        ]
    )

### Eredmények <a id="result"></a>

#### [vissza](#top)

Kiszámolom a fáizskülönbségek átlagát, standard hibáját és szórását az összes trial-re. Az ábrákhoz megfelelő formátumúvá alakítom az adatot és ábrázolom az eredményeket.

In [926]:
def result_df(diffs):

    return (
        pd.DataFrame(
            {
                "MEAN": diffs.mean(axis=0),
                "SE": diffs.std(axis=0) / np.sqrt(diffs.shape[0]),
                "STD": diffs.std(axis=0),
            }
        )
        .reset_index()
        .assign(
            SE_bottom=lambda df: df["MEAN"] - df["SE"],
            SE_top=lambda df: df["MEAN"] + df["SE"],
            STD_bottom=lambda df: df["MEAN"] - df["STD"],
            STD_top=lambda df: df["MEAN"] + df["STD"],
            NULL=0,
        )
    )

In [956]:
np.random.seed(0)
result_rand = result_df(random_split(samples))
result_synced = result_df(synced_split(samples))
noisy_result_rand = result_df(random_split(noisy_samples))
noisy_result_synced = result_df(synced_split(noisy_samples))

In [928]:
result_synced.head(5)

Unnamed: 0,index,MEAN,SE,STD,SE_bottom,SE_top,STD_bottom,STD_top,NULL
0,0,-0.30718,0.349055,1.480917,-0.656235,0.041876,-1.788097,1.173737,0
1,1,0.449128,0.318098,1.349575,0.131031,0.767226,-0.900446,1.798703,0
2,2,0.722564,0.316602,1.343229,0.405962,1.039166,-0.620664,2.065793,0
3,3,1.653406,0.173696,0.73693,1.479709,1.827102,0.916475,2.390336,0
4,4,1.857028,0.197217,0.836719,1.659812,2.054245,1.020309,2.693748,0


In [959]:
def plot_result(result, condition):

    title = "Mean phase difference between recognized and unrecognized pictures ({} condition)".format(
        condition
    )

    dfs = [
        format_data(result[["index", "SE_bottom", "STD_bottom"]], "index")
        .rename(columns={"values": "bottom", "data_type": "type"})
        .assign(data_type=lambda df: df["type"].apply(lambda x: x.strip("_bottom")))
        .drop("type", axis=1)
        .merge(
            format_data(result[["index", "SE_top", "STD_top"]], "index")
            .rename(columns={"values": "top", "data_type": "type"})
            .assign(data_type=lambda df: df["type"].apply(lambda x: x.strip("_top")))
            .drop("type", axis=1),
            on=["index", "data_type"],
            how="outer",
        ),
        format_data(result[["index", "MEAN", "NULL"]], "index"),
    ]

    bases = [
        alt.Chart(df, title=title,)
        .encode(
            alt.X(
                "index",
                title="Time (in millisecconds)",
                scale=alt.Scale(domain=(0, result.shape[0] - 1), nice=False),
            )
        )
        .properties(width=800, height=400)
        for df in dfs
    ]

    yscale = max(abs(result["STD_bottom"].min()), result["STD_top"].max())

    return bases[0].mark_area(opacity=0.5).encode(
        alt.Y("bottom", title=None, scale=alt.Scale(domain=(-yscale, yscale))),
        alt.Y2("top"),
        color="data_type",
    ) + bases[1].mark_line().encode(alt.Y("values"), color="data_type")

Ha minden igaz, az alábbi két ábra szemlélteti a kísérleti eredményt. Véletlenszerű választás esetén a fáziskülönbség alig tér el nullától, míg a szinkronizált kondícióban szisztematikus különbség figyelhető meg. 

In [960]:
plot_result(noisy_result_rand, "random")

![alt text](https://github.com/dormanh/gamma-project/blob/master/plots/random_result.png)

In [961]:
plot_result(noisy_result_synced, "synchronized")

![alt text](https://github.com/dormanh/gamma-project/blob/master/plots/synced_result.png)