Skip to content

Препроцессинг данных

Soboleva Natalia edited this page Nov 23, 2017 · 2 revisions

22/11/17

  1. Что сделали:

    1. Изучили mne I/O, научились визуализировать имеющиеся данные и изучили особенности имеющегося датасета.

    2. Проанализировали имеющуюся информацию, выделили несколько гипотез и задач для дальнейшего исследования.

  2. Идеи для обработки каналов:

    1. Изучить ковариацию между каналами. После выделения ковариации удалять неинформативные каналы. Есть два варианта подсчета ковариации:

      а) Сравнивать каналы в течение всего времени наблюдения

      б) Разбить все время наблюдения на временные интервалы, считать ковариации отдельно на интервалах. Проблемы такого подхода: валидность подхода в целом и неоднозначность разбиения (в случае ЭЭГ и распознавания эмоций: в течение какого времени испытывается эмоция и как научиться разбивать так, чтобы эмоция оказалась на одном временном промежутке).

    2. Разбить все множетво каналов на подмножества, ориентируясь при этом на:

      а) Ковариацию каналов по всему датасету

      б) Знания о каналах из нейробиологии

    3. Научиться отделять тренды от локальных колебаний и учитывать их отдельно.

    4. Научиться выделять "сезонность" (общие пики).

    5. Научиться отлавливать выбросы - возможны проблемы с датчиками. (Например, датчик FP2 в resting_state/zavrin_open_eyes_eeg_15021500.vhdr, на 20-25 секунде). Также можно посмотреть на расположение датчиков относительно друг друга. Drop Out Example

  3. Вопросы про датасет:

    1. В одно и то же время люди испытывают одинаковые эмоции?

    2. Стоит ли разбивать на части по времени?

    3. Какие единицы измерения времени?

    4. Может ли помочь локализация датчиков? Должны ли показания по соседним датчикам коррелировать? Выделяются ли отдельные активные области в зависимость от наблюдаемых явления (эмоций). Это помогло бы ловить выбросы.

    5. Локализация изучаемых явлений по времени? (имеет ли смысл делать сжатие по времени? В какой степени?)

    6. Что такое небольшие пики на большей чати рядов в одно время? Пульс? Моргание?

    7. За что отвечают среднее, дисперсия, тренд? Как примерно влияет эмоция на показания датчика?

    8. Как учитывать особенности отдельного объекта наблюдения?

    9. Может ли о чем-то говорить резкое изменение? Это выброс? Какие еще возможны выбросы?

    10. Что означают в файлах названия: _post_eeg, _pre_eeg, и др?

  4. Выделенные проблемы и решения:

    1. Реализовать подсчет корреляции, учесть валидность разбиения по времени и подмножествам.

    2. Нет локализации датчиков. Если может быть полезно их использовать (см 3.4), можно восстановить необходимую информацию, сопоставив названия каналов и карту датчиков ЭЭГ.