<h5> Material do curso: <i><b>"A Beginners guide to extracting PsychoPy data using python"</b></i>
<br> <i>Presented at: University of Nottingham, BSc course</i></h5> <br>

> Disponibilizado pela Psychopy.org

<h2>Extraindo dados dos experimentos & convergindo em uma tabela csv</h2>

> Importando as bibliotecas 

In [1]:
import pandas as pd
import numpy as np
from psychopy import gui

> Abrindo o arquivo csv

In [2]:
#abre o arquivo csv com as informações sobre o experimento (arquivos csv do psychopy)
filename = "data/850000_numberstroop_2023-01-27_15h36.40.741.csv"


In [3]:
#importa o arquivo csv para um DataFrame do Pandas
data = pd.read_csv(filename)

#Mostra a tabela
data.head(5)


Unnamed: 0,thisBlock,leftnum,rightnum,leftsize,rightsize,condition,corrAns,blocks.thisRepN,blocks.thisTrialN,blocks.thisN,...,fbtxt.stopped,byetxt.started,byetxt.stopped,participant,session,date,expName,psychopyVersion,frameRate,Unnamed: 39
0,,,,,,,,,,,...,,,,850000.0,1.0,2023-01-27_15h36.40.741,numberstroop,2022.2.4,59.867191,
1,conditions1.xlsx,2.0,6.0,0.05,0.1,congruent,right,0.0,0.0,0.0,...,11.662443,,,850000.0,1.0,2023-01-27_15h36.40.741,numberstroop,2022.2.4,59.867191,
2,conditions1.xlsx,6.0,2.0,0.05,0.1,incongruent,left,0.0,0.0,0.0,...,13.462011,,,850000.0,1.0,2023-01-27_15h36.40.741,numberstroop,2022.2.4,59.867191,
3,conditions1.xlsx,6.0,2.0,0.1,0.05,congruent,left,0.0,0.0,0.0,...,14.980136,,,850000.0,1.0,2023-01-27_15h36.40.741,numberstroop,2022.2.4,59.867191,
4,conditions1.xlsx,2.0,6.0,0.1,0.05,incongruent,right,0.0,0.0,0.0,...,16.664805,,,850000.0,1.0,2023-01-27_15h36.40.741,numberstroop,2022.2.4,59.867191,


> Extraindo uma informação específica

In [4]:
participante = data['participant'][0]
participante

850000.0

> Para este experimento, estamos interessados no tempo de reação. Então iremos extrair apenas aquela informação da tabela. Como? 

In [5]:
#selecionando um subconjunto de uma coluna baseada em outra coluna

congruente_tempo_reacao = data.loc[data['condition'] == 'congruent']['key_resp.rt']
incongruente_tempo_reacao = data.loc[data['condition'] == 'incongruent']['key_resp.rt']
neutro_tempo_reacao = data.loc[data['condition'] == 'neutral']['key_resp.rt']

#o data.loc procura pelas linhas da tabela onde uma determinada condição é aceita.
#e então usamos o ['key_resp.rt'] para pegar apenas as informações do tempo de reação



> Tendo essas informações separadas, agora podemos summarize them. Calcular a média de cada uma das categorias para aquele participante.

> Faremos isso usando a biblioteca `Numpy`

In [6]:
media_congruente = np.average(congruente_tempo_reacao)
media_incongruente = np.average(incongruente_tempo_reacao)
media_neutro = np.average(neutro_tempo_reacao)

In [7]:
print(f"Para o participante {participante} as médias de tempo de reação foram: \n A média de congruentes foi {media_congruente},\n A média de incongruentes foi {media_incongruente}\n A média de neutros foi {media_neutro} ")

Para o participante 850000.0 as médias de tempo de reação foram: 
 A média de congruentes foi 0.50446889011655,
 A média de incongruentes foi 0.517305810097605
 A média de neutros foi 0.4051484901166987 


> Certo, agora que tal fazermos isso para todos os participantes?

> Podemos enfim utilizar o `Psychopy` para selecionar uma range de arquivos para podermos sumarizar em uma só tabela.

In [8]:
from psychopy import gui

#abre uma janela para selecionar todos os arquivos de dados.
files = gui.fileOpenDlg()

QApplication: invalid style override 'adwaita' passed, ignoring it.
	Available styles: Windows, Fusion


In [9]:
files

['/home/juliana/Documents/EYEtracking-gitrepo/eye_data/workshops/data/990492_numberstroop_2023-01-27_16h54.04.641.csv',
 '/home/juliana/Documents/EYEtracking-gitrepo/eye_data/workshops/data/850000_numberstroop_2023-01-27_15h36.40.741.csv',
 '/home/juliana/Documents/EYEtracking-gitrepo/eye_data/workshops/data/108174_numberstroop_2023-01-27_16h47.57.577.csv']

> Agora vamos organizar o formato do nosso arquivo de saída para podermos enfim tê-lo.

> Usaremos um `Dictionary` uma estrutura de dados que utiliza conceito de chave e valor.

In [17]:
output = {'participante': [], 'media_rt_congruente':[], 'media_rt_incongruente':[],'media_rt_neutro':[]}

> Agora adicionamos o resultado no dicionário

In [11]:
output['participante'].append(participante)
output['media_rt_congruente'].append(media_congruente)
output['media_rt_incongruente'].append(media_incongruente)
output['media_rt_neutro'].append(media_neutro)

> Finalmente, iremos rodar para todos os arquivos.Utilizando um `loop`

In [18]:
for nome_arquivo in files:
    data = pd.read_csv(nome_arquivo)

    #pegue uma coluna nomeada do dataframe
    response_times = data['key_resp.rt']

    #pegue o nome do participante
    participante = data['participant'][0]

    congruente_tempo_reacao = data.loc[data['condition'] == 'congruent']['key_resp.rt']
    incongruente_tempo_reacao = data.loc[data['condition'] == 'incongruent']['key_resp.rt']
    neutro_tempo_reacao = data.loc[data['condition'] == 'neutral']['key_resp.rt']

    media_congruente = np.average(congruente_tempo_reacao)
    media_incongruente = np.average(incongruente_tempo_reacao)
    media_neutro = np.average(neutro_tempo_reacao)

    #adicione os valores ao dicionário

    output['participante'].append(participante)
    output['media_rt_congruente'].append(media_congruente)
    output['media_rt_incongruente'].append(media_incongruente)
    output['media_rt_neutro'].append(media_neutro)


> Salve o resultado em um arquivo .csv

In [19]:
#converte o dicionário em um dataframe
output_df = pd.DataFrame.from_dict(output)

#salva o dataframe como um csv
output_df.to_csv('all_participants.csv',index=False)
#o index=False indica se queremos uma coluna indicando o número da linha