# 背景任务

在一个 Stroop （斯特鲁普）任务中，参与者得到了一列文字，每个文字都用一种油墨颜色展示。参与者的任务是将文字的打印颜色大声说出来。这项任务有两个条件：一致文字条件，和不一致文字条件。在一致文字条件中，显示的文字是与它们的打印颜色匹配的颜色词，如“红色”、“蓝色”。在不一致文字条件中，显示的文字是与它们的打印颜色不匹配的颜色词，如“紫色”、“橙色”。在每个情况中，我们将计量说出同等大小的列表中的墨色名称的时间。每位参与者必须全部完成并记录每种条件下使用的时间。

说明：[点此查看此文档的英文版本](https://s3.cn-north-1.amazonaws.com.cn/static-documents/nd002/StatisticsTheScienceofDecisions-ProjectInstructions.pdf)。

# 调查问题

作为一般说明，请确保记录你在创建项目时使用或参考的任何资源。作为项目提交的一部分，你将需要报告信息来源。

### 参考

1. [Markdown语法说明](http://www.appinn.com/markdown/)

2. [常用Latex数学符号表示方法](http://www.mohu.org/info/symbols/symbols.htm)

3. [项目P0: 湾区单车共享](https://github.com/zhengweiyu/P0_bike_sharing/blob/master/Bay_Area_Bike_Share_Analysis.ipynb) 

4. [Jupyter Notebook 快速入门](http://codingpy.com/article/getting-started-with-jupyter-notebook-part-1/)

5. [如何在 Mac 上拍摄屏幕快照](https://support.apple.com/zh-cn/HT201361)

6. [百度百科：斯特鲁普效应](http://baike.baidu.com/item/%E6%96%AF%E7%89%B9%E9%B2%81%E6%99%AE%E6%95%88%E5%BA%94)

** 问题1：** 	我们的自变量是什么？因变量是什么？

** 答案：** 

自变量是任务条件，即展示的字义与颜色一致或不一致。

因变量是被试的反应时间。

** 问题2：** 此任务的适当假设集是什么？你想执行什么类型的统计测试？为你的选择提供正当理由。

** 答： **  

（1）零假设，任务条件对反应时间的影响无差别。拒绝零假设，不同条件对反应时间的影响有差别。

（2）零假设，一致任务的反应时间大于或等于不一致任务的反应时间。拒绝零假设，一致任务的反应时间小于不一致任务的反应时间。

由于仅关心任务条件对反应时间影响是否显著，本问题中采用假设集(1)，执行双尾检验。

由于对同一组人做前后两次测试，研究相依样本的t分布。

现在轮到你自行尝试 Stroop 任务了。前往[此链接](https://faculty.washington.edu/chudler/java/ready.html)，其中包含一个基于 Java 的小程序，专门用于执行 Stroop 任务。记录你收到的任务时间（你无需将时间提交到网站）。现在[下载此数据集](https://s3.cn-north-1.amazonaws.com.cn/static-documents/nd002/stroopdata.csv)，其中包含一些任务参与者的结果。数据集的每行包含一名参与者的表现，第一个数字代表他们的一致任务结果，第二个数字代表不一致任务结果。

In [1]:
# 导入所有需要的包函数

import csv
from datetime import datetime
import numpy as np
import pandas as pd
from IPython.display import display
%matplotlib inline

In [2]:
sample_data = pd.read_csv('stroopdata.csv')

display(sample_data.head())

Unnamed: 0,Congruent,Incongruent
0,12.079,19.278
1,16.791,18.741
2,9.564,21.214
3,8.63,15.687
4,14.669,22.803


**问题3：** 报告关于此数据集的一些描述性统计。包含至少一个集中趋势测量和至少一个变异测量。

样本量 n = 24

### 1. 描述统计量

#### 集中趋势测量 

一致任务反应时间均值 m1 = 14.02

不一致任务反应时间均值 m2 = 22.02

差异时间均值 M = 7.96

#### 变异测量

SD = 5.97, SEM = 1.22

**问题4：** 提供显示样本数据分布的一个或两个可视化。用一两句话说明你从图中观察到的结果。

![Sample2](image_01.png)

Congruent样本，分布较为分散，正偏分布。

![Sample2](image_02.png)

Incongruent样本，分布较为集中，接近正态分布。

**问题5：** 现在，执行统计测试并报告你的结果。你的置信水平和关键统计值是多少？你是否成功拒绝零假设？对试验任务得出一个结论。结果是否与你的期望一致？

### 2.  推论统计量

alpha = 0.05, 双尾检验

t临界值 = 2.069， t统计量 = 6.52

根据t临界值和t统计量，拒绝零假设。

95% CI=(5.44, 10.48)

### 3. 效应量

d = 10.51

d > 0.8，不同条件下反应时间平均数之差大于0.8个标准差，效应较大。

r^2 = .65

对于24人的样本，65%的反应时间差异是由任务条件导致的。

### 4. 结论

不同任务条件导致同一组人的反应时间有统计学意义的明显差异。当颜色词的文字与颜色不匹配时，需要的平均反应时间更长，与期望的结果一致。


**问题6：** 可选：你觉得导致所观察到的效应的原因是什么？你是否能想到会取得类似效应的替代或类似任务？进行一些调查研究将有助于你思考这两个问题！

** 答：**

一致任务只输入了一种信息（文字），而不一致任务输入了两种信息（文字、颜色），人脑在同一时间只能处理一种信息，因此导致反应时间延长。

当数字的字义和数字串的长度不一致时，也能观察到斯特鲁普效应。