# Independent Samples T Test using SciPy

## Independent Samples T Test

To reach maximum efficiency in performing an assembly operation in a manufacturing plant, new employees require approximately a 1-month training period. A new method of training was suggested, and a test was conducted to compare the new method with the standard procedure. Two groups of nine new employees each were trained for a period of 3 weeks, one group using the new method and the other following the standard training procedure. The length of time (in minutes) required for each employee to assemble the device was recorded at the end of the 3-week period. The resulting measurements are as shown below in Table.
#### Procedure	Measurements
#### Standard	32 37 35 28 41 44 35 31 34
#### New	35 31 29 25 34 40 27 32 31
Is there sufficient evidence to indicate a difference in true mean assembly times for those trained using the two methods? Test at the α = .05 level of significance.

We are testing H0:μ1=μ2 against the alternative Ha:μ1≠μ2= 0.

TR = Bir üretim tesisinde bir montaj işlemini gerçekleştirirken maksimum verimliliğe ulaşmak için yeni çalışanların yaklaşık 1 aylık bir eğitim süresi gerekir. Yeni bir eğitim yöntemi önerildi ve yeni yöntemi standart prosedürle karşılaştırmak için bir test yapıldı. Dokuz yeni çalışandan oluşan iki gruba, biri yeni yöntemle, diğeri standart eğitim prosedürü uygulanarak 3 haftalık bir süre boyunca eğitim verildi. 3 haftalık sürenin sonunda her bir çalışanın cihazı monte etmesi için gereken süre (dakika olarak) kaydedildi. Elde edilen ölçümler aşağıda Tablo'da gösterildiği gibidir.
#### prosedür	ölçümler
#### Standart	32 37 35 28 41 44 35 31 34
#### Yeni	35 31 29 25 34 40 27 32 31
İki yöntemi kullanarak eğitilmiş olanlar için gerçek ortalama montaj sürelerinde bir farkı belirtmek için yeterli kanıt var mı? α = .05 anlamlılık düzeyinde test edin.

Test ediyoruz H0:μ1=μ2  karşı alternatif Ha:μ1≠μ2= 0.

In [2]:
import numpy as np
from scipy import stats

Define two independent datasets (standard and new):

In [4]:
standard = np.array([32, 37, 35, 28, 41, 44, 35, 31, 34])
new = np.array([35, 31, 29, 25, 34, 40, 27, 32, 31])
print("Standard Procedure:", standard)
print("New Procedure:", new)

Standard Procedure: [32 37 35 28 41 44 35 31 34]
New Procedure: [35 31 29 25 34 40 27 32 31]


Calculate test statistics and p-value using stats.ttest_ind():

In [6]:
stats.ttest_ind(standard, new, equal_var=True, alternative='two-sided')   
#assumes equal population variances

Ttest_indResult(statistic=1.6494846165734016, pvalue=0.11853980248116995)

Calculate test statistics and p-value using stats.ttest_ind_from_stats:

In [7]:
stats.ttest_ind_from_stats(mean1=np.mean(standard), 
                           std1=np.std(standard, ddof=1), 
                           nobs1=np.size(standard),
                           mean2=np.mean(new)     , 
                           std2=np.std(new, ddof=1),      
                           nobs2=np.size(new))

Ttest_indResult(statistic=1.6494846165734016, pvalue=0.11853980248116995)

There is insufficient evidence to indicate a difference in the mean assembly times for the two training periods at the α = .05 level of significance.