In [2]:
%matplotlib inline

In [3]:
import pandas as pd
import numpy as np
import seaborn as sns

from accuracies import hard_accuracy,soft_accuracy

### Данные:
Здесь используются данные, которые получены в экспериментах 26.09.2017 и 28.09.2017
- eye - показания, сделанные с помощью глаза по "шаблону на банке"
- real - показания, сделанные с помощью прибора Sysmex UX-2000
- phone - показания алгоритма с метрикой median + manhattan + Lab + (2,5,3) на шаблоне без измененной яркости с использованием и без использования вспышки

In [4]:
eye = pd.read_csv('data/third_exp_28_09_17/eye_2and3_joined.csv')
real = pd.read_csv('data/third_exp_28_09_17/real_2and3_joined.csv')
phone = pd.read_csv('data/third_exp_28_09_17/phone_2and3_joined.csv')

In [5]:
phone_l = phone[phone.light=='light'].copy()
phone_n = phone[phone.light=='no_light'].copy()

In [6]:
for data in [eye,real,phone_l,phone_n]:
    data.sort_values('ID',inplace=True)

In [7]:
indicators = real.columns[1:]

In [8]:
print "Количество пациентов: ",data.shape[0]

Количество пациентов:  33



**soft-точность** - доля совпадений в +/-1 класс между двумя выборками:
$$SoftAccuracy(a,b) = \frac{1}{N} \sum_{i=1}^{N} [|a_i - b_i|<=1]$$

**hard-точность** - доля одинаковых ответов в двух выборках:
$$HardAccuracy(a,b) = \frac{1}{N} \sum_{i=1}^{N} [a_i == b_i]$$

### Сравнение глаза и стационарного прибора

In [25]:
def comparison(data1,data2):
    print "Точность попадания в тот же самый класс (hard-точность): "
    h = np.mean(hard_accuracy(data1,data2,indicators))
    print "Средняя hard-точность: %.2f\n"%h
    
    print "Точность попадания в +/- 1 класс (soft-точность):"
    s = np.mean(soft_accuracy(data1,data2,indicators))
    print "Средняя soft-точность: %.2f"%s

In [26]:
comparison(real,eye)

Точность попадания в тот же самый класс (hard-точность): 
URO    BIL    KET    BLO    PRO    NIT    LEU    GLU    SG    PH   
0.91   0.48   0.91   0.79   0.79   1.00   0.73   0.94   0.21   0.52   

Средняя hard-точность: 0.73

Точность попадания в +/- 1 класс (soft-точность):
URO    BIL    KET    BLO    PRO    NIT    LEU    GLU    SG    PH   
0.97   1.00   1.00   0.85   0.97   1.00   0.82   1.00   0.76   0.91   

Средняя soft-точность: 0.93


### Сравнение прибора и телефона без вспышки

In [27]:
comparison(real,phone_n)

Точность попадания в тот же самый класс (hard-точность): 
URO    BIL    KET    BLO    PRO    NIT    LEU    GLU    SG    PH   
0.91   1.00   0.91   0.55   0.82   0.88   0.70   0.85   0.30   0.48   

Средняя hard-точность: 0.74

Точность попадания в +/- 1 класс (soft-точность):
URO    BIL    KET    BLO    PRO    NIT    LEU    GLU    SG    PH   
0.91   1.00   1.00   0.61   1.00   1.00   0.85   1.00   0.79   0.94   

Средняя soft-точность: 0.91


### Сравнение глаза и телефона без вспышки

In [28]:
comparison(eye,phone_n)

Точность попадания в тот же самый класс (hard-точность): 
URO    BIL    KET    BLO    PRO    NIT    LEU    GLU    SG    PH   
0.94   0.48   0.88   0.55   0.79   0.88   0.79   0.91   0.42   0.24   

Средняя hard-точность: 0.69

Точность попадания в +/- 1 класс (soft-точность):
URO    BIL    KET    BLO    PRO    NIT    LEU    GLU    SG    PH   
1.00   1.00   1.00   0.58   0.97   1.00   1.00   1.00   0.85   0.85   

Средняя soft-точность: 0.92


### Прибор vs телефон со вспышкой 

In [29]:
comparison(real,phone_l)

Точность попадания в тот же самый класс (hard-точность): 
URO    BIL    KET    BLO    PRO    NIT    LEU    GLU    SG    PH   
0.91   0.85   0.88   0.15   0.42   0.73   0.61   0.48   0.36   0.09   

Средняя hard-точность: 0.55

Точность попадания в +/- 1 класс (soft-точность):
URO    BIL    KET    BLO    PRO    NIT    LEU    GLU    SG    PH   
0.91   1.00   1.00   0.52   1.00   0.97   0.88   1.00   0.82   0.55   

Средняя soft-точность: 0.86


### Глаз vs телефон со вспышкой

In [30]:
comparison(eye,phone_l)

Точность попадания в тот же самый класс (hard-точность): 
URO    BIL    KET    BLO    PRO    NIT    LEU    GLU    SG    PH   
0.94   0.58   0.85   0.21   0.33   0.73   0.55   0.55   0.45   0.24   

Средняя hard-точность: 0.54

Точность попадания в +/- 1 класс (soft-точность):
URO    BIL    KET    BLO    PRO    NIT    LEU    GLU    SG    PH   
1.00   1.00   1.00   0.45   0.97   0.97   1.00   1.00   0.76   0.58   

Средняя soft-точность: 0.87


### Сравнение между телефонами

In [75]:
comparison(phone_n,phone_l)

Точность попадания в тот же самый класс (hard-точность): 
URO    BIL    KET    BLO    PRO    NIT    LEU    GLU    SG    PH   
1.00   0.85   0.94   0.30   0.55   0.64   0.70   0.64   0.55   0.15   

Средняя hard-точность: 0.63

Точность попадания в +/- 1 класс (soft-точность):
URO    BIL    KET    BLO    PRO    NIT    LEU    GLU    SG    PH   
1.00   1.00   0.97   0.61   1.00   1.00   1.00   1.00   0.85   0.82   

Средняя soft-точность: 0.92


### Выводы:

Телефон со вспышкой сейчас даёт результаты хуже, чем телефон без вспышки.

### Статистически ли значимы отличия в долях правильных ответов между телефоном со вспышкой и без вспышки?

In [63]:
import scipy.stats as stats
import statsmodels.stats.multitest as smm

In [64]:
def proportions_diff_z_stat_ind(sample1, sample2): #Z-статистика для разности долей
    n1 = len(sample1)
    n2 = len(sample2)
    
    p1 = float(sum(sample1)) / n1
    p2 = float(sum(sample2)) / n2 
    P = float(p1*n1 + p2*n2) / (n1 + n2)
    
    return (p1 - p2) / np.sqrt(P * (1 - P) * (1. / n1 + 1. / n2))


def proportions_diff_z_test(z_stat, alternative = 'two-sided'):
    #достигаемый уровень значимости для Z-статистики
    if alternative not in ('two-sided', 'less', 'greater'):
        raise ValueError("alternative not recognized\n"
                         "should be 'two-sided', 'less' or 'greater'")
    
    if alternative == 'two-sided':
        return 2 * (1 - stats.norm.cdf(np.abs(z_stat)))
    
    if alternative == 'less':
        return stats.norm.cdf(z_stat)

    if alternative == 'greater':
        return 1 - stats.norm.cdf(z_stat)


In [65]:
p_vals = []
for column in indicators:
    sample_1 = np.abs(phone_l[column].values - real[column].values)<=1
    sample_2 = np.abs(phone_n[column].values - real[column].values)<=1

    Z = proportions_diff_z_stat_ind(sample_1,sample_2)
    p_vals.append(proportions_diff_z_test(Z))



In [66]:
print "Индикаторы, для которых статистически значимо отличие долей soft-правильных ответов: "
print indicators[smm.multipletests(p_vals)[0]].values

Индикаторы, для которых статистически значимо отличие долей soft-правильных ответов: 
['PH']


In [67]:
p_vals = []
for column in indicators:
    sample_1 = phone_l[column].values == real[column].values
    sample_2 = phone_n[column].values == real[column].values

    Z = proportions_diff_z_stat_ind(sample_1,sample_2)
    p_vals.append(proportions_diff_z_test(Z))

In [68]:
print "Индикаторы, для которых статистически значимо отличие долей hard-правильных ответов: "
print indicators[smm.multipletests(p_vals)[0]].values

Индикаторы, для которых статистически значимо отличие долей hard-правильных ответов: 
['BLO' 'PRO' 'GLU' 'PH']


т.е. не для всех индикаторов статистически значимо отличие между долей правильных ответов для телефона со вспышкой и без вспышки  

In [70]:
import FisherExact
def fisher_exact(data_1,data_2,indicators):
    p_vals = [] 
    tables = [] 
    names = []
    for column in indicators:
        table = pd.crosstab(data_1[column].values,data_2[column].values)
        if min(table.shape)>2:
            names.append(column)
            tables.append(table)
            p_vals.append(FisherExact.fisher_exact(table))
            
    p_vals = np.array(p_vals)
    names = np.array(names)
    
    return p_vals, names

In [76]:
p, n = fisher_exact(phone_l,phone_n,indicators)

Индикаторы, для которых корреляция алгоритма **для телефона со вспышкой и без** статистически значима:  

In [90]:
n[smm.multipletests(p,method='fdr_bh')[0]].tolist()

['KET', 'BLO', 'PRO', 'NIT', 'GLU', 'SG', 'PH']

Для каких нет

In [91]:
n[smm.multipletests(p,method='fdr_bh')[0]==False].tolist()

[]

Для каких невозможно сделать оценку, т.к. таблица сопряженности имеет только одну строку/столбец

In [92]:
set(indicators) - set(n)

{'BIL', 'LEU', 'URO'}

В дальнейшем, следует обратить внимание на показатели: билирубин, лейкоциты, уробилиноген. Пока на них только объекты с отрицательным классом.