In [1]:
# make analyzer.py visible
import sys
sys.path.insert(0, './../src/')

import analyzer_binary as ana
import pandas as pd
import numpy as np

# Graphics
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns
from matplotlib import rc
import matplotlib.dates as mdates

# rc('text', usetex=True)
# rc('text.latex', preamble=r'\usepackage{cmbright}')
# rc('font', **{'family': 'sans-serif', 'sans-serif': ['Helvetica']})

# Magic function to make matplotlib inline;
%matplotlib inline

# This enables SVG graphics inline. 
# There is a bug, so uncomment if it works.
# %config InlineBackend.figure_formats = {'png', 'retina'}

# JB's favorite Seaborn settings for notebooks
rc = {'lines.linewidth': 2, 
      'axes.labelsize': 18, 
      'axes.titlesize': 18, 
      'axes.facecolor': 'DFDFE5'}
sns.set_context('notebook', rc=rc)
sns.set_style("dark")

mpl.rcParams['xtick.labelsize'] = 16 
mpl.rcParams['ytick.labelsize'] = 16 
mpl.rcParams['legend.fontsize'] = 14

In [4]:
df = pd.read_csv('tidy_sleep_df.csv', index_col=0)

In [5]:
df.head()

Unnamed: 0,index,ID,Date,HS time,phenotype,number,freq,total,suppressors
0,0,A-7-3.3,7/21/17,15,L,aaaaaaaaaaa,0.0,11,0
1,1,A-7-3.1,7/21/17,15,L,sssaaaaa,0.375,8,3
2,2,PS7244,7/22/17,15,L,aaaaaaaaaaaaaaaaa,0.0,17,0
3,3,A-10-3a,7/22/17,15,L,aaaaaaaaaaaaaaaaas,0.055556,18,1
4,4,A-10-2a,7/22/17,15,L,aaaaaaaaaaaa,0.0,12,0


In [10]:
df_15 = df[df['HS time'] == '15']
df_30 = df[df['HS time'] == '30']

In [11]:
df_15.head()

Unnamed: 0,index,ID,Date,HS time,phenotype,number,freq,total,suppressors
0,0,A-7-3.3,7/21/17,15,L,aaaaaaaaaaa,0.0,11,0
1,1,A-7-3.1,7/21/17,15,L,sssaaaaa,0.375,8,3
2,2,PS7244,7/22/17,15,L,aaaaaaaaaaaaaaaaa,0.0,17,0
3,3,A-10-3a,7/22/17,15,L,aaaaaaaaaaaaaaaaas,0.055556,18,1
4,4,A-10-2a,7/22/17,15,L,aaaaaaaaaaaa,0.0,12,0


In [12]:
df_30.head()

Unnamed: 0,index,ID,Date,HS time,phenotype,number,freq,total,suppressors
22,22,PS7244,7/22/17,30,L,aaaaaaaasaaa,0.083333,12,1
23,23,A32-1b,7/22/17,30,L,aaaaaaaaaaaasaaaa,0.058824,17,1
24,24,A-32-1a,7/22/17,30,L,aaaaaaaaassaa,0.153846,13,2
25,25,A-32-1c,7/22/17,30,L,aaaaaaaaaaaaaaaaaaaaa,0.0,21,0
34,34,PS7244,7/22/17,30,L,aaaaaaaaa,0.0,9,0


In [21]:
p_matrix_15_L = ana.calculate_pvalues(df_15[df_15.phenotype == 'L'], 'ID', 'total', 'suppressors', n=10**5, ctrl='PS7244')

#8 cores detected for this machine.
#Starting 8 processes for bootstrapping...
#Bootstrapping complete.

#P-value matrix:
                      A-7-3.3 A-7-3.1   PS7244 A-10-3a A-10-2a A-10-3b  \
A-7-3.3                   NaN     NaN  0.23268     NaN     NaN     NaN   
A-7-3.1                   NaN     NaN  0.00262     NaN     NaN     NaN   
PS7244                    NaN     NaN      NaN     NaN     NaN     NaN   
A-10-3a                   NaN     NaN  0.38095     NaN     NaN     NaN   
A-10-2a                   NaN     NaN  0.22109     NaN     NaN     NaN   
A-10-3b                   NaN     NaN  0.14163     NaN     NaN     NaN   
A-35-2a                   NaN     NaN  0.15634     NaN     NaN     NaN   
A-35-2b                   NaN     NaN  0.00022     NaN     NaN     NaN   
A-35-2c                   NaN     NaN        0     NaN     NaN     NaN   
A-34-2b                   NaN     NaN  0.00588     NaN     NaN     NaN   
A-34-1a                   NaN     NaN   0.0256     NaN     NaN  

In [25]:
p_vals_15_L = p_matrix_15_L['PS7244'].dropna()

In [26]:
p_vals_15_L.to_csv('p_15_L.csv')

In [27]:
p_matrix_15_P = ana.calculate_pvalues(df_15[df_15.phenotype == 'P'], 'ID', 'total', 'suppressors', n=10**5, ctrl='PS7244')

#8 cores detected for this machine.
#Starting 8 processes for bootstrapping...
#Bootstrapping complete.

#P-value matrix:
                      A-7-3.3 A-7-3.1   PS7244 A-10-3a A-10-2a A-10-3b  \
A-7-3.3                   NaN     NaN        1     NaN     NaN     NaN   
A-7-3.1                   NaN     NaN        1     NaN     NaN     NaN   
PS7244                    NaN     NaN      NaN     NaN     NaN     NaN   
A-10-3a                   NaN     NaN        1     NaN     NaN     NaN   
A-10-2a                   NaN     NaN        1     NaN     NaN     NaN   
A-10-3b                   NaN     NaN        1     NaN     NaN     NaN   
A-35-2a                   NaN     NaN        1     NaN     NaN     NaN   
A-35-2b                   NaN     NaN        0     NaN     NaN     NaN   
A-35-2c                   NaN     NaN  0.00042     NaN     NaN     NaN   
A-34-2b                   NaN     NaN        1     NaN     NaN     NaN   
A-34-1a                   NaN     NaN        1     NaN     NaN  

In [28]:
p_vals_15_P = p_matrix_15_P['PS7244'].dropna()
p_vals_15_P.to_csv('p_15_P.csv')

In [29]:
p_matrix_30_L = ana.calculate_pvalues(df_30[df_30.phenotype == 'L'], 'ID', 'total', 'suppressors', n=10**5, ctrl='PS7244')
p_matrix_30_P = ana.calculate_pvalues(df_30[df_30.phenotype == 'P'], 'ID', 'total', 'suppressors', n=10**5, ctrl='PS7244')

#8 cores detected for this machine.
#Starting 8 processes for bootstrapping...
#Bootstrapping complete.

#P-value matrix:
                      PS7244 A32-1b A-32-1a A-32-1c A-14-2-2 A-14-3-3  \
PS7244                   NaN    NaN     NaN     NaN      NaN      NaN   
A32-1b               0.34343    NaN     NaN     NaN      NaN      NaN   
A-32-1a              0.07832    NaN     NaN     NaN      NaN      NaN   
A-32-1c              0.17791    NaN     NaN     NaN      NaN      NaN   
A-14-2-2              0.0701    NaN     NaN     NaN      NaN      NaN   
A-14-3-3             0.24885    NaN     NaN     NaN      NaN      NaN   
A-14-3-2             0.27515    NaN     NaN     NaN      NaN      NaN   
A-3-2a               0.18168    NaN     NaN     NaN      NaN      NaN   
A-3-2c               0.36059    NaN     NaN     NaN      NaN      NaN   
A-14-2-3             0.28811    NaN     NaN     NaN      NaN      NaN   
A-7-2-1              0.28917    NaN     NaN     NaN      NaN      NaN   
A-

In [30]:
p_vals_30_L = p_matrix_30_L['PS7244'].dropna()
p_vals_30_L.to_csv('p_30_L.csv')

p_vals_30_P = p_matrix_30_P['PS7244'].dropna()
p_vals_30_P.to_csv('p_30_P.csv')