New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Too many NANs for SNPs with low `Rsq` when some commandline options are specified #16

Closed
lckarssen opened this Issue Jan 29, 2016 · 1 comment

Comments

Projects
None yet
1 participant
@lckarssen
Member

lckarssen commented Jan 29, 2016

Run pacoxph on the example data:

../src/pacoxph -p ${inputdir}/coxph_data.txt    -d ${inputdir}/test.mlprob \
    -i ${inputdir}/test.mlinfo \
    -m ${inputdir}/test.map \
    -c 19 --allcov --ngpreds=2 \
-o coxph_allcov

results in the following output:

less coxph_allcov_2df.out.txt                                               
name A1 A2 Freq1 MAF Quality Rsq n Mean_predictor_allele chrom position beta_mu sebeta_mu beta_sex sebeta_sex beta_age sebeta_age beta_othercov sebeta_othercov beta_SNP_A1A2 sebeta_SNP_A1A2 beta_SNP_A1A1 sebeta_SNP_A1A1 chi2_SNP_2df
rs7247199 GAC A 0.5847 0.415 0.9299 0.8666 200 0.333517 19 204938 0 0 2.30513 0.401609 0.0164574 0.0105707 0.0569883 0.143364 191.783 283.537 -189.42 291.092 0.452465
rs8102643 C TGGT 0.5847 0.415 0.9308 0.8685 199 0.808191 19 207859 0 0 2.29325 0.402626 0.0183692 0.0103863 0.0927399 0.136848 -37.0413 361.618 -9.42748 275.29 0.384093
rs8102615 T A 0.5006 0.4702 0.9375 0.8932 200 0.866498 19 211970 0 0 2.34974 0.40464 0.015784 0.0107346 0.0879971 0.138071 -342.431 393.874 -284.843 327.062 0.754701
rs8105536 G A 0.5783 0.4213 0.9353 0.8832 200 0.79159 19 212033 0 0 2.27625 0.402763 0.0171103 0.0104839 0.0835659 0.137617 423.351 371.453 301.161 267.826 1.33223
rs2312724 T C 0.9122 0.0877 0.9841 1.3e-17 200 0.93343 19 217034 NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN NaN
rs3174230 G C 0.8123 1.2e-05 0.9991 0.0185 200 0.9975 19 7845238 0 0 2.30912 0.401706 0.0179928 0.0104407 0.0869779 0.137948 nan nan nan nan nan

Notice the excessive number of NaNs for the fifth SNP.

@lckarssen lckarssen added this to the v0.4.6 milestone Jan 29, 2016

@lckarssen lckarssen self-assigned this Jan 29, 2016

@lckarssen lckarssen changed the title from Using CoxPH in combination with the `--allcov` option gives too many NANs for SNPs with low `Rsq` to Too many NANs for SNPs with low `Rsq` when some commandline options are specified Jan 29, 2016

@lckarssen

This comment has been minimized.

Show comment
Hide comment
@lckarssen

lckarssen Jan 29, 2016

Member

This turns out to be bigger than just pacoxph and the --allcov option. Using the --interaction option triggers this behaviour as well.

Member

lckarssen commented Jan 29, 2016

This turns out to be bigger than just pacoxph and the --allcov option. Using the --interaction option triggers this behaviour as well.

lckarssen added a commit to lckarssen/ProbABEL that referenced this issue Jan 30, 2016

Fix Issue #16: too many NaNs for low Rsq SNPs
Instead of calculating the number of columns with NaNs by looking at the
number of rows in the matrix (which would break for CoxPH because there
the X matrix is transposed) use knowledge on the number of covariates
and other terms in the output.

@lckarssen lckarssen closed this Jan 30, 2016

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment