#Predicción de la suceptibilidad del Covid19

Las predicciónes basadas en la taxonomia de cen resultados limitados. La aproximación más exitosa para predecir la suceptibilidad UV sigue el método Kowalski 2009:

1/ Whenever two or more pyrimidine residues are adjacent to one another, photoreactions
are observed at both pyrimidines.
2/ Non-adjacent pyrimidines, surrounded on both sides by purines, exhibit little or
no photoreactivity.
3/ The only purines that readily form UV photoproducts are those that are flanked
on their 5'' side by two or more contiguous pyrimidine residues.

Primero cargamos y analizamos el genoma del covid19, y exploramos algunas bases para formar una idea

In [101]:
import numpy as np
import pandas as pd
import seaborn as sns
import os
from Bio import SeqIO

for sequence in SeqIO.parse('MN908947.fna', "fasta"):
    a = sequence.seq  
print('Análisis del genoma Covid19')
print(len(a),'Nucleotidos')
np.set_printoptions(threshold=50)
a=np.array(a)
print('Imprimen las primeras 500 bases')
print(a[:50])


Análisis del genoma Covid19
29903 Nucleotidos
Imprimen las primeras 500 bases
['A' 'T' 'T' 'A' 'A' 'A' 'G' 'G' 'T' 'T' 'T' 'A' 'T' 'A' 'C' 'C' 'T' 'T'
 'C' 'C' 'C' 'A' 'G' 'G' 'T' 'A' 'A' 'C' 'A' 'A' 'A' 'C' 'C' 'A' 'A' 'C'
 'C' 'A' 'A' 'C' 'T' 'T' 'T' 'C' 'G' 'A' 'T' 'C' 'T' 'C']


Se deben encontrar los siguientes valores:


  tt          dobletes de timina TT
  
  <-->
   ct          TC o CT  
  
  
  cc           dobletes de citocina CC
 
 
 <--->
 YYU          purine w/adjacent pyramidine doublet 
  
  
ATT ACC ACT ATC


GTT GCC GCT GTC


TTA CCA CTA TCA


TTG CCG CTG CGT

BP           Total Base Pair
   

In [150]:
import numpy as np
import pandas as pd
import seaborn as sns
import os
import math 
from Bio import SeqIO

for sequence in SeqIO.parse('MN908947.fna', "fasta"):
    a = sequence.seq  
print('Análisis del genoma Covid19')
print(len(a),'Nucleotidos')
np.set_printoptions(threshold=50)
a=np.array(a)


cnt_tt = 0
cnt_cc = 0
cnt_ct = 0
cnt_yyu=0
cnta = 0
cnt=0
vind_tt=[]
vind_cc=[]
vind_ct=[]

#calculamos los dobletes timina
for i in range(len(a)-1):
    if (a[i]=='T'and a[i+1]=='T'):
        cnt_tt = cnt_tt+1
        vind_tt.append(i) 
        
print('dobletes timina tt: '+str(cnt_tt))    

#calculamos los dobletes citosina
for i in range(len(a)-1):
    if a[i]=='C'and a[i+1]=='C':
        cnt_cc = cnt_cc+1
        vind_cc.append(i)
print('dobletes citocina cc: '+str(cnt_cc))        

#calculamos los dobletes citosina-timina en ambas direcciones
for i in range(len(a)-1):
    if ((a[i]=='C'and a[i+1]=='T') or (a[i]=='T'and a[i+1]=='C')):
        cnt_ct = cnt_ct+1
        vind_ct.append(i)
print('dobletes citocina timina bidireccional ct: '+str(cnt_ct)) 
                                       
#calculamos las purinas con dobletes de piromidinas
#Este proceso lo dividimos en 3 grupos
#acudiremos a los vectores con indices para ello

#Timinas:
yyu_tt=0
vyyu_tt=[]

for j in range(len(vind_tt)):  #en este caso no inicia con tt
    i=vind_tt[j]
    if (a[i-1]=='A' or a[i-1]=='G'):
        yyu_tt=yyu_tt+1
        vyyu_tt.append(i-1)
    if (a[i+2]=='A' or a[i+2]=='G'):
        yyu_tt=yyu_tt+1
        vyyu_tt.append(i)

print('YYU_tt: '+str(yyu_tt))        
      
#citocinas
yyu_cc=0
vyyu_cc=[]

for j in range(len(vind_cc)):  #en este caso no inicia con tt
    i=vind_cc[j]
    if (a[i-1]=='A' or a[i-1]=='G'):
        yyu_cc=yyu_cc+1
        vyyu_cc.append(i-1)
    if (a[i+2]=='A' or a[i+2]=='G'):
        yyu_cc=yyu_cc+1
        vyyu_cc.append(i)
        
print('YYU_cc: '+str(yyu_cc))     

#con las ct o tc
yyu_ct=0
vyyu_ct=[]
for j in range(len(vind_ct)):
    i=vind_ct[j]
    if (a[i-1]=='A' or a[i-1]=='G'):
        yyu_ct=yyu_ct+1
        vyyu_ct.append(i-1)
    if (a[i+2]=='A' or a[i+2]=='G'):
        yyu_ct=yyu_ct+1
        vyyu_ct.append(i)
print('YYU_ct: '+str(yyu_ct))     

#Hallamos el total del YYU
cnt_yyu=yyu_tt+yyu_cc+yyu_ct

        
Fa=0.1
Fb=6
Fc=4

Dv1=(cnt_tt+Fa*cnt_ct+Fb*cnt_cc+Fc*cnt_yyu)**(1/2)
Dv2=len(a)**(2/3)
Dv=Dv1/Dv2
print('Probabilidad de Dimerización: '+str(round(Dv*100,2))+' %')




Análisis del genoma Covid19
29903 Nucleotidos
dobletes timina tt: 3215
dobletes citocina cc: 888
dobletes citocina timina bidireccional ct: 3494
YYU_tt: 3166
YYU_cc: 991
YYU_ct: 3521
Probabilidad de Dimerización: 20.66 %


A partir de este análisis, se puede
estimar la dosis efectiva.

En el ejemplo, obtenido en la literatura se ajustó
una curva para distintos virus RNA, con la dosis 90 medida para distintos virus, en agua. 




In [146]:
y=1.81*0.0079*math.exp(34.741*Dv)

print('D90 WATTER UV covid19: '+str(round(y,3))+' J/m2')

D90 WATTER UV covid19: 18.705 J/m2
