# Partial hybridization case study notbook

In [2]:
from nupack import *

In [51]:
# Define physical model 
my_model = Model(material='dna', celsius=65, sodium=0.050, magnesium=0.008)

seq = ['AGTTACGTGCCAGATCAG', 'CTGATCTGGCACGTAACT']

ideal_struct = '(5+)20'

In [75]:
# Partition function and complex free energy
my_pfunc, my_free_energy = pfunc(strands=seq, model=my_model)

# Equilibrium pair probability matrix
my_pairs = pairs(strands=seq, model=my_model)

# MFE procy structure and energy
my_mfe = mfe(strands=seq, model=my_model)

# Suboptimal proxy structures and energies
my_subopt = subopt(strands=seq, model=my_model, energy_gap=1.1)

In [76]:
# Print out components of the result for the given complex

print('Partition function =', my_pfunc)
print('Complex free energy =', my_free_energy)

print('\nMFE proxy structure(s):')
for i, s in enumerate(my_mfe):
    print('    %2d: %s (%.2f kcal/mol)' % (i, s.structure, s.energy))

print('\nSuboptimal proxy structure(s):')
for i, s in enumerate(my_subopt):
    print('    %2d: %s (%.2f kcal/mol)' % (i, s.structure, s.energy))

Partition function = 1083911992.316234433445684948
Complex free energy = -13.97938198337024

MFE proxy structure(s):
     0: ((((((((((((((((((+)))))))))))))))))) (-11.55 kcal/mol)

Suboptimal proxy structure(s):
     0: .((((((((((((((((.+.)))))))))))))))). (-12.21 kcal/mol)
     1: .((((((((((((((((.+.)))))))))))))))). (-12.21 kcal/mol)
     2: .((((((((((((((((.+.)))))))))))))))). (-12.21 kcal/mol)
     3: .((((((((((((((((.+.)))))))))))))))). (-12.21 kcal/mol)
     4: .((((((((((((((((.+.)))))))))))))))). (-12.21 kcal/mol)
     5: .(((((((((((((((..+..))))))))))))))). (-12.01 kcal/mol)
     6: .(((((((((((((((..+..))))))))))))))). (-12.01 kcal/mol)
     7: .((((((((((((((...+...)))))))))))))). (-12.01 kcal/mol)
     8: .((((((((((((((...+...)))))))))))))). (-12.01 kcal/mol)
     9: .((((((((((((((...+...)))))))))))))). (-12.01 kcal/mol)
    10: .(((((((((((((((((+))))))))))))))))). (-12.00 kcal/mol)
    11: .(((((((((((((((((+))))))))))))))))). (-12.00 kcal/mol)
    12: .((((((((((

In [None]:
def buildPartialMeltingStructureStr(seqLen, basesAnnealed):
    return "(" * basesAnnealed + "." * (seqLen - basesAnnealed) + "+" + "." * (seqLen - basesAnnealed) + ")" * basesAnnealed

for i in range(len(seq[0])):
    struct = buildPartialMeltingStructureStr(len(seq[0]), (i+1))
    my_prob = structure_probability(strands=seq, structure=struct, model=my_model)
    
    print(f"Bases annealed: {i+1} \t probability: {my_prob} \t structure: {struct}")

Bases annealed: 1 	 probability: 6.844579739399771e-09 	 structure: (.................+.................)
Bases annealed: 2 	 probability: 3.011759881469026e-08 	 structure: ((................+................))
Bases annealed: 3 	 probability: 1.9254355183702077e-07 	 structure: (((...............+...............)))
Bases annealed: 4 	 probability: 1.653047215710448e-07 	 structure: ((((..............+..............))))
Bases annealed: 5 	 probability: 5.445412771773546e-08 	 structure: (((((.............+.............)))))
Bases annealed: 6 	 probability: 1.4610391589135742e-07 	 structure: ((((((............+............))))))
Bases annealed: 7 	 probability: 1.7524473291230252e-06 	 structure: (((((((...........+...........)))))))
Bases annealed: 8 	 probability: 8.797830290538623e-06 	 structure: ((((((((..........+..........))))))))
Bases annealed: 9 	 probability: 1.3993082852368143e-05 	 structure: (((((((((.........+.........)))))))))
Bases annealed: 10 	 probability: 9.865684

In [56]:
structSample = sample(strands=seq, num_sample=1000, model=my_model)
structSample

[Structure('..(((((((((((.....+.....)))))))))))..'),
 Structure('((((((((((((((((((+))))))))))))))))))'),
 Structure('.(((((((((((((((((+))))))))))))))))).'),
 Structure('.(((((((((((((((..+..))))))))))))))).'),
 Structure('.(((((((((((((....+....))))))))))))).'),
 Structure('..((((((((((((.(..+..).))))))))))))..'),
 Structure('.((((((((((.(((((.+.))))).)))))))))).'),
 Structure('.(.(.((((((((((((.+.)))))))))))).).).'),
 Structure('.....((((((((.....+.....)))))))).....'),
 Structure('.((((((((((((((((.+.)))))))))))))))).'),
 Structure('((((((((((((((((((+))))))))))))))))))'),
 Structure('..((((((((((((((..+..))))))))))))))..'),
 Structure('.(((((((((((((((((+))))))))))))))))).'),
 Structure('.((((((((((((((((.+.)))))))))))))))).'),
 Structure('((((((((((((((((((+))))))))))))))))))'),
 Structure('.(((((((((((......+......))))))))))).'),
 Structure('...((((((((((((((.+.))))))))))))))...'),
 Structure('....(((((((((((((.+.)))))))))))))....'),
 Structure('...(((((((((((((..+..)))))))))))))

In [57]:
my_prob = structure_probability(strands=seq, structure="..(((((((((((.....+.....)))))))))))..", model=my_model)
my_prob

np.float64(0.0030894703106146477)

# Test Tube Analysis

In [48]:
F3 = Strand('AGTTACGTGCCAGATCAG', name='F3')
F3c = Strand('CTGATCTGGCACGTAACT', name='F3c')

# Define physical model 
my_model = Model(material='dna', celsius=65, sodium=0.050, magnesium=0.008)

# specify tubes
t1 = Tube(strands={F3: 1e-7, F3c: 1e-7}, complexes=SetSpec(max_size=2), name='t1')

# analyze tubes
my_result = tube_analysis([t1], model=my_model,
    compute=['pfunc', 'pairs', 'mfe', 'sample', 'subopt'],
    options={'num_sample': 2, 'energy_gap': 0.5})

my_result

Complex,Pfunc,ΔG (kcal/mol),MFE (kcal/mol)
(F3),1.2354,-0.142,0.0
(F3c),1.4857,-0.266,0.0
(F3+F3),11454.0,-6.28,-5.841
(F3+F3c),1083900000.0,-13.979,-11.999
(F3c+F3c),20308.0,-6.665,-6.366

Complex,t1 (M),Unnamed: 2
(F3),6.041e-08,
(F3c),6.041e-08,
(F3+F3c),3.959e-08,
(F3c+F3c),6.168e-13,
(F3+F3),5.032e-13,


In [49]:
my_result['(F3+F3c)'].subopt

[StructureEnergy(Structure('.(((((((((((((((((+))))))))))))))))).'), energy=-11.998520851135254, stack_energy=-11.149211883544922),
 StructureEnergy(Structure('.(((((((((((((((((+))))))))))))))))).'), energy=-11.998520851135254, stack_energy=-11.24670696258545),
 StructureEnergy(Structure('(((((((((((((((((.+.)))))))))))))))))'), energy=-11.762879371643066, stack_energy=-11.13908138871193),
 StructureEnergy(Structure('(((((((((((((((...+...)))))))))))))))'), energy=-11.56078815460205, stack_energy=-11.093947768211365),
 StructureEnergy(Structure('((((((((((((((((((+))))))))))))))))))'), energy=-11.554149627685547, stack_energy=-11.55414867401123)]