In [1]:
import networkx as nx
import numpy as np
import matplotlib.pyplot as plt
import pylab
import math
import pandas as pd
from io import StringIO
import random
import scipy
import operator

In [2]:
G_APMS = nx.read_edgelist('yeast_AP-MS.txt')
G_Y2H = nx.read_edgelist('yeast_Y2H.txt')
G_LIT = nx.read_edgelist('yeast_LIT.txt')

G_LIT_Reguly = nx.Graph()
data_lit_reguly = np.genfromtxt("yeast_LIT_Reguly.txt",dtype='unicode',delimiter = '\t')
yeast_LIT_Reguly_raw = [data_lit_reguly[1:,0],data_lit_reguly[1:,1]]

i=1
while i<len(data_lit_reguly[1:,0]):
    G_LIT_Reguly.add_edge(data_lit_reguly[i,0],data_lit_reguly[i,1])
    i+=1

In [3]:
G_ESSENTIAL = nx.Graph()
data_G_ESSENTIAL = np.genfromtxt("Essential_ORFs_paperHe.txt",dtype='unicode',delimiter = '\t')
yeast_G_ESSENTIAL_raw = [data_G_ESSENTIAL[2:,1]]

i = 0
l = len(yeast_G_ESSENTIAL_raw[0][:])

while i < l:
    proteina = yeast_G_ESSENTIAL_raw[0][i]
    yeast_G_ESSENTIAL_raw[0][i] = proteina.rstrip(" ")
    i+=1

In [4]:
def agrega_esencialidad(red,lista_esencial):
    
    j = 0
    l = len(red)
    while j < l:
        nombre = list(red)[j]
        red.node[nombre]['esencialidad']=0
        j += 1
    
    for i in lista_esencial[0]:
        if (i in red):
            red.node[i]['esencialidad']=1
    return

In [5]:
agrega_esencialidad(G_APMS,yeast_G_ESSENTIAL_raw)
agrega_esencialidad(G_Y2H,yeast_G_ESSENTIAL_raw)
agrega_esencialidad(G_LIT,yeast_G_ESSENTIAL_raw)
agrega_esencialidad(G_LIT_Reguly,yeast_G_ESSENTIAL_raw)

In [6]:
#Aij² es la cantidad de caminos desde i hasta j para ir en dos pasos
A = nx.adjacency_matrix(G_APMS)  # Matriz de adycencia
#(A*A)ij = n significa que hay n caminos (n vecinos en comun) para ir desde i hasta j en dos pasos
#me debo fijar que Aij = 0 (no sean vecinos) y que n >=3

In [7]:
def tabla3(red,vecinos):
    A = nx.adjacency_matrix(red)
    A2 = A * A
    A = A.toarray()
    A2 = A2.toarray()
    contador_tipo_indiferente = 0
    contador_mismo_tipo = 0
    l = nx.number_of_nodes(red)
    i = 0
    while i < l:
        j = i + 1
        while j < l:
            enlace_ij = A[i][j]
            if enlace_ij == 0:    #no son adyacentes
                caminos_ij = A2[i][j]   #cantidad de vecinos en comun
                if caminos_ij >= vecinos:
                    contador_tipo_indiferente += 1
                    nombre_i = list(red)[i]
                    nombre_j = list(red)[j]
                    esencialidad_nodo_i = red.node[nombre_i]['esencialidad']
                    esencialidad_nodo_j = red.node[nombre_j]['esencialidad']   
                    if esencialidad_nodo_i==esencialidad_nodo_j:
                        contador_mismo_tipo +=1
            j += 1
        i += 1
    return (contador_tipo_indiferente,contador_mismo_tipo)
    

In [8]:
tabla3_APMS = tabla3(G_APMS,3)
tabla3_Y2H = tabla3(G_Y2H,1)
tabla3_LIT = tabla3(G_LIT,3)
tabla3_LIT_Reguly = tabla3(G_LIT_Reguly,3)

In [9]:
def asignacion_random_esencialidad(red,beta):
    copia_red=red.copy()
    l = nx.number_of_nodes(red)
    i = 0
    while i < l:
        nombre = list(copia_red)[i]
        numero_random = random.random()
        #print(numero_random)
        if numero_random <= beta:
            copia_red.node[nombre]['esencialidad']=1
        else:
            copia_red.node[nombre]['esencialidad']=0
        i+=1    
    
    return copia_red    

In [10]:
def pares_esperados_modelo(red,beta,vecinos):
    i = 0
    it = 1
    vector_resultados = []
    while i < it:
        nueva_red = asignacion_random_esencialidad(red,beta)
        resultado = tabla3(nueva_red,vecinos)
        vector_resultados += [resultado[1]]
        i+=1
    
    medio = np.mean(vector_resultados)
    desviacion = np.std(vector_resultados)
    
    return(medio,desviacion)

In [11]:
pares_esperados_APMS = pares_esperados_modelo(G_APMS,0.2,3)
pares_esperados_Y2H = pares_esperados_modelo(G_Y2H,0.17,1)
pares_esperados_LIT = pares_esperados_modelo(G_LIT,0.23,3)
pares_esperados_LIT_Reguly = pares_esperados_modelo(G_LIT_Reguly,0.075,3)

In [12]:
data = pd.DataFrame({" ":["AP/MS",'Y2H','LIT','LIT-Reguly'],
                     "Total number of pairs":[tabla3_APMS[0],tabla3_Y2H[0],tabla3_LIT[0],tabla3_LIT_Reguly[0]],
                     "Total number of pairs of the same type":[tabla3_APMS[1],tabla3_Y2H[1],tabla3_LIT[1],tabla3_LIT_Reguly[1]],
                     "Expected number of pairs of the same type":[pares_esperados_APMS[0],pares_esperados_Y2H[0],pares_esperados_LIT[0],pares_esperados_LIT_Reguly[0]],
                     })
data


Unnamed: 0,Unnamed: 1,Expected number of pairs of the same type,Total number of pairs,Total number of pairs of the same type
0,AP/MS,8361.0,11613,5924
1,Y2H,16493.0,23073,15019
2,LIT,507.0,730,393
3,LIT-Reguly,9371.0,10772,6158


In [13]:
pares_esperados_APMS[0]

8361.0

Asignamos con probabilida alfa esencialidad a un par de nodos (simula un enlace esencial)

In [14]:
def esencialidad_enlaces(red,alfa):
    copia_red=red.copy()
    l = len(list(copia_red.edges))
    i=0
    while i< l:
        numero_random = random.random()
        nombre_1 =  list(copia_red.edges)[i][0]
        nombre_2 =  list(copia_red.edges)[i][1]
        copia_red.node[nombre_1]['esencialidad']=0
        copia_red.node[nombre_2]['esencialidad']=0
        if numero_random <= alfa:
            copia_red.node[nombre_1]['esencialidad']=1
            copia_red.node[nombre_2]['esencialidad']=1
        i+=1
    return copia_red

In [15]:
'''
def asignacion_random_esencialidad_modelo(red,beta):
    copia_red=red.copy()
    l = nx.number_of_nodes(red)
    i = 0
    while i < l:
        nombre = list(copia_red)[i]
        esencialidad_nodo = red.node[nombre]['esencialidad']
        #if esencialidad_nodo == 0:
        numero_random = random.random()
        if numero_random <= beta:
            copia_red.node[nombre]['esencialidad']=1
        i+=1    
    
    return copia_red
'''

"\ndef asignacion_random_esencialidad_modelo(red,beta):\n    copia_red=red.copy()\n    l = nx.number_of_nodes(red)\n    i = 0\n    while i < l:\n        nombre = list(copia_red)[i]\n        esencialidad_nodo = red.node[nombre]['esencialidad']\n        #if esencialidad_nodo == 0:\n        numero_random = random.random()\n        if numero_random <= beta:\n            copia_red.node[nombre]['esencialidad']=1\n        i+=1    \n    \n    return copia_red\n"

In [27]:
def asignacion_random_esencialidad_modelo(red,alfa,beta):
    copia_red=red.copy()
    l = nx.number_of_nodes(red)
    i = 0
    while i < l:
        nombre = list(copia_red)[i]
        esencialidad_nodo = red.node[nombre]['esencialidad']
        numero_random = random.random()
        k =  list(copia_red.degree)[i][1]
        Pe = 1-(1-beta)*(1-alfa)**k
        if numero_random <= Pe:
            copia_red.node[nombre]['esencialidad']=1
        else:
            copia_red.node[nombre]['esencialidad']=0
        i+=1    
    return copia_red

In [28]:
def distribucion_random_modelo(red,alfa,beta,vecinos):
    copia_red=red.copy()
    #nueva_red = esencialidad_enlaces(copia_red,alfa)
    nueva_red = asignacion_random_esencialidad_modelo(copia_red,alfa,beta)
    i = 0
    it = 5
    vector_resultados = []
    while i < it:
        vector_resultados += [tabla3(nueva_red,vecinos)]
        i+=1
    
    medio = np.mean(vector_resultados)
    desviacion = np.std(vector_resultados)
    
    return(medio,desviacion)    

In [41]:
APMS = distribucion_random_modelo(G_APMS,0.05,0.2,7)

In [42]:
APMS

(4583.5, 657.5)

In [65]:
def tabla5(red,vecinos,alfa,beta,da,db):
    A = nx.adjacency_matrix(red)
    A2 = A * A
    A = A.toarray()
    A2 = A2.toarray()
    proba_acum = 0.0
    proba_acum_error = 0.0
    l = nx.number_of_nodes(red)
    i = 0
    while i < l:
        j = i + 1
        while j < l:
            enlace_ij = A[i][j]
            if enlace_ij == 0:          # no son adyacentes
                caminos_ij = A2[i][j]   #cantidad de vecinos en comun
                if caminos_ij >= vecinos:
                    ki =  list(red.degree)[i][1]
                    kj =  list(red.degree)[j][1]
                    Pei = 1-(1-beta)*(1-alfa)**ki
                    Pej = 1-(1-beta)*(1-alfa)**kj
                    pee = Pei*Pej
                    pnene = (1-Pei)*(1-Pej)
                    proba_acum+= (pee + pnene)
                    proba_acum_error+= ki*da+db +kj*da+db 
            j += 1
        i += 1
    return proba_acum, proba_acum_error

## titulo

In [66]:
tabla5(G_APMS,3,0.05,0.2,0.01,0.1)

(18993.06242250597, 0.0)

In [56]:
tabla5(G_LIT_Reguly,3,0.043,0.075)

5608.354949984928

In [57]:
tabla5(G_Y2H,1,0.018,0.17)

14164.446468052758

In [58]:
tabla5(G_LIT,3,0.088,0.23)

402.34415229789977

In [59]:
tabla5(G_APMS,1,0.05,0.2)

15323.940070759196

In [61]:
tabla5(G_APMS,5,0.05,0.2)

5360.3783073834575