In [1]:
# descargar el archivo genes_to_phenotype.txt
system("wget http://purl.obolibrary.org/obo/hp/hpoa/genes_to_phenotype.txt")


In [3]:
# Leer el archivo especificando que es un archivo de texto con separador de tabulaciones
genes_pheno <- read.delim("/content/genes_to_phenotype.txt", header = TRUE, sep = "\t")


# Función que busca los genes con un HPO y también con el HPO Autosomal recessive inheritance
find_genes <- function(hpo) {
  # Filtrar los genes con el HPO especificado
  genes_hpo <- genes_pheno[genes_pheno$hpo_id == hpo, "gene_symbol"]
  
  # Filtrar los genes con el HPO Autosomal recessive inheritance
  genes_ar <- genes_pheno[genes_pheno$hpo_id == "HP:0000007", "gene_symbol"]
  
  # Encontrar los genes que están en ambos grupos
  genes_result <- intersect(genes_hpo, genes_ar)
  
  # Devolver los resultados
  return(genes_result)
}

# Ejemplo de uso
find_genes("HP:0031506") # busca los genes con el HPO "HP:0002460" y también con el HPO "HP:0000007"

In [9]:
# Leer el archivo especificando que es un archivo de texto con separador de tabulaciones
genes_pheno <- read.delim("/content/genes_to_phenotype.txt", header = TRUE, sep = "\t")

# Función que busca los genes comunes a una lista de HPOs
find_common_genes <- function(hpo_list) {
  # Filtrar los genes para cada HPO en la lista
  genes_list <- lapply(hpo_list, function(hpo) {
    genes_pheno[genes_pheno$hpo_id == hpo, "gene_symbol"]
  })
  
  # Encontrar los genes comunes a todos los conjuntos
  genes_result <- Reduce(intersect, genes_list)
  
  # Devolver los resultados
  return(genes_result)
}

# Ejemplo de uso
find_common_genes(c("HP:0031506", "HP:0000007"))


In [11]:
# Función que busca los genes comunes a una lista de HPOs y muestra los HPOs asociados a cada gen
find_common_genes <- function(hpo_list) {
  # Filtrar los genes para cada HPO en la lista
  genes_list <- lapply(hpo_list, function(hpo) {
    genes_pheno[genes_pheno$hpo_id == hpo, "gene_symbol"]
  })
  
  # Encontrar los genes comunes a todos los conjuntos
  genes_result <- Reduce(intersect, genes_list)
  
  # Crear un data frame vacío para almacenar los resultados
  result_df <- data.frame(gene_symbol = character(),
                          hpo_id = character(),
                          num_hpos = integer())
  
  # Obtener los HPOs asociados a cada gen y agregarlos al data frame de resultados
  for (gene in genes_result) {
    hpos <- genes_pheno[genes_pheno$gene_symbol == gene, "hpo_id"]
    # Eliminar los HPOs de la lista original
    hpos <- hpos[!hpos %in% hpo_list]
    # Devolver los HPOs únicos
    hpos <- unique(hpos)
    # Agregar los resultados al data frame
    result_df <- rbind(result_df, data.frame(gene_symbol = gene,
                                             hpo_id = toString(hpos),
                                             num_hpos = length(hpos)))
  }
  
  # Devolver los resultados
  return(result_df)
}


In [None]:
find_common_genes(c("HP:0031506","HP:0000007"))


gene_symbol,hpo_id,num_hpos
<chr>,<chr>,<int>
THRB,"HP:0025379, HP:0000006, HP:0025484, HP:0005978, HP:0011788, HP:0008223, HP:0010655, HP:0007018, HP:0032069, HP:0003621, HP:0004324, HP:0034189, HP:0000750, HP:0034116, HP:0011463, HP:0000853, HP:0000836, HP:0000819, HP:0033077, HP:0001518, HP:0012378, HP:0002930, HP:0002925, HP:0000365, HP:0000520",25
TSHR,"HP:0010864, HP:0003745, HP:0001270, HP:0001254, HP:0001252, HP:0001249, HP:0001265, HP:0001263, HP:0031098, HP:0025379, HP:0008872, HP:0008828, HP:0001324, HP:0000006, HP:0012188, HP:0025484, HP:0000158, HP:0025429, HP:0031219, HP:0031220, HP:0002019, HP:0005990, HP:0002014, HP:0002045, HP:0005930, HP:0008191, HP:0011788, HP:0011789, HP:0011784, HP:0011790, HP:0008249, HP:0008223, HP:0003577, HP:0100786, HP:0011968, HP:0032069, HP:0002360, HP:0002378, HP:0200028, HP:0003623, HP:0004322, HP:0005616, HP:0000752, HP:0000750, HP:0000713, HP:0011437, HP:0004491, HP:0000851, HP:0000853, HP:0000836, HP:0000821, HP:0003270, HP:0003265, HP:0000952, HP:0000969, HP:0000280, HP:0000271, HP:0030057, HP:0000239, HP:0001537, HP:0001518, HP:0001510, HP:0031507, HP:0012378, HP:0012372, HP:0006579, HP:0002925, HP:0001649, HP:0001662, HP:0001622, HP:0000520, HP:0001824",72
SECISBP2,"HP:0032210, HP:0001249, HP:0008994, HP:0002750, HP:0003391, HP:0003623, HP:0009053, HP:0004322, HP:0031903, HP:0000736, HP:0003162, HP:0000821, HP:0040214, HP:0033077, HP:0001510, HP:0001513, HP:0012379, HP:0002925, HP:0000508, HP:0012548",20
