Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Omic Data Analisis #1

Open
Anto9393 opened this issue May 24, 2024 · 2 comments
Open

Omic Data Analisis #1

Anto9393 opened this issue May 24, 2024 · 2 comments

Comments

@Anto9393
Copy link

Hola,
He estado siguiendo tu trabajo y el de profesor Blasco sobre la estadística Bayesiana y estoy tratando de emplear el paquete RabbitR para realizar un análisis pero me han surgido unas dudas que me gastaría resolver.
Estoy tratando de aplicar el análisis a un base de datos de proteómica, tratando de estudiar las proteínas que se expresan de forma distinta den dos grupos. Es esto posible?
Por otra parte, el análisis convencional que he aplicado es un PCA (donde se solapaban ambas elipses), PLS-DA y un análisis diferencial con pocas o ninguna diferencia al corregir con FDR.
Me gustaría que me diese tu opinión sobre el análisis y que me explicases como he de codificar los parámetros para conocer que proteínas se expresan en mayor o menor medida.

Gracias

@marinamartinezalvaro
Copy link
Owner

Hola Antolin,
Si, es posible que uses el paquete para estudiar las proteinas que se expresan de forma distinta en dos grupos. Tendras que usar un modelo que sirva para todas las proteinas, del tipo Abundnacia Proteina = Grupo + Otros efectos+ e. Acuerdate de poner Grupo como tratamiento para que te saque las salidas. Puedes darle al programa todos los caracteres de una indicandole el numero de columna en el archivo de datos con el comando pTrait. Te analizara todas las proteinas con el mismo modelo. Puedes hacerlo asi:

1)Creas tu archivo de parametros
param<-CreateParam(
file.name = "Data", #Adapatlo
na.codes=c("99999"), #Adapatlo
pTrait = c(8:800), # Pon aqui todas las columnas que contengan las abundancias de tus proteinas
hTreatment = "Grupo",
askCompare="D")

2)Ajustas el modelo y obtienes las distrib marginales posteriores
bunny_results <- Bunny(params = param, Chain = FALSE)

  1. Estimas inferencias a partir de las marginales posteriores
    inferences <- Bayes(
    params = param,
    bunny = bunny_results,
    HPD = 0.95,
    K = TRUE, # Adaptalo
    probK = 0.90, # Adaptalo
    PR = TRUE, # Adaptalo
    R = c(0.05, 1), # Aqui tendras que poner un vector con tantos valores como caracteres
    PS = TRUE, # Adaptalo
    SaveTable = TRUE, # Save detailed inferences in a CSV file)

Ten en cuenta que el paquete RabbitR no ajusta modelos multivariantes, sino modelos univariantes (repetido para cada caracter). El analisis PCA o PLSDA si tiene en cuenta la matriz de var-cov entre variables. En nuestro grupo, habitualmente hemos usado metodos multivariantes para identificar las variables mas importantes a la hora de discriminar entre grupos (con un VIP>0.8 o a 1, y un coeficiente de regresion cuyo intervalo Jack-Knife no contenga el 0), y solamente a esos, aplicarles un modelo lineal para obtener diferencias entre grupos (por ejemplo con el paquete RabbitR). Como han sido didentificadas de manera multivariante, ya ni tiene sentido aplicar el FDR. Te mando un articulo reciente donde lo hemos hecho asi: https://www.nature.com/articles/s42003-021-02784-w
Marina

@Anto9393
Copy link
Author

Anto9393 commented Jun 5, 2024 via email

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants