In [None]:
https://satijalab.org/seurat/articles/seurat5_integration

Seurat v5 propose une analyse int√©grative simplifi√©e via la fonction IntegrateLayers() qui facilite l‚Äôint√©gration de plusieurs jeux de donn√©es de mani√®re coh√©rente, en s‚Äôassurant que les cellules partag√©es entre les lots sont int√©gr√©es dans un espace de faible dimension. Ce processus est utile lorsqu‚Äôon travaille avec plusieurs jeux de donn√©es (par exemple, issus de diff√©rentes exp√©riences ou traitements) et qu‚Äôon souhaite analyser les cellules communes entre les lots.

Voici une explication des diff√©rentes m√©thodes d‚Äôint√©gration disponibles dans IntegrateLayers() :

1Ô∏è‚É£ CCAIntegration (Canonical Correlation Analysis)
	‚Ä¢	Fonctionnement :
CCA est une m√©thode classique d‚Äôint√©gration qui trouve les relations lin√©aires entre les variables de deux ensembles de donn√©es. Elle est bas√©e sur l‚Äôid√©e que les cellules partag√©es entre les lots doivent avoir des profils d‚Äôexpression similaires. CCA optimise l‚Äôalignement entre ces ensembles de donn√©es pour les int√©grer dans un espace de faible dimension.
	‚Ä¢	Quand l‚Äôutiliser :
Utile pour des donn√©es de transcription (scRNA-seq) provenant de diff√©rents lots ou conditions, lorsque l‚Äôon s‚Äôattend √† ce que les relations entre les variables (g√®nes) soient lin√©aires.

2Ô∏è‚É£ RPCAIntegration (Regularized Principal Component Analysis)
	‚Ä¢	Fonctionnement :
RPCA est une extension de l‚Äôanalyse en composantes principales (PCA) qui applique une r√©gularisation pour mieux g√©rer les variations inter-lots tout en conservant les structures sous-jacentes communes. Elle permet de r√©duire la variance non d√©sir√©e entre les diff√©rents jeux de donn√©es tout en extrayant des composantes principales partag√©es.
	‚Ä¢	Quand l‚Äôutiliser :
Pratique lorsque les jeux de donn√©es ont des structures complexes ou des bruits, mais que vous voulez toujours int√©grer les informations dans un espace r√©duit tout en r√©duisant les effets du batch.

3Ô∏è‚É£ HarmonyIntegration (Harmony)
	‚Ä¢	Fonctionnement :
Harmony est une m√©thode d‚Äôint√©gration plus r√©cente qui ajuste les scores des composantes principales (PCs) de mani√®re √† corriger les effets de batch tout en maintenant les relations biologiques entre les cellules. Harmony ajuste progressivement les composantes principales en fonction des variations de batch tout en pr√©servant les structures biologiques communes.
	‚Ä¢	Quand l‚Äôutiliser :
Id√©al pour les donn√©es de scRNA-seq provenant de plusieurs lots ou de diff√©rentes sources, car elle corrige efficacement les effets de batch tout en permettant une int√©gration biologique coh√©rente.

4Ô∏è‚É£ FastMNNIntegration (Fast Mutual Nearest Neighbors)
	‚Ä¢	Fonctionnement :
FastMNN est une approche rapide qui repose sur l‚Äôidentification des plus proches voisins mutuels (MNN) entre diff√©rents jeux de donn√©es. Elle est plus rapide que les autres m√©thodes d‚Äôint√©gration bas√©es sur l‚Äôoptimisation de matrices, et elle est con√ßue pour int√©grer des jeux de donn√©es volumineux tout en tenant compte des relations locales entre les cellules.
	‚Ä¢	Quand l‚Äôutiliser :
Pratique pour les jeux de donn√©es volumineux o√π il est essentiel de corriger rapidement les effets de batch tout en gardant une structure biologique fine.

5Ô∏è‚É£ scVIIntegration (scVI)
	‚Ä¢	Fonctionnement :
scVI utilise des mod√®les variational autoencoders (VAE) pour mod√©liser les donn√©es de scRNA-seq sous forme probabiliste. Cette m√©thode permet une int√©gration robuste, m√™me avec des donn√©es bruyantes, en apprenant une repr√©sentation latente des donn√©es. Elle corrige automatiquement les variations de batch et pr√©serve les structures biologiques sous-jacentes.
	‚Ä¢	Quand l‚Äôutiliser :
√Ä utiliser lorsque vous travaillez avec des donn√©es de scRNA-seq complexes et que vous souhaitez une int√©gration robuste qui tient compte des relations probabilistes sous-jacentes des donn√©es.

‚∏ª

Exemple d‚Äôutilisation :

Voici comment tu peux utiliser IntegrateLayers() avec l‚Äôune de ces m√©thodes :

integrated_object <- IntegrateLayers(
  object = your_seurat_object, 
  method = "HarmonyIntegration", 
  features = VariableFeatures(your_seurat_object), 
  dims = 1:20, 
  verbose = TRUE
)

	‚Ä¢	method : Choisis l‚Äôune des m√©thodes d‚Äôint√©gration disponibles : "CCAIntegration", "RPCAIntegration", "HarmonyIntegration", "FastMNNIntegration", "scVIIntegration".
	‚Ä¢	features : Utilise les g√®nes les plus variables (ou toute autre liste de g√®nes) pour l‚Äôint√©gration.
	‚Ä¢	dims : Choisis le nombre de dimensions principales √† utiliser pour l‚Äôint√©gration (par exemple, 1:20).

Cela va cr√©er un objet Seurat int√©gr√© avec une r√©duction dimensionnelle ajust√©e pour int√©grer les donn√©es provenant de diff√©rents lots ou exp√©riences.

Enfin, les utilisateurs peuvent √©galement effectuer une int√©gration √† l'aide de donn√©es normalis√©es par sctransform (voir notre vignette SCTransform pour plus d'informations), en ex√©cutant d'abord la normalisation SCTransform, puis en d√©finissant l' normalization.methodargument dans IntegrateLayers.

L‚Äôint√©gration avec des donn√©es normalis√©es par SCTransform dans Seurat permet de tirer parti de la normalisation avanc√©e qui corrige √† la fois les biais techniques et les effets de batch tout en pr√©servant les caract√©ristiques biologiques des donn√©es. Cette approche est particuli√®rement utile pour les donn√©es de scRNA-seq, car elle permet d‚Äôint√©grer de mani√®re plus robuste les donn√©es provenant de diff√©rents lots ou conditions exp√©rimentales.

√âtapes d‚Äôint√©gration avec SCTransform :
	1.	Normalisation SCTransform
Avant d‚Äôint√©grer les donn√©es, tu normalises chaque jeu de donn√©es en utilisant SCTransform(). Cette m√©thode ajuste les donn√©es de comptage brutes en prenant en compte les biais techniques comme la taille de la biblioth√®que, les effets de batch et d‚Äôautres facteurs confondants. Elle effectue une transformation bas√©e sur une r√©gression, et applique une normalisation en utilisant un mod√®le de distribution de type negative binomial.
Exemple de normalisation avec SCTransform :

# Appliquer SCTransform pour chaque objet Seurat
object <- SCTransform(object, verbose = FALSE)


	2.	Utilisation de IntegrateLayers avec SCTransform
Apr√®s avoir effectu√© la normalisation SCTransform, tu peux utiliser la fonction IntegrateLayers() pour int√©grer ces donn√©es normalis√©es entre plusieurs lots ou exp√©riences. Le param√®tre normalization.method permet de sp√©cifier que les donn√©es normalis√©es par SCTransform doivent √™tre utilis√©es pour l‚Äôint√©gration.

Exemple d‚Äôusage avec SCTransform et IntegrateLayers :

# Normaliser les objets Seurat avec SCTransform
object1 <- SCTransform(object1, verbose = FALSE)
object2 <- SCTransform(object2, verbose = FALSE)

# Int√©grer les objets apr√®s SCTransform
integrated_object <- IntegrateLayers(
  object = list(object1, object2), 
  normalization.method = "SCT",   # Sp√©cifier que SCTransform est utilis√©
  method = "HarmonyIntegration",   # Choisir la m√©thode d'int√©gration (par exemple Harmony)
  features = VariableFeatures(object1), 
  dims = 1:20, 
  verbose = TRUE
)

Explication des param√®tres utilis√©s :
	‚Ä¢	normalization.method = "SCT" : Ce param√®tre indique que l‚Äôint√©gration se fait sur des donn√©es qui ont √©t√© normalis√©es avec SCTransform. Cela permet √† Seurat de g√©rer correctement les effets techniques et les variations entre les lots avant l‚Äôint√©gration.
	‚Ä¢	method = "HarmonyIntegration" : C‚Äôest la m√©thode d‚Äôint√©gration choisie. Ici, on utilise Harmony, mais tu peux aussi utiliser CCA, RPCA, etc.
	‚Ä¢	features = VariableFeatures(object1) : Cette fonction permet de s√©lectionner les g√®nes les plus variables de ton objet Seurat pour l‚Äôint√©gration.
	‚Ä¢	dims = 1:20 : Ce param√®tre sp√©cifie les premi√®res dimensions principales √† utiliser pour l‚Äôint√©gration (par exemple, les 20 premi√®res composantes principales).

Pourquoi utiliser SCTransform pour l‚Äôint√©gration ?

L‚Äôutilisation de SCTransform avant l‚Äôint√©gration a plusieurs avantages :
	‚Ä¢	Correction des effets techniques : SCTransform ajuste les donn√©es pour √©liminer les effets ind√©sirables li√©s √† la taille de la biblioth√®que ou aux variations techniques.
	‚Ä¢	Am√©lioration de la robustesse : La normalisation SCTransform am√©liore la d√©tection des relations biologiques sous-jacentes tout en r√©duisant le bruit.
	‚Ä¢	Pr√©cision de l‚Äôint√©gration : Lorsque les donn√©es sont normalis√©es via SCTransform, l‚Äôint√©gration devient plus pr√©cise, surtout quand il y a des variations importantes entre les lots ou conditions exp√©rimentales.

Conclusion :

Lorsque tu as plusieurs jeux de donn√©es de scRNA-seq provenant de diff√©rents lots ou conditions, tu peux d‚Äôabord normaliser chaque jeu de donn√©es avec SCTransform, puis utiliser IntegrateLayers() avec l‚Äôargument normalization.method = "SCT" pour int√©grer ces donn√©es de mani√®re robuste tout en corrigeant les effets de batch. Cela permet d‚Äôaligner les donn√©es tout en pr√©servant les caract√©ristiques biologiques communes entre les jeux de donn√©es.

Avec Seurat v5, l‚Äôint√©gration de donn√©es normalis√©es par SCTransform a √©t√© simplifi√©e gr√¢ce √† l‚Äôutilisation de IntegrateLayers(). Ce processus est particuli√®rement puissant pour g√©rer les effets de batch et int√©grer des jeux de donn√©es provenant de diff√©rentes sources tout en pr√©servant les structures biologiques communes.

Voici comment fonctionne cette int√©gration dans Seurat v5 :

√âtapes pour int√©grer des donn√©es normalis√©es avec SCTransform dans Seurat v5

1. Normalisation avec SCTransform

Avant d‚Äôeffectuer l‚Äôint√©gration, tu dois d‚Äôabord normaliser chaque objet Seurat avec la fonction SCTransform(). Cela permet de corriger les effets techniques (comme la taille de la biblioth√®que ou la variabilit√© entre les lots) tout en conservant les informations biologiques importantes.

Exemple de normalisation avec SCTransform :

# Appliquer SCTransform √† chaque objet Seurat
object1 <- SCTransform(object1, verbose = FALSE)
object2 <- SCTransform(object2, verbose = FALSE)

2. Utilisation de IntegrateLayers avec SCTransform

Une fois les donn√©es normalis√©es par SCTransform, tu peux utiliser IntegrateLayers() pour int√©grer ces jeux de donn√©es tout en sp√©cifiant que l‚Äôint√©gration se fait sur des donn√©es SCTransform.

Dans Seurat v5, tu dois sp√©cifier l‚Äôoption normalization.method = "SCT" dans IntegrateLayers() pour indiquer que l‚Äôint√©gration se fait sur des donn√©es normalis√©es via SCTransform.

Exemple d‚Äôint√©gration apr√®s normalisation SCTransform :

# Int√©gration des objets apr√®s SCTransform
integrated_object <- IntegrateLayers(
  object = list(object1, object2),         # Liste des objets Seurat √† int√©grer
  normalization.method = "SCT",            # Indiquer que SCTransform a √©t√© utilis√©
  method = "HarmonyIntegration",           # Choisir la m√©thode d'int√©gration (ex: Harmony)
  features = VariableFeatures(object1),    # G√®nes les plus variables √† utiliser pour l'int√©gration
  dims = 1:20,                            # Dimensions principales √† utiliser pour l'int√©gration
  verbose = TRUE                           # Affichage de la progression
)

Explication des principaux arguments dans IntegrateLayers :
	‚Ä¢	object = list(object1, object2) : La liste des objets Seurat √† int√©grer. Tu peux ajouter autant d‚Äôobjets que n√©cessaire (par exemple, deux objets provenant de diff√©rents lots ou conditions exp√©rimentales).
	‚Ä¢	normalization.method = "SCT" : Cet argument sp√©cifie que les objets ont √©t√© normalis√©s avec SCTransform. Cela permet √† Seurat de g√©rer correctement les donn√©es et d‚Äôeffectuer une int√©gration bas√©e sur ces donn√©es normalis√©es.
	‚Ä¢	method = "HarmonyIntegration" : Ici, on utilise la m√©thode Harmony pour l‚Äôint√©gration. Tu peux aussi utiliser d‚Äôautres m√©thodes comme CCA, RPCA, etc., selon tes besoins.
	‚Ä¢	features = VariableFeatures(object1) : Cela permet de sp√©cifier quels g√®nes utiliser pour l‚Äôint√©gration. En g√©n√©ral, on utilise les g√®nes les plus variables entre les diff√©rents lots pour obtenir une meilleure int√©gration.
	‚Ä¢	dims = 1:20 : Ce param√®tre s√©lectionne les 20 premi√®res composantes principales √† utiliser pour l‚Äôint√©gration. En g√©n√©ral, tu veux utiliser les dimensions les plus informatives.
	‚Ä¢	verbose = TRUE : Affiche une barre de progression pour suivre l‚Äôavancement de l‚Äôint√©gration.

Avantages de l‚Äôint√©gration avec SCTransform :
	‚Ä¢	Correction des effets de batch : SCTransform applique une normalisation avanc√©e qui permet de r√©duire les variations dues aux effets techniques (comme la taille de la biblioth√®que ou les diff√©rences entre les lots).
	‚Ä¢	Am√©lioration des r√©sultats d‚Äôint√©gration : En utilisant SCTransform, tu t‚Äôassures que l‚Äôint√©gration se fait sur des donn√©es d√©j√† corrig√©es pour les biais techniques, ce qui am√©liore la qualit√© de l‚Äôint√©gration et des r√©sultats finaux.
	‚Ä¢	R√©duction du bruit : SCTransform aide √©galement √† r√©duire le bruit dans les donn√©es de scRNA-seq, ce qui rend l‚Äôint√©gration plus robuste et pr√©cise.

Conclusion

Avec Seurat v5, l‚Äôint√©gration de donn√©es apr√®s normalisation SCTransform est simplifi√©e gr√¢ce √† IntegrateLayers(), en sp√©cifiant normalization.method = "SCT". Cette approche permet de corriger efficacement les effets de batch tout en pr√©servant les structures biologiques importantes, rendant l‚Äôanalyse plus robuste et fiable, surtout lorsque les jeux de donn√©es proviennent de diff√©rentes conditions exp√©rimentales ou lots.

In [None]:
Explication de la gestion des couches (layers) et de la fusion d‚Äôobjets dans Seurat v5

Seurat v5 introduit une nouvelle approche pour g√©rer les √©chantillons multiples dans un seul objet Seurat √† l‚Äôaide des couches (layers). Cette approche simplifie l‚Äôint√©gration et l‚Äôanalyse multi-√©chantillons.

‚∏ª

üîπ 1. Utilisation des couches (Layers) pour g√©rer plusieurs √©chantillons

Dans Seurat v5, il est possible de s√©parer un objet en diff√©rentes couches en fonction d‚Äôune variable de m√©tadonn√©es, tout en conservant les donn√©es d‚Äôexpression dans un seul objet.

üìå Pourquoi utiliser les couches ?

‚úÖ Permet de garder tous les √©chantillons dans un seul objet Seurat, tout en les s√©parant pour une analyse comparative.
‚úÖ Simplifie le workflow d‚Äôint√©gration car les couches peuvent √™tre directement int√©gr√©es.
‚úÖ Permet de fusionner les couches apr√®s l‚Äôint√©gration pour retrouver un objet unique.

üìç Exemple d‚Äôutilisation

‚û§ Diviser un objet en couches selon une condition exp√©rimentale (stim)

# S√©parer l'assay "RNA" en couches bas√©es sur la condition de stimulation ("stim")
ifnb[["RNA"]] <- split(ifnb[["RNA"]], f = ifnb$stim)

# V√©rifier les couches disponibles
Layers(ifnb)

üëâ Ici, l‚Äôobjet Seurat ifnb contient maintenant plusieurs couches : une pour chaque valeur unique de stim (ex. CTRL et STIM).

‚û§ Fusionner les couches apr√®s int√©gration

# R√©unir les couches en un seul objet
ifnb <- JoinLayers(ifnb)

üëâ Cette commande reconstitue l‚Äôobjet original en fusionnant toutes les couches.

‚∏ª

üîπ 2. Diviser un objet en plusieurs objets (SplitObject)

Une alternative aux couches consiste √† diviser un objet Seurat en plusieurs objets distincts, bas√©s sur une colonne des m√©tadonn√©es.

üìç Exemple d‚Äôutilisation

# Diviser l'objet Seurat en une liste de plusieurs objets selon la condition "stim"
ifnb_list <- SplitObject(ifnb, split.by = "stim")

# Acc√©der aux objets s√©par√©s
ifnb_list$CTRL  # Objet contenant uniquement les cellules "CTRL"
ifnb_list$STIM  # Objet contenant uniquement les cellules "STIM"

üëâ Chaque √©l√©ment de ifnb_list est un objet Seurat distinct, contenant uniquement les cellules d‚Äôune condition donn√©e.

‚∏ª

üîπ 3. Fusionner plusieurs objets Seurat (sans int√©gration)

Si l‚Äôon veut fusionner plusieurs objets Seurat sans effectuer d‚Äôint√©gration, Seurat v5 permet de les fusionner dans un m√™me objet, tout en conservant l‚Äôinformation dans des couches s√©par√©es.

üìç Exemple d‚Äôutilisation

# Fusionner deux objets Seurat (CTRL et STIM)
merged_obj <- merge(x = ifnb_list$CTRL, y = ifnb_list$STIM)

# R√©unir les couches apr√®s la fusion
merged_obj[["RNA"]] <- JoinLayers(merged_obj)

üëâ La fusion regroupe les donn√©es dans un m√™me objet, mais garde les √©chantillons sous forme de couches distinctes, sauf si on utilise JoinLayers() pour tout rassembler.

‚∏ª

üîπ 4. Fusionner plusieurs objets avec int√©gration

Si on souhaite int√©grer plusieurs objets pour corriger les effets de batch, on doit d‚Äôabord normaliser les donn√©es, identifier les features variables, et ex√©cuter une int√©gration avant de fusionner les couches.

üìç Exemple d‚Äôint√©gration avec RPCAIntegration

# Fusionner les objets
merged_obj <- merge(x = ifnb_list$CTRL, y = ifnb_list$STIM)

# Pr√©-traitement
merged_obj <- NormalizeData(merged_obj)
merged_obj <- FindVariableFeatures(merged_obj)
merged_obj <- ScaleData(merged_obj)
merged_obj <- RunPCA(merged_obj)

# Int√©gration des couches avec RPCA
merged_obj <- IntegrateLayers(object = merged_obj, 
                              method = RPCAIntegration, 
                              orig.reduction = "pca", 
                              new.reduction = "integrated.rpca",
                              verbose = FALSE)

# R√©unir les couches apr√®s l'int√©gration
merged_obj[["RNA"]] <- JoinLayers(merged_obj)

üëâ Ce workflow permet d‚Äôint√©grer plusieurs √©chantillons tout en corrigeant les effets de batch.

‚∏ª

R√©sum√© üìå

M√©thode	Objectif	Commande principale
Diviser un objet en couches (Layers)	G√©rer plusieurs √©chantillons dans un seul objet	split(ifnb[["RNA"]], f = ifnb$stim)
Fusionner les couches	R√©unir toutes les couches en un seul objet	JoinLayers(ifnb)
Diviser un objet en plusieurs objets (SplitObject)	Cr√©er une liste d‚Äôobjets Seurat distincts	SplitObject(ifnb, split.by = "stim")
Fusionner plusieurs objets sans int√©gration	Combiner plusieurs objets en un seul sans correction de batch	merge(x = obj1, y = obj2)
Fusionner plusieurs objets avec int√©gration	Int√©grer plusieurs objets avec correction de batch	IntegrateLayers(object, method = RPCAIntegration)



‚∏ª

Quand utiliser quelle m√©thode ?

üîπ Si tu veux travailler avec plusieurs √©chantillons sans les s√©parer totalement, utilise les couches (Layers).
üîπ Si tu veux analyser les √©chantillons s√©par√©ment, utilise SplitObject() pour cr√©er des objets distincts.
üîπ Si tu veux fusionner des objets sans correction de batch, utilise merge() et JoinLayers().
üîπ Si tu veux corriger les effets de batch avant fusion, utilise IntegrateLayers() avec une m√©thode d‚Äôint√©gration.

Cette approche permet une gestion plus flexible et efficace des donn√©es multi-√©chantillons dans Seurat v5 üöÄ.