De nombreux résultats d’expérience sont rendus disponibles lors de la publication d’articles, parfois avant. Ces jeux de données se trouvent principalement sur le dépôt FlowRepository. On en trouve aussi sur CytoBank ou sur un site propre aux auteurs de l’article.

Le groupe de MD Robinson a effectué une comparaison de différents logiciels sur un éventail large de jeux de données (Weber et al., 2016) et a publié un pipeline d’analyse (Nowicka et al., 2017). Ces travaux constituent un très bon point de départ en 2018. Les données utilisées éprouvent la capacité des méthodes à identifier les populations cellulaires (Weber et al., 2016) et permettent d’évaluer l’analyse différentielle (Nowicka et al., 2017).

Le panel OMIP-044 à 28 couleurs permet une définition très fine des populations cellulaires. Les données sont très documentées et permettent d’évaluer la capacité identifier très finement des populations.

Weber

L. Weber (Weber et al., 2016) présente une comparaison sur un éventail de données plus large que l’article de Nat Methods (Aghaeepour et al., 2013). Les données Levine 32Dim et Levine 13Dim permettent d’évaluer la capacité des méthodes à identifier des populations variées. Ces données sont accompagnées d’une identification manuelles, ce qui permet de quantifier les aptitudes des différentes méthodes. Les données Nilsson_rare et Mossman_rare permettent d’évaluer la capacité à détecter des populations rares, bien qu’il existe des populations faiblement exprimées dans les jeux Levine. Le détail de ces données se trouve plus loin dans ce texte.

De plus, Weber conclue à un classement différent des méthodes, parce que le score global est calculé différemment. Le score F1 utilisé dans les 2 méthodes est compromis entre la capacité à regrouper à juste titre (spécificité) les cellules qui sont similaires et l’aptitude à en trouver le plus (sensibilité) dans l’ensemble de l’échantillon. Cependant, le score final de Weber est établi sur les populations (moyenne du score de chaque population) alors que le score de Aghaeepour est établi sur les cellules, le score des populations les plus abondantes étant donc prépondérant. Le score de Weber est donc plus pertinent et tient compte des populations de faible abondance. On retrouve cette critique de l’évaluation de la méthode densityCut.

Les données utilisées sont disponibles dans un dépôt sur FlowRepository (repository FR-FCM-ZZPH). Les codes R sont disponibles intégralement sur le dépôt Github de Weber. C’est une source fantastique pour écrire un pipeline à partir de l’une de ces méthodes.

Keywords: [high-dimensional cytometry] [cell clustering] [detection ability]

Dataset FR-FCM-ZZPH R code Weber’s Github Article Weber et al., 2016

Nowicka

L’article de Nowicka et al. présente un pipeline basé sur les packages R et adapté à la cytométrie de masse. Hormis les premières étapes de contrôle qualité et de transformation, le pipeline est directement utilisable pour la cytométrie de flux. Le jeu de données d’illustration est un sous-ensemble de l’étude de Bodenmiller et al., 2012, étude qui est utilisée aussi pour l’article de citrus (Bruggner et al., 2014). L’étude originale porte sur des peripheral blood mononuclear cells (PBMCs) de 8 donneurs sains en condition non stimulée et avec 11 stimulations différentes. Le panel comporte 10 marqueurs de surface et 14 markers de signalisation. L’article de Nowicka se concentre sur la condition non stimulée et la stimulation de cross-link BCR/FcR-XL, soit 16 échantillons. Ces 16 fichiers FCS sont disponibles directement sur le site dédié l’article avec des annotations complémentaires. Dans ces articles, les 10 marqueurs sont utilisés pour identifier les populations cellulaires. Ces populations sont ensuite étudiées dans une approche différentielle sur les 14 marqueurs fonctionnels pour déterminer les différences entre les conditions non stimulée et BCR/FcR-XL.

L. Weber a également effectué des tutoriels d’initiation en 2017 sur ce pipeline et ces données. On trouvera ainsi des codes et des données sur CyTOF-workshop-2017-07-10 et CyTOF-workshop-2017-03-13. Les données sont également disponibles au travers du package HDCytoData et une vignette donne un exemple d’utilisation.

Keywords: [human PBMCs] [high-dimensional cytometry] [cell clustering] [differential analysis]

Dataset cytoWorkflow R code CyTOF-example-data Article Nowicka et al.

OMIP044

Florian Mair au Fred Hutchinson Cancer Research Center a mis au point un panel de 28 couleurs en cytométrie de flux afin de phénotyper de façon détaillée les cellules présentatrices d’antigènes chez l’homme. Les détails de ce panel, la titration et les contrôles sont détaillés dans l’article de Cytometry (Mair et al, 2018) et dans les suppléments.

Les fichiers disponibles au téléchargement comportent les 28 contrôles FCS pour établir la compensation, 6 marquages Full-Minus-One et 2 échantillons typiques. Un fichier PDF documente les stratégies de gating.

L’échantillon a également été analysé avec tSNE et les populations sont identifiables.

Keywords: [Immunophenotyping] [human PBMCs] [dendritic cells] [high-dimensional cytometry] [antigen-presenting cells] [myeloid cells] [human tissue]

Dataset FR-FCM-ZYC2 Article Mair et al.

MC38 Checkpoint Blockade

Comprehensively profile tumor infiltrating T cells and identify checkpoint blockade responsive T cell subsets by mass cytometry, Individual tumor infiltrates were analyzed by mass cytometry. TIL samples were barcoded and acquired simultaneously. Nat Immunol, FR-FCM-ZY69 FR-FCM-ZY6A

Autres jeux

Ward J.: High-Dimensional Analysis Delineates Myeloid and Lymphoid Compartment Remodeling during Successful Immune-Checkpoint Cancer Therapy. Cell 2018. 3 datasets: A/ T3 checkpoint therapy x 5 replicates. Tumor infiltrates from T3 tumor on day 11 after injection were analyzed by mass cytometry. TIL samples were barcoded and acquired simultaneously. FR-FCM-ZYPM B/ T3 checkpoint therapy: anti-IFNg timecourse. FR-FCM-ZYPX C/ T3 checkpoint therapy: timecourse, day 5-12 . FR-FCM-ZYPN

Cytosplore datasets: Mass Cytometry of the Human Mucosal Immune System Identifies Tissue- and Disease-Associated Immune Subsets. Immunity 2016, Nature Comm 2017, FR-FCM-ZYRM

Kimball: A Beginner’s Guide To Analyzing and Visualizing Mass Cytometry Data. J. Immunol. 2018, PMC, FR-FCM-ZYPM

OMIP-047: High-dimensional phenotypic characterization of B cells (Fortessa). Cytometry A 2018, FR-FCM-ZYPM

PACMAN datasets: these are simulated datasets from an hypercube of dimensions ranging from 5 to 50. Datasets are available on Cytobank community which required setting up a free account. CRAN PACMAN. Nolan Lab, Li YH et al, PLOS Computational Biology 2017, .

Bystander CD8+ T cells in human tumor infiltrates: not all tumor-infiltrating T cells are specific for tumour antigens, and suggest that measuring CD39 expression could be a straightforward way to quantify or isolate bystander T cells. Newell Lab, Simoni et al, Nature 2018, FR-FCM-ZYWM

Comparison of human and non-human primate innate myeloid immune system: in depth comparative phenotyping of blood innate myeloid leukocytes from healthy humans and macaques using mass cytometry. Cytometry A 2017, FR-FCM-ZZQQ

Human Innate Lymphoid Cell Subsets: importance of innate lymphoid cells (ILCs) in multiple immune responses. 2017, FR-FCM-ZYZX

Human Mucosal Immune System: Mass Cytometry of the Human Mucosal Immune System Identifies Tissue- and Disease-Associated Immune Subsets. Immunity 2017,

A High-Dimensional Atlas of Human T Cell Diversity Reveals Tissue-Specific Trafficking and Cytokine Signatures: Analysis of lymphocyte composition across human tissues using two mass cytometry panels. 8 tissues with various numbers of donor samples for each. Two mass cytometry panels: 1. Traffic: focusing on trafficking receptors (unstimulated) 2. Function: focusing on intracellular cytokines (all samples PMA+Iono stimulated). Immunity 2016, FR-FCM-ZZTM

OMIP-018: Phenotyping with Chemokine Receptors, identification of CD4 T cell subsets with Chemokine Receptors, expression of all combinations of many different chemokine receptors in T naive, T stem cell memory, T central memory and T effector memory subsets FR-FCM-ZZ36

OMIP-037: 16-color panel to measure inhibitory receptor signatures from multiple human immune cell subsets, combinational inhibitory receptor expression (“IR signatures”) of CD4+ T cells, CD8+ T cells, Natural Killer (NK) cells, invariant Natural Killer T (iNKT) cells, and gamma delta (γδ) T cells from individual human samples. The inhibitory receptors measured are PD-1, TIM-3, CD160, LAG-3, and TIGIT. The activation marker CD137 (4-1BB) is also included in the panel, as is IL-7Rα (CD127). This panel works well with cryopreserved PBMC from healthy and HIV-infected individuals well as fresh tumor specimens. For optimum performance of this panel with digested tumor specimens, the pan-lymphocyte marker CD45 is included (swapped for LAG-3), pubmed, FR-FCM-ZZSC

OMIP-036: Coinhibitory Receptors, Cytometry, FR-FCM-ZZQP
NB: énorme dépôt de fichiers FCS avec les titrations, les compensations et d’autres contrôles.

Blood samples depleted by a particular cell population: Generation of blood samples, which are characterized by the absence of particular cell types, such as (1) monocytes (CD14-MACS), (2) granulocytes (CD15-MACS), (3) T lymphocytes (CD3-MACS), (4) T helper lymphocytes (CD4-MACS) or (5) B lymphocytes (CD19-MACS). These reference samples done as triplicate were used to validate the ImmunoClust algorithm.
Sorensen et al, 2015 FR-FCM-ZZWB

Levine13 is a 13-dimensional mass cytometry (CyTOF) data set, consisting of expression levels of 13 surface marker proteins. Cluster labels are available for 24 manually gated cell populations. Cells are healthy human bone marrow mononuclear cells (BMMCs), from 1 individual.
Source: “benchmark data set 1” in the following paper: Levine et al. (2015), “Data-Driven Phenotypic Dissection of AML Reveals Progenitor-like
Cells that Correlate with Prognosis”, Cell, 162, 184-197. Weber’s R script

Levine32 is a 32-dimensional mass cytometry (CyTOF) data set, consisting of expression levels of 32 surface marker proteins. Cluster labels are available for 14 manually gated cell populations. Cells are healthy human bone marrow mononuclear cells (BMMCs), from 2 individuals.
Source: “benchmark data set 2” in the following paper: Levine et al. (2015), “Data-Driven Phenotypic Dissection of AML Reveals Progenitor-like# Cells that Correlate with Prognosis”, Cell, 162, 184-197. Weber’s R script

Mosmann_rare is a 14-dimensional flow cytometry data set containing a rare population of live activated (cytokine-producing) memory CD4 T cells, from healthy human peripheral blood mononuclear cells (PBMCs) exposed to influenza antigens.
Source: Figure 4 in the following paper: Mosmann et al. (2014), “SWIFT — Scalable Clustering for Automated Identification of Rare Cell Populations in Large, High-Dimensional Flow Cytometry Datasets, Part 2: Biological Evaluation”, Cytometry Part A, 85A, 422-433.
Weber’s R script

Nilsson_rare is a 13-dimensional flow cytometry data set containing several cell populations, including a rare population of hematopoietic stem cells (HSCs).
Source: Figure 2 in the following paper: Nilsson et al. (2013), “Frequency Determination of Rare Populations by Flow Cytometry: A Hematopoietic Stem Cell Perspective”, Cytometry Part A, 83A, 721-727.
Weber’s R script

Samusik is a 39-dimensional mass cytometry (CyTOF) data set, consisting of 10 replicate bone marrow samples from C57BL/6J mice (samples from 10 different mice). Samusik_01 to Samusik_10 contain data from each sample individually, and Samusik_all contains data from all 10 samples. Dimensions are 39 cell-surface markers and transcription factors; manually gated cell population labels are available for 24 immune cell populations.
Source: Samusik et al. (2016), “Automated mapping of phenotype space with single-cell data”, Nature Methods, 13(6).
Weber’s R script

NextDataset
script